Stereo Vision(立體視覺)是計算機視覺的一項技術,通過使用兩個或多個相機從不同視角拍攝同一場景,從二維圖像中計算出三維空間資訊。
原理
- 類似人類雙眼視覺,利用左右兩張略有視差的影像,計算對應點的位移(視差disparity)。 視差越大,物體越接近相機;視差越小,物體越遠。 透過攝影機內參及外參(位置關係)和視差資料,利用三角測量(triangulation)計算出物體的深度距離。
流程
- 圖像校正(Rectification):消除鏡頭失真,使兩圖像在同一參考平面上。 特徵匹配(Correspondence Matching):尋找左右影像中相同物體點的對應像素。 視差計算(Disparity Calculation):計算對應點間的水平位移。 深度重建(Depth Reconstruction):根據視差和攝影機幾何參數還原場景三維深度。
應用
- 自動駕駛輔助系統(ADAS)與機器人導航,進行環境感知。 3D攝影與立體顯示。 無人機和遙感圖像的三維重建。 工業檢測與安防監控。
總結,Stereo Vision是模擬人類雙眼感知深度的技術,通過多視角圖像分析重建3D場景,為機器提供立體空間感知能力。