Stereo Vision(立體視覺)

更新於 發佈於 閱讀時間約 2 分鐘

Stereo Vision(立體視覺)是計算機視覺的一項技術,通過使用兩個或多個相機從不同視角拍攝同一場景,從二維圖像中計算出三維空間資訊。

原理

  • 類似人類雙眼視覺,利用左右兩張略有視差的影像,計算對應點的位移(視差disparity)。 視差越大,物體越接近相機;視差越小,物體越遠。 透過攝影機內參及外參(位置關係)和視差資料,利用三角測量(triangulation)計算出物體的深度距離。

流程

  1. 圖像校正(Rectification):消除鏡頭失真,使兩圖像在同一參考平面上。 特徵匹配(Correspondence Matching):尋找左右影像中相同物體點的對應像素。 視差計算(Disparity Calculation):計算對應點間的水平位移。 深度重建(Depth Reconstruction):根據視差和攝影機幾何參數還原場景三維深度。

應用

  • 自動駕駛輔助系統(ADAS)與機器人導航,進行環境感知。 3D攝影與立體顯示。 無人機和遙感圖像的三維重建。 工業檢測與安防監控。

總結,Stereo Vision是模擬人類雙眼感知深度的技術,通過多視角圖像分析重建3D場景,為機器提供立體空間感知能力。

留言
avatar-img
留言分享你的想法!
avatar-img
郝信華 iPAS AI應用規劃師 學習筆記
17會員
455內容數
現職 : 富邦建設資訊副理 證照:經濟部 iPAS AI應用規劃師 AWS Certified AI Practitioner (AIF-C01)
2025/08/27
Activation Function(激活函數)是神經網絡中的一個數學函數,其作用是將神經元的輸入信號轉換成輸出信號。激活函數決定了神經元是否「激活」並將訊號傳遞給下一層。 主要用途 引入非線性:激活函數將線性組合的輸入轉換為非線性輸出,使得神經網絡可以學習複雜的資料模式與非線性關係。 控制訊
2025/08/27
Activation Function(激活函數)是神經網絡中的一個數學函數,其作用是將神經元的輸入信號轉換成輸出信號。激活函數決定了神經元是否「激活」並將訊號傳遞給下一層。 主要用途 引入非線性:激活函數將線性組合的輸入轉換為非線性輸出,使得神經網絡可以學習複雜的資料模式與非線性關係。 控制訊
2025/08/27
Semantic Segmentation(語義分割)是計算機視覺領域中的一項技術,目的是將圖像中的每一個像素賦予特定的語義標籤,從而理解圖像中的不同物體或區域。 主要概念 對圖像每個像素分類,使其屬於預定義的類別(例如:人、車、道路、天空等)。 不區分同一類別的不同實例,只區分語義類別。 產生
2025/08/27
Semantic Segmentation(語義分割)是計算機視覺領域中的一項技術,目的是將圖像中的每一個像素賦予特定的語義標籤,從而理解圖像中的不同物體或區域。 主要概念 對圖像每個像素分類,使其屬於預定義的類別(例如:人、車、道路、天空等)。 不區分同一類別的不同實例,只區分語義類別。 產生
2025/08/27
Instance Segmentation(實例分割)是一種先進的計算機視覺技術,它不僅識別圖像中的物體,還精確區分並標註每個物體的像素級邊界。 主要特點 每個物體獨立分割:對圖像中同一類的多個物體進行區分,分別賦予不同的實例ID,與傳統的物體檢測(bounding box)或語義分割(sema
2025/08/27
Instance Segmentation(實例分割)是一種先進的計算機視覺技術,它不僅識別圖像中的物體,還精確區分並標註每個物體的像素級邊界。 主要特點 每個物體獨立分割:對圖像中同一類的多個物體進行區分,分別賦予不同的實例ID,與傳統的物體檢測(bounding box)或語義分割(sema
看更多
你可能也想看
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
2025 vocus 推出最受矚目的活動之一——《開箱你的美好生活》,我們跟著創作者一起「開箱」各種故事、景點、餐廳、超值好物⋯⋯甚至那些讓人會心一笑的生活小廢物;這次活動不僅送出了許多獎勵,也反映了「內容有價」——創作不只是分享、紀錄,也能用各種不同形式變現、帶來實際收入。
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
前言 讀了許多理論,是時候實際動手做做看了,以下是我的模型訓練初體驗,有點糟就是了XD。 正文 def conv(filters, kernel_size, strides=1): return Conv2D(filters, kernel_size,
Thumbnail
前言 讀了許多理論,是時候實際動手做做看了,以下是我的模型訓練初體驗,有點糟就是了XD。 正文 def conv(filters, kernel_size, strides=1): return Conv2D(filters, kernel_size,
Thumbnail
攝影構圖會影響畫面的視覺平衡和觀感,像是運用三分法則等技法,能夠精準地引導觀眾的視線,使畫面更加動人。
Thumbnail
攝影構圖會影響畫面的視覺平衡和觀感,像是運用三分法則等技法,能夠精準地引導觀眾的視線,使畫面更加動人。
Thumbnail
每種光線都有它特定的功用,巧妙運用這些光線,就像施展了魔法般,為作品賦予不同的情感和意境,也大大提升作品的視覺效果和感染力,今天跟你介紹八個光線提示詞,來讓作品賦予獨特的情感和意境。
Thumbnail
每種光線都有它特定的功用,巧妙運用這些光線,就像施展了魔法般,為作品賦予不同的情感和意境,也大大提升作品的視覺效果和感染力,今天跟你介紹八個光線提示詞,來讓作品賦予獨特的情感和意境。
Thumbnail
複視就是一個物像看成兩個的情況。 病患也會覺得視力模糊或在某一特定方向視物困難,如果是腦神經的病變或壓迫,可能會感到頭暈、頭痛、噁心。
Thumbnail
複視就是一個物像看成兩個的情況。 病患也會覺得視力模糊或在某一特定方向視物困難,如果是腦神經的病變或壓迫,可能會感到頭暈、頭痛、噁心。
Thumbnail
人工智慧技術為攝影帶來新創意和可能性,透過不同鏡頭景深,呈現多樣化風格和視覺效果。本文介紹遠景、全景、中景、近景、特寫和廣角等不同攝影拍攝技巧。
Thumbnail
人工智慧技術為攝影帶來新創意和可能性,透過不同鏡頭景深,呈現多樣化風格和視覺效果。本文介紹遠景、全景、中景、近景、特寫和廣角等不同攝影拍攝技巧。
Thumbnail
本篇你將學到:視網膜內的訊息傳遞、視神經(Optic Nerve: Cranial Nerve ll)、視交叉(Optic Chiasm)、視徑(Optic Tract)、外側膝狀核(Lateral Geniculate Nucleus)、視放射—膝狀體禽距徑(Optic Radiatio
Thumbnail
本篇你將學到:視網膜內的訊息傳遞、視神經(Optic Nerve: Cranial Nerve ll)、視交叉(Optic Chiasm)、視徑(Optic Tract)、外側膝狀核(Lateral Geniculate Nucleus)、視放射—膝狀體禽距徑(Optic Radiatio
Thumbnail
很多AI只要輸入相關的鏡頭的關鍵字,視覺畫面會隨著鏡頭移動。 鏡頭與視角的關鍵字: 微觀|Microscopic view 焦點,對焦|Focus 第一人稱|First person perspective 第三人稱|Third person perspective 特寫|Close
Thumbnail
很多AI只要輸入相關的鏡頭的關鍵字,視覺畫面會隨著鏡頭移動。 鏡頭與視角的關鍵字: 微觀|Microscopic view 焦點,對焦|Focus 第一人稱|First person perspective 第三人稱|Third person perspective 特寫|Close
Thumbnail
點陣圖 點陣圖是由許多方格像素組成的圖片, 因此我們常常在將圖片放大時會呈現像是馬賽克的狀況, 假設期望圖片越清晰那所需要的像素會較多個, 因此空間耗用量也相對較大。 常見的格式有: .JPG .PNG .GIF .BMP .TIFF等格式。 繪製程式碼: 向量圖 向量
Thumbnail
點陣圖 點陣圖是由許多方格像素組成的圖片, 因此我們常常在將圖片放大時會呈現像是馬賽克的狀況, 假設期望圖片越清晰那所需要的像素會較多個, 因此空間耗用量也相對較大。 常見的格式有: .JPG .PNG .GIF .BMP .TIFF等格式。 繪製程式碼: 向量圖 向量
Thumbnail
下面使用一些關鍵字,來看看是否能嘗試控制鏡頭角度。不過,請注意,Stable Diffusion 派的 AI 生圖系統能否看懂提示詞?能看懂多少?是要看模型的,所以...
Thumbnail
下面使用一些關鍵字,來看看是否能嘗試控制鏡頭角度。不過,請注意,Stable Diffusion 派的 AI 生圖系統能否看懂提示詞?能看懂多少?是要看模型的,所以...
Thumbnail
這篇要來分享一下學習了一些攝影的知識後,用於改良AI生圖的經驗。 AI生圖可以藉由少少的幾個句子產生出非常美麗的圖片,事實上,很多時候AI生圖的極限是卡在人類使用者的想像力之下。
Thumbnail
這篇要來分享一下學習了一些攝影的知識後,用於改良AI生圖的經驗。 AI生圖可以藉由少少的幾個句子產生出非常美麗的圖片,事實上,很多時候AI生圖的極限是卡在人類使用者的想像力之下。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News