電腦視覺技術與應用

含有「電腦視覺技術與應用」共 62 篇內容
全部內容
發佈日期由新至舊
CNN 中的感受野 (Receptive Field) 是指在卷積神經網路的某一層中,每個神經元(或像素)的輸出受到前一層哪些區域的輸入所影響。換句話說,它是指輸入圖像上的一個特定區域,這個區域的資訊最終會傳遞到當前層的某個特定神經元。 可以將感受野想像成一個「視野」。對於某一層的某個神經元來說,
角點偵測演算法 (Corner Detection Algorithms) 是電腦視覺中用於識別圖像中「角點」的技術。角點是指圖像中在兩個或多個方向上具有顯著強度變化的像素點,可以理解為圖像中局部區域的交叉點、尖銳的轉角或紋理的終止點。 為什麼角點偵測很重要? 角點在圖像分析中扮演著重要的角色,
擴增實境 (Augmented Reality, AR) 是一種將電腦產生的圖像、資訊或感知數據疊加到真實世界環境中的技術。與創造一個完全虛擬世界的虛擬實境 (Virtual Reality, VR) 不同,AR 的目的是增強使用者對現實世界的體驗,將虛擬元素融入真實環境中。 以下是擴增實境的一些
立體視覺 (Stereoscopic Vision) 是指生物(包括人類)通過雙眼感知三維世界的能力,也就是我們常說的「3D視覺」或「景深」。它讓我們能夠判斷物體的距離、大小和形狀,並感知空間的深度。 以下是立體視覺的主要原理: * 雙眼視差 (Binocular Disparity): 我們
仿射變換 (Affine Transformation) 是一種二維幾何變換,它將一個平面上的點映射到另一個平面上的點,並保持直線的「直線性」和平行線的「平行性」。簡單來說,經過仿射變換後,圖像中的所有直線仍然是直線,平行的線仍然是平行的,但長度、角度和比例可能會改變。 更正式地說,一個二維的仿射
圖像檢索 (Image Retrieval) 是指從大量的圖像集合中找到與給定的查詢相關的圖像的過程。查詢的方式有很多種,可以是: * 基於文本的圖像檢索 (Text-based Image Retrieval, TBIR): 使用文本關鍵字、標籤或描述來搜索相關的圖像。例如,在Google圖片
霍夫變換 (Hough Transform) 是一種在圖像處理中常用的特徵提取技術,主要用於在影像中檢測特定形狀,例如直線、圓形、橢圓等。它的主要思想是利用投票機制,將影像空間中的點轉換到參數空間中,並在參數空間中尋找累積投票數最多的點,這些點對應於原始影像中最有可能存在的形狀。 以下是霍夫變換的
光照變化 (Illumination Variation) 指的是在拍攝圖像或影片時,場景中光線的強度、方向、顏色或分布發生的改變。這些變化可能是由多種因素引起的,例如: * 時間的變化: 隨著日出日落,自然光的光照強度和顏色會發生顯著變化。室內光線也可能因為開燈、關燈或燈光強度的調整而改變。
對抗性攻擊 (Adversarial Attack) 是指針對機器學習模型(尤其是深度學習模型)的一種攻擊方式。攻擊者通過在輸入資料中加入人類難以察覺的微小擾動,使得模型產生錯誤的輸出,即使原始資料模型可以正確分類。 以下是關於對抗性攻擊的一些關鍵點: * 目標: 欺騙機器學習模型,使其做出錯
U-Net 是一種專門設計用於生物醫學影像分割的卷積神經網路架構,但現在也廣泛應用於其他領域的影像分割任務。它之所以被稱為「U-Net」,是因為它的架構呈現一個明顯的「U」形。 以下是 U-Net 架構的主要特點: * 收縮路徑 (Contracting Path) / 編碼器 (Encode