影像辨識(Object Recognition)是什麼?
影像辨識也就是在一張照片裡辨識出裡面的物件。電腦的識別比人類還要優秀可以一眼看出車子的類型,甚至是出廠年份。
影像辨識可應用在很多地方,例如美國的大型機場,有著24小時的全面監控,如果有人的行李或包裹離開身邊太久,就會請清潔人員或者警衛清走,為了預防可能是恐怖份子留下的炸彈。
類神經網路如何做到影像辨識?假設我們有數百萬張野外的照片,而我們要從這些照片中,把有鳥的照片辨識出來。這個問題聽起來很簡單,其實很困難。因為照片中的鳥可能出現左上角或右下角各種地方。視拍到的情況,鳥可能在飛或者是在休息。以及可能拍到鳥的正面、背面或者側面,不同面相。
傳統的做法是基於規則(Rule Based)的做法,也就設定多項條件,例如:飛在天上的是鳥、身上有羽毛的是鳥、有翅膀的是鳥等。但這個做法可能會有辨識上困難,因為規則訂的不詳細,可能把其他動物也辨識成鳥。規則訂的太詳細,又有可能產生互相矛盾的情況。
新的方法是基於圖樣(Pattern Based)的作法,將鳥的特徵畫成簡單的線條,藉由圖樣來判斷照片中的是不是鳥。而圖樣之間還有其他的規則要處理,例如,辨識到鳥嘴時,同時也應該要辨識到眼睛;當鳥的翅膀合起來休息時應該要看到鳥的腳。
收集到圖樣後,我們會使用類神經網路建立一個網狀的推理結構。把圖樣資料輸入進去,經過各節點的網狀推理,就可以做出一個最終的判斷。
為了讓類神經網路自己收集圖樣,我們會將照片進行前處理,將照片的顏色做出區分,讓電腦分辨出個特徵的線條,在經過類神經網路的推理引擎得出一個分數,判斷照片裡是否為鳥類。





















