
昏黃燈光下的偵探事務所,牆面上釘滿照片、地圖與手寫筆記,紅線交錯連結著嫌疑人、地點與時間,這不是電影,而是 AI 的辦案現場。它像一位數位偵探,耐心翻閱龐大的資料檔案,試圖在雜亂無章的線索中找出規律,推測你接下來的行動。
這是《邊喝邊想》基礎 AI 系列的第二篇,承接對 AI的宏觀認知,本篇則把鏡頭拉近,聚焦於 AI 的核心辦案工具:演算法(algorithm)。這個詞在工程師口中是再平常不過的專業術語,意思是一組能完成特定任務的指令或步驟,用來解決問題或做出決策。傳統軟體與AI 的差別,就像偵探與抄寫員。抄寫員只能一字不差地照本宣科;偵探則會根據新案件的細節,靈活運用舊資料的經驗來推測真相。
演算法與資料驅動
- 演算法(algorithm):就是 AI 的推理方法,一套系統化的步驟,指導它如何從原始資料中找到答案。在數學和計算機科學中,演算法通常是針對一類問題設計的解法,能在有限步驟內完成。對 AI 而言,演算法是把資料變成結論的橋樑
- 資料驅動(data-driven):是另一個關鍵詞,意思是決策和推論主要依據資料,而不是人工設定的規則。在傳統軟體中,工程師必須預先寫好每一步邏輯,就像法規條文一樣,該怎麼做、何時做都固定不變。但資料驅動的 AI 並不死守規則,而是從歷史資料中學到規則
在偵探辦案的隱喻裡,這就像一位刑警翻閱多年來相同地點、相同時間的案件檔案,找出規律,例如雨天該區域更容易發生交通事故,或是節日期間車流總會提早湧現。這些規律成為預測新案件的依據。AI 演算法的威力就在於,它能在海量資料中找到這些隱藏模式,而且速度與精準度都遠超人類。
模式辨識與資料集
- 如果說演算法是推理方法,那資料集(dataset) 就是 AI 的案卷檔案室。資料集是有組織地收集和標記的資料集合,形式可以是影像、文字、聲音或數字序列。AI 透過學習這些資料,建立一套能辨認規律的內部模型。
- 模式辨識(pattern recognition):是指在資料中發現重複出現的特徵或關聯,並利用這些規律來分類、預測或檢測異常。對人類而言,模式辨識是天生能力,例如認出朋友的臉、聽出熟悉的旋律;對 AI 而言,則是演算法從資料集中歸納出的結果。
一個典型案例是臉部辨識。AI 並不是死記每張臉的像素值,而是從數以百萬計的臉孔中,提取眼睛間距、鼻樑高度、下巴形狀等特徵向量,並建立特徵之間的關聯模型。Google 的 FaceNet 系統在 2 億張圖片訓練後,辨識準確率高達 99.63%。
另一案例是醫療影像分析。AI 從數千張 X 光片或 MRI 影像的資料集中,學會辨識腫瘤的形狀、紋理或邊緣特徵,輔助醫生診斷癌症,準確率可達 94% 以上。然而,資料集的品質至關重要。若資料過於單一,AI 就像只熟悉單一案件的偵探,遇到新情境便束手無策。因此,資料集需要規模、多樣性與代表性,才能讓 AI 的推理更全面、更可靠。
三個常見的 AI 演算法範型
AI 的偵探工具箱中,不同演算法適用於不同案件,應對多樣化的挑戰
- 監督式學習(Supervised Learning):像資深偵探帶新人辦案,給予大量已破案件(標記資料)作為參考,讓 AI 學會從特徵推斷結果。例如,垃圾郵件過濾系統從標記為垃圾或非垃圾的電子郵件中,學習關鍵詞或寄件者模式的關聯,進而判斷新郵件是否為垃圾郵件。2023 年,Gmail 利用監督式學習,每天攔截超過 100 億封垃圾郵件
- 非監督式學習(Unsupervised Learning):像偵探在無標記線索的情況下,將案件按相似特徵分組,挖掘隱藏規律。例如,零售商利用聚類演算法分析顧客購買記錄,分出喜歡奢侈品或偏好實用商品的客群,無需預先標記。Amazon 的推薦系統部分依賴非監督式學習,2024 年為用戶提升 35% 的購買轉化率
- 強化學習(Reinforcement Learning):像臥底偵探在現場試錯,根據環境回饋調整策略。例如,DeepMind 的 AlphaGo 透過模擬數千萬次棋局,根據勝負回饋優化下棋策略,最終擊敗世界圍棋冠軍。強化學習也廣泛應用於自駕車,讓車輛在模擬環境中學習避障與路徑規劃。這類演算法擅長處理動態、複雜的決策場景
理解這三種範型,就像掌握偵探的不同辦案技巧,能更清晰看到 AI 在不同場景中的推理邏輯與局限性。
無論哪一種AI 的魔法不在於瞬間破案,而在於它能從無數線索中持續學習,日益精準。演算法(algorithm)是推理的工具,資料集(dataset)是案卷的根基,模式辨識(pattern recognition) 則將線索串成故事。下一篇我們將看看 AI 如何在 Netflix 推薦、導航路徑等場景中,像專屬助理般為你做出決策。