【演算法全圖鑑】從基礎機器學習到 Transformer:一次搞懂 AI 大腦的進化與選擇

更新 發佈閱讀 4 分鐘

想學 AI,卻被一堆演算法名詞搞得頭暈腦脹?其實演算法就像 AI 的「軍火庫」,裡面裝滿了功能各異的武器。作為規劃師,你不需要手造武器,但一定要知道在什麼戰場該挑哪一把槍。

一、 機器學習的三大門派:機器怎麼學?

機器學習的本質,是讓電腦從數據中找出規律。根據資料特性和目標的不同,我們可以把學習方法分成這三大支柱:

  • 監督式學習 (Supervised Learning):像是有「老師」在旁邊教。 老師給你題目(輸入)也給你正確答案(標籤)。模型透過不斷對答案,學會如何分類(例如辨識垃圾郵件)或預測數值(例如預估房價)。這就是靠「標準答案」養出來的預測力。
raw-image
  • 非監督式學習 (Unsupervised Learning):像是自我探索的「偵探」。 沒人給答案,模型得在一堆混亂的資料中自己找規律。它擅長把相似的東西湊在一起(聚類),或幫龐大的數據「瘦身」(降維)。最常見的應用就是電商的客戶分群。
  • 強化學習 (Reinforcement Learning):像是「玩遊戲」的玩家。 這是一個「試錯」的過程。模型(代理人)在環境中亂撞,做對了拿獎勵,做錯了被扣分。它在乎的是累積下來的總分最高,這招專門用來處理自動駕駛或下圍棋這種需要連續決策的任務。

二、 為什麼 AI 會變聰明?揭開「自適應」的真相

傳統程式是「死規則」,如果 A 發生,就執行 B。但機器學習強在兩大優勢:

  1. 自適應能力: 它不需要你寫死指令,而是從數據經驗中自己修正判斷標準。數據更新了,模型就跟著變聰明。
  2. 高可擴展性: 只要硬體夠強、數據夠多,模型就能處理人類大腦無法想像的複雜維度,從幾萬筆數據中挖出細微的趨勢。

三、 經典演算法:從「數據算命師」到「分類法官」

raw-image

在軍火庫中,這幾款經典武器你一定要認得:

  • 線性回歸 (Linear Regression): 數據界的算命師,專門預測房價、股價這種連續數字。
  • 邏輯回歸 (Logistic Regression): 名字有回歸,其實是分類大師。專門判斷是非題(如:這張信用卡會不會違約?)。
  • 決策樹與隨機森林: 像是玩「提問遊戲」,透過一連串是非題來做決定。隨機森林則是找一堆決策樹來集體投票,防止單一模型鑽牛角尖(過擬合)。
  • SVM (支持向量機):分類界的「邊界大王」。 SVM 不只是把東西分開,它追求的是畫出一道讓兩邊都「離我最遠」的完美界線(最大間隔)。如果原始資料混在一起分不開,它還會用「核函數」把資料傳送到更高維度的空間,在那個時空裡,原本糾纏不清的資料就能一刀切開。

四、 深度學習:模仿大腦的「渦輪增壓器」

當資料量大到傳統計法處理不來,例如照片、語音或長篇大論,我們就得請出「深度學習」。

它模仿人類神經元的架構,透過多層傳遞來理解世界。這裡有兩個關鍵動作:

  1. 前向傳播: 資料進來,模型大膽做預測(去考試)。
  2. 反向傳播: 發現預測錯了,把誤差「往回傳」,告訴每一層神經元該調整多少權重(檢討考卷)。
raw-image

隨著需求不同,深度學習也演化出不同的專科醫生:

  • CNN (卷積神經網路): AI 的眼睛,專門處理圖像,從線條、紋理看到整張臉。
  • RNN (循環神經網路): AI 的記憶,適合處理有時間順序的資料,如一段音樂或一段話。
  • Transformer: 現在最紅的架構(如 ChatGPT 的心臟)。它不再像 RNN 那樣死板地按順序讀字,而是透過「自注意力機制」一次看完所有資訊,並能分輕重緩急地理解上下文。

理解了這張演算法地圖,你就不再是看熱鬧的門外漢。面對問題時,你會先想:這是有標準答案的考卷(監督式)?還是無人島的探險(非監督式)?是要用簡單穩定的線性模型,還是要請出強大的深度學習軍隊?

這種針對不同戰場挑選對應武器的能力,才是 iPAS 考證中最核心的專業判斷。

留言
avatar-img
留言分享你的想法!
avatar-img
iPAS AI 自學路|備考軍火庫 & 白話筆記
33會員
10內容數
40 歲非本科大叔的 iPAS 備考軍火庫。 這裡不談艱澀理論,只提供「考前速記表」、與「白話考點解析」。 我擅長將複雜的技術名詞,轉化為轉職者也能秒懂的語言。 搭配我的 YouTube 頻道服用,讓你的通勤零碎時間,變成最高效的得分時間。
2025/12/18
當資料量從「幾萬筆」跳升到「幾億筆」,單機運算會瞬間崩潰。這篇文章拆解了 AI 專案底層的重型武器:從分散式系統無法逃避的 CAP 定理枷鎖,到 Apache 三劍客 Spark、Kafka、Airflow 的協作秘辛。我們也探討如何透過多維度分析看穿數據偽裝,並利用交叉驗證撕掉模型預測力的假象。
Thumbnail
2025/12/18
當資料量從「幾萬筆」跳升到「幾億筆」,單機運算會瞬間崩潰。這篇文章拆解了 AI 專案底層的重型武器:從分散式系統無法逃避的 CAP 定理枷鎖,到 Apache 三劍客 Spark、Kafka、Airflow 的協作秘辛。我們也探討如何透過多維度分析看穿數據偽裝,並利用交叉驗證撕掉模型預測力的假象。
Thumbnail
2025/12/17
很多人誤以為 AI 規劃師的工作就是每天鑽研高深的演算法,但真相往往比較骨感:我們有 80% 的時間都在跟「髒資料」搏鬥。 一、 數據藍圖:先看清楚你的「礦石」長什麼樣 在動手處理前,得先搞清楚手上的資料屬於哪一類。這決定了後續要動什麼樣的手術。 結構化數據: 就像 Excel 表格或 SQL
Thumbnail
2025/12/17
很多人誤以為 AI 規劃師的工作就是每天鑽研高深的演算法,但真相往往比較骨感:我們有 80% 的時間都在跟「髒資料」搏鬥。 一、 數據藍圖:先看清楚你的「礦石」長什麼樣 在動手處理前,得先搞清楚手上的資料屬於哪一類。這決定了後續要動什麼樣的手術。 結構化數據: 就像 Excel 表格或 SQL
Thumbnail
2025/12/17
敘述性統計是資料分析的「體檢報告」,也是iPAS考試科目的絕對重點。許多考生只會看「平均數」,卻忽略了極端值可能帶來的巨大誤判。從資料的三大維度—「集中趨勢」、「離散程度」與「分佈形狀」入手,帶你徹底搞懂何時該用中位數取代平均數、為什麼計算速度要用調和平均數、以及如何利用IQR與箱形圖秒殺離群值。
Thumbnail
2025/12/17
敘述性統計是資料分析的「體檢報告」,也是iPAS考試科目的絕對重點。許多考生只會看「平均數」,卻忽略了極端值可能帶來的巨大誤判。從資料的三大維度—「集中趨勢」、「離散程度」與「分佈形狀」入手,帶你徹底搞懂何時該用中位數取代平均數、為什麼計算速度要用調和平均數、以及如何利用IQR與箱形圖秒殺離群值。
Thumbnail
看更多