B 航線:半監督式學習的折衷智慧

王一書-avatar-img
發佈於AI-900 認證輔導 個房間
更新 發佈閱讀 4 分鐘
raw-image

[場景]

小美是資料標註員,負責辨識圖像資料並加上標籤,然後交給工程師進行模型訓練。
眼看已經接近下午5點,可是尚未標註的資料還有很多……

raw-image

一、標籤不夠,是現實世界的常態

想像你要訓練一個「動物辨識模型」。
你有:

    • 100 張已經人工標記好的圖片(有標籤)
    • 20,000 張沒標籤的圖片

問題來了:

    • 只用 100 張可以訓練嗎?資料太少。
    • 全部人工標註?成本太高。

這時候,就會發現:

使用監督式學習(Supervised Learning),資料必須全部都有標籤。
使用非監督式學習(Unsupervised Learning)又無法達到分類效果。

於是,出現了第三種學習方式。


二、什麼是半監督式學習(Semi-Supervised Learning)?

半監督式學習的核心概念很簡單:

少量有標記資料 + 大量未標記資料的學習方式。

它的概念是:

  1. 先用少量已標註資料訓練一個初步模型
  2. 再讓模型去「推測」大量未標記的資料標籤
  3. 把可信的結果匯整,加入訓練資料中

簡單說:

用已知的,擴張未知的。
這種作法在技術上常被稱為「偽標籤(Pseudo-label)」「自我訓練(Self-training)」策略。


三、它跟其他學習方式有什麼不同?

監督式學習:
✔資料全部需要標註
✔適合資料已標註並且數量充足

非監督式學習
✔資料不需要標註
✔適合依相似特性做分群

半監督式學習
✔少量已標註的資料
✔適合用在標註成本昂貴、資料數量多

可以把它想成:

監督式與非監督式的「混血策略」


四、常見應用場景

半監督式學習最常出現在:

  • 📷 電腦視覺(Computer Vision)
  • 🗣 語音辨識
  • 🏥 醫療影像判讀
  • 🌐 網路內容分類

這些領域有一個共同點:

資料很多,但標註成本很貴、很花時間。

例如醫療影像,需要專業醫師標註。
不可能全部人工完成。


五、考試提示

考題通常不會深入演算法。(出現機率不大)

但是可能會這樣問:

「下列何者為半監督式學習的特徵?」

正確答案通常是:

使用少量標記資料與大量未標記資料


六、實務應用上,它仍是值得認識的

因為在真實的應用情境裡:

資料幾乎永遠是不完整的。

半監督式學習代表的是一種「現實妥協」。
它不是最理想的方法,
卻往往是最務實的選擇。


七、小結

機器學習的主要學習方式包含:

  • 監督式:標籤完整
  • 非監督式:完全無標籤
  • 半監督式:現實世界的折衷解法

到這裡,我們已經把「機器學習的模型」介紹的差不多了。

但請留意:

挑對模型,只是成功的一部分。
真正影響結果的,往往是資料本身。


▶ Next:下一篇,我們該來談談——

👉 為什麼資料清理,比模型選擇更重要?


課程說明

🔖 以下內容為本系列的學習安排與閱讀指引。

  1. 為方便大家學習,我將全部章節進行劃分,詳見導覽文
  2. 本系列文章區分為「免費文」與「收費文」,
    目的在於清楚分開「初步認識」與「深入理解」兩個學習階段。
    收費內容將在基礎概念之上,整合重點圖表與說明,並融入個人教學與應考經驗,
    協助讀者建立可實際運用的理解框架。
  3. 各系列的收費文章皆以「考試情境」為主軸進行整理,
    不僅補齊必要的模型原理與判斷邏輯,
    亦會搭配模擬題與選項解析,
    協助學習者從「看懂內容」,進一步轉化為「選得正確」。
raw-image


留言
avatar-img
書子 的 AI 應用筆記
0會員
19內容數
這是一個關於「理解」與「實作」的學習沙龍。 我會分享程式與 AI 認證的學習脈絡,拆解考點背後的邏輯, 幫助學習者在快速變動的科技環境中,建立真正可用的能力。 這個沙龍適合: ・正在準備程式或 AI 相關認證的人 ・剛開始學程式,卻覺得觀念零散的人 ・轉職中,希望打好基礎、不想只追流行名詞的人
2026/02/26
集成學習(Ensemble Learning)可透過結合多個弱學習器,有效提升預測穩定度與準確率。本文整理三大核心方法:Bagging、Boosting 與 Stacking,同時比較隨機森林、AdaBoost、XGBoost 等代表演算法。幫助讀者建立清晰的判斷邏輯,並依情境選擇合適策略。
Thumbnail
2026/02/26
集成學習(Ensemble Learning)可透過結合多個弱學習器,有效提升預測穩定度與準確率。本文整理三大核心方法:Bagging、Boosting 與 Stacking,同時比較隨機森林、AdaBoost、XGBoost 等代表演算法。幫助讀者建立清晰的判斷邏輯,並依情境選擇合適策略。
Thumbnail
2026/02/09
三個臭皮匠,勝過一個諸葛亮。 集成學習(Ensemble Learning)的核心想法,其實很直覺:不要只聽一個聲音,而是讓多個模型一起做判斷。 它不是新的學習類型,而是一種能提升模型泛化能力的重要策略,也是 B 航線中一定要理解的關鍵概念。
Thumbnail
2026/02/09
三個臭皮匠,勝過一個諸葛亮。 集成學習(Ensemble Learning)的核心想法,其實很直覺:不要只聽一個聲音,而是讓多個模型一起做判斷。 它不是新的學習類型,而是一種能提升模型泛化能力的重要策略,也是 B 航線中一定要理解的關鍵概念。
Thumbnail
2026/02/09
非監督式學習,是在沒有標準答案的情況下,協助我們整理資料本身的結構。它回答三個核心問題:哪些資料彼此相似、哪些特徵才是真正重要、哪些事件常常一起發生。 本文從「聚類分析」、「降維技術」到「關聯規則學習」,帶你建立非監督式學習的整體理解框架,理解 AI 如何先整理資料,再由人來解讀意義。
Thumbnail
2026/02/09
非監督式學習,是在沒有標準答案的情況下,協助我們整理資料本身的結構。它回答三個核心問題:哪些資料彼此相似、哪些特徵才是真正重要、哪些事件常常一起發生。 本文從「聚類分析」、「降維技術」到「關聯規則學習」,帶你建立非監督式學習的整體理解框架,理解 AI 如何先整理資料,再由人來解讀意義。
Thumbnail
看更多
你可能也想看
Thumbnail
賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品,以十段寓言式殘篇,重新拼貼記憶、暴力與美學,並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇:帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略,嘗試解析極權底下不可言說之事,將如何成為可被觀看的公共發聲。
Thumbnail
賽勒布倫尼科夫以流亡處境回望蘇聯電影導演帕拉贊諾夫的舞台作品,以十段寓言式殘篇,重新拼貼記憶、暴力與美學,並將審查、政治犯、戰爭陰影與「形式即政治」的劇場傳統推到台前。本文聚焦於《傳奇:帕拉贊諾夫的十段殘篇》的舞台美術、音樂與多重扮演策略,嘗試解析極權底下不可言說之事,將如何成為可被觀看的公共發聲。
Thumbnail
柏林劇團在 2026 北藝嚴選,再次帶來由布萊希特改編的經典劇目《三便士歌劇》(The Threepenny Opera),導演巴里・柯斯基以舞台結構與舞台調度,重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核,藉由沉浸與疏離的辯證,解析此作如何再次照見觀眾自身的位置。
Thumbnail
柏林劇團在 2026 北藝嚴選,再次帶來由布萊希特改編的經典劇目《三便士歌劇》(The Threepenny Opera),導演巴里・柯斯基以舞台結構與舞台調度,重新向「疏離」進行提問。本文將從觀眾慾望作為戲劇內核,藉由沉浸與疏離的辯證,解析此作如何再次照見觀眾自身的位置。
Thumbnail
本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲.蓋柏樂》的詮釋,從劇本歷史、聲響與舞臺設計,到演員的主體創作方法,探討此版本如何讓經典劇作在當代劇場語境下煥發新生,滿足現代觀眾的觀看慾望。
Thumbnail
本文深入解析臺灣劇團「晃晃跨幅町」對易卜生經典劇作《海妲.蓋柏樂》的詮釋,從劇本歷史、聲響與舞臺設計,到演員的主體創作方法,探討此版本如何讓經典劇作在當代劇場語境下煥發新生,滿足現代觀眾的觀看慾望。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
《轉轉生》為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,融合舞蹈、音樂、時尚和視覺藝術,透過身體、服裝與群舞結構,回應殖民歷史、城市經驗與祖靈記憶的交錯。本文將從服裝設計、身體語彙與「輪迴」的「誕生—死亡—重生」結構出發,分析《轉轉生》如何以當代目光,形塑去殖民視角的奈及利亞歷史。
Thumbnail
網頁揭示了 AI-900 考試中文測試練習題庫的翻譯問題,指出不準確的翻譯可能導致考生對題目理解不足,並可能誤判答案。作者整理了一系列官方中文翻譯,提供了清晰的常見譯法和涵義,以及備考過程中的提醒,以幫助考生避免這些陷阱,並有效率地通過考試。
Thumbnail
網頁揭示了 AI-900 考試中文測試練習題庫的翻譯問題,指出不準確的翻譯可能導致考生對題目理解不足,並可能誤判答案。作者整理了一系列官方中文翻譯,提供了清晰的常見譯法和涵義,以及備考過程中的提醒,以幫助考生避免這些陷阱,並有效率地通過考試。
Thumbnail
純血文組生,如何從零基礎開始,接連考取 iPAS AI 應用規劃師、資策會人工智慧工程素養認證、生成式 AI 能力認證,和 Microsoft AI-900 國際認證的完整心得。文章包含各證照的考試範圍、難易度評估、學習資源,以及實際準備過程與備考策略,希望能幫助想踏入 AI 領域的讀者少走冤枉路。
Thumbnail
純血文組生,如何從零基礎開始,接連考取 iPAS AI 應用規劃師、資策會人工智慧工程素養認證、生成式 AI 能力認證,和 Microsoft AI-900 國際認證的完整心得。文章包含各證照的考試範圍、難易度評估、學習資源,以及實際準備過程與備考策略,希望能幫助想踏入 AI 領域的讀者少走冤枉路。
Thumbnail
AI900 X Azure ML 實作流程 X 考題重點 Microsoft Azure Machine Learning是微軟的雲端平台,用於訓練、部屬、管理機器學習模型,本文透過微軟的學習範例,一步步帶你建立自動化機器學習。
Thumbnail
AI900 X Azure ML 實作流程 X 考題重點 Microsoft Azure Machine Learning是微軟的雲端平台,用於訓練、部屬、管理機器學習模型,本文透過微軟的學習範例,一步步帶你建立自動化機器學習。
Thumbnail
AI900 X 學習筆記 X 英文名詞對照 機器學習、深度學習的名詞已紅了多年,到底是在"Deep"什麼? 深度學習(Deep Learning)是一種模仿人類大腦運作方式的機器學習方法。它透過建立人工神經網路(ANN),以數學函式模擬生物神經元的活動。
Thumbnail
AI900 X 學習筆記 X 英文名詞對照 機器學習、深度學習的名詞已紅了多年,到底是在"Deep"什麼? 深度學習(Deep Learning)是一種模仿人類大腦運作方式的機器學習方法。它透過建立人工神經網路(ANN),以數學函式模擬生物神經元的活動。
Thumbnail
AI900 X 學習筆記 X 英文名詞對照 分群(叢集)為非監督式學習,不需要使用標籤好的資料進行訓練,模型觀察數值或特徵的相似性來分組。 考試的重點:何種情況下使用分群?
Thumbnail
AI900 X 學習筆記 X 英文名詞對照 分群(叢集)為非監督式學習,不需要使用標籤好的資料進行訓練,模型觀察數值或特徵的相似性來分組。 考試的重點:何種情況下使用分群?
Thumbnail
AI900學習筆記 X 考題重點 X 英文名詞對照 分類模型和迴歸模型一樣,都是監督式機器學習(Supervised ML),不同的是,迴歸模型預測的是數值,而分類模型是判斷某個資料點屬於哪一類。 了解分類模型,以及如何評估分類模型的優劣。
Thumbnail
AI900學習筆記 X 考題重點 X 英文名詞對照 分類模型和迴歸模型一樣,都是監督式機器學習(Supervised ML),不同的是,迴歸模型預測的是數值,而分類模型是判斷某個資料點屬於哪一類。 了解分類模型,以及如何評估分類模型的優劣。
Thumbnail
AI-900 X 學習筆記 X 英文專有名詞對照 迴歸模型就是用來預測數值的工具,它會依據訓練資料中已知的特徵與已知的標籤(答案)來學習。 本文包含:迴歸模型原理、如何評估模型好壞?
Thumbnail
AI-900 X 學習筆記 X 英文專有名詞對照 迴歸模型就是用來預測數值的工具,它會依據訓練資料中已知的特徵與已知的標籤(答案)來學習。 本文包含:迴歸模型原理、如何評估模型好壞?
Thumbnail
AI-900系列 X 筆記整理 X 心智圖 機器學習(Machine Learning),基本概念就是用過去觀察的資料,預測未知的結果或值。例如:冰淇淋店結合歷史銷售數據+天氣紀錄,根據天氣預測,推測未來銷售額。 什麼是監督式學習與非監督式學習?分類和分群怎麼辨別?
Thumbnail
AI-900系列 X 筆記整理 X 心智圖 機器學習(Machine Learning),基本概念就是用過去觀察的資料,預測未知的結果或值。例如:冰淇淋店結合歷史銷售數據+天氣紀錄,根據天氣預測,推測未來銷售額。 什麼是監督式學習與非監督式學習?分類和分群怎麼辨別?
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News