《AI-900》機器學習3:分類 Classification

更新於 發佈於 閱讀時間約 6 分鐘
raw-image

本文章Microsoft 對應網頁:中文英文

簡介

  1. 分類模型和迴歸模型一樣,都是監督式機器學習(Supervised ML),因此訓練過程也同樣需要不斷地「訓練 → 驗證 → 評估」。
  2. 不同的是,迴歸模型預測的是數值,而分類模型是判斷某個資料點屬於哪一類。演算法會計算每個類別的「機率(probability)」,再根據這些機率來做出分類,各類別的機率值合計為1.0。
  3. 最後評估模型表現時,就是比較「模型預測的類別」和「實際的類別」有多接近。
  4. 分類方式可區分為二元分類、多類別分類。
  5. 考題重點:何時使用分類(區別迴歸、分群)、辨別特徵(feature)和標籤(label)

二元分類Binary classification

二元分類的模型輸出,會將結果分為兩個類別。
例如,輸入血糖值(x)預測病患是否患有糖尿病,得出的結果為true=0.7, false=0.3。
此時,血糖值x是特徵(feature),預測出的結果─是否有糖尿病─是標籤(label)。

常用的演算法如:羅吉斯迴歸(logistic regression)

  • 注意,在機器學習中,羅吉斯迴歸用於分類,而不是迴歸。
  • 產出sgmoid(S型)函式,其y值介於0.0~1.0之間。
  • 以下圖為例,若給定閾值(threshold)是0.5,則ŷ>0.5的病患,模型將預測為true(1),亦即預測患有糖尿病。
  • f(x) = P(y=1 | x),給定x,y=1的(true)的機率
raw-image

評估二元分類模型

raw-image

混淆矩陣confusion matrix

  • ŷ=0 和 y=0: 確判為假 (True negatives, TN)
  • ŷ=1 和 y=0: 誤判為真 (False positives, FP)
  • ŷ=0 和 y=1: 誤判為假 (False negatives, FN)
  • ŷ=1 和 y=1: 確判為真 (True positives, TP)

準確率Accuracy

  • (TN+TP) ÷ (TN+FN+FP+TP)  正確預測量/全部預測量
  • 全部預測數中,正確預測(有病、無病)的數量
  • 可能問題:在不平衡的資料中,可能會造成誤導。
    例如,假設有糖尿病的人只佔總人口的 11%,若一個模型永遠預測一個人沒有糖尿病(ŷ=0),這個模型什麼都不用判斷,正確率也有89%。

召回率Recall = True positive rate (TPR)

  • TP ÷ (TP+FN) 確判為真/實際為真
  • 在實際有糖尿病的群體中(確判為有病+誤判為沒病),預測為有糖尿病的比率。

精確度Precision

  • TP ÷ (TP+FP) 確判為真/判斷為真
  • 在預測有糖尿病的群體中(確判為有病+誤判為有病),實際上有糖尿病的比率。

F1分數 F1-score

(2 x Precision x Recall) ÷ (Precision + Recall)

曲線下面積(Area Under the Curve, AUC)

raw-image
  • True positive rate (TPR),false positive rate (FPR) = FP÷(FP+TN)
  • 變更模型的閾值(threshold),會影響TPR和TFR,為了評估模型在不同門檻下的整體表現,我們會繪製ROC曲線(received operator characteristic, ROC),比較所有可能門檻(0.0 到 1.0)下的 TPR 和 FPR 表現。
  • 完美模型的 ROC 曲線,會完全貼合沿著TRP向上,再貼著FPR向右。(AUC=1,表示模型100%正確)
  • 若ROC曲線是對角線(AUC=0.5),表示有50%猜對(沒有比隨機猜測好)。

多類別分類Multiclass classification

多類別分類是將資料點分類為兩個以上的類別,舉例:以鰭的長度(x)預測企鵝的物種,分類為三類:0, 1, 2。

一對多演算法 One-vs-Rest (OvR) algorithms

計算多個標籤的機率值

  • f0(x) = P(y=0 | x)f1(x) = P(y=1 | x)f2(x) = P(y=2 | x)
  • 則f0(x) 、f1(x)、f2(x) 分別計算出企鵝是0、1、2類別的機率。
  • 每個演算法都會產生 sigmoid 函式,計算介於 0.0 到 1.0 之間的機率值。

多項式演算法Multinomial algorithms

  • f(x) =[P(y=0|x), P(y=1|x), P(y=2|x)]
  • 輸出為一個向量,包含所有可能類別的機率分布,總計最多為1.0。

評估多類別分類模型

raw-image
  • 與二元分類類似,使用混淆矩陣
  • 分別計算0, 1, 2的準確率、召回率、精確度、F1分數。
  • 計算整體確率、召回率、精確度。並依此計算整體F1分數。

舉例:

raw-image
    • 整體準確率 (TN+TP) ÷ (TN+FN+FP+TP)  正確預測量/全部預測量
      = (13+6) ÷ (13+6+1+1) = 0.90
    • 整體召回率 TP ÷ (TP+FN) 確判為真/實際為真
      = 6÷(6+1) = 0.86
    • 整體精確度 TP ÷ (TP+FP) 確判為真/判斷為真
      = 6÷ (6+1) = 0.86
    • 整體 F1 分數 (2 x Precision x Recall) ÷ (Precision + Recall)
      = (2 x 0.86 x 0.86) ÷ (0.86 + 0.86) = 0.86

AI-900系列文章目錄:
《AI-900》證照考試準備心得與筆記分享 - 系列文章

留言
avatar-img
留言分享你的想法!
avatar-img
快半拍成長日誌
36會員
101內容數
快半拍是小小的進步,每天前進一點點,發現微小進步中的光芒。
快半拍成長日誌的其他內容
2025/09/07
AI-900 X 學習筆記 X 英文專有名詞對照 迴歸模型就是用來預測數值的工具,它會依據訓練資料中已知的特徵與已知的標籤(答案)來學習。 本文包含:迴歸模型原理、如何評估模型好壞?
Thumbnail
2025/09/07
AI-900 X 學習筆記 X 英文專有名詞對照 迴歸模型就是用來預測數值的工具,它會依據訓練資料中已知的特徵與已知的標籤(答案)來學習。 本文包含:迴歸模型原理、如何評估模型好壞?
Thumbnail
2025/09/06
AI-900系列 X 筆記整理 X 心智圖 機器學習(Machine Learning),基本概念就是用過去觀察的資料,預測未知的結果或值。例如:冰淇淋店結合歷史銷售數據+天氣紀錄,根據天氣預測,推測未來銷售額。 什麼是監督式學習與非監督式學習?分類和分群怎麼辨別?
Thumbnail
2025/09/06
AI-900系列 X 筆記整理 X 心智圖 機器學習(Machine Learning),基本概念就是用過去觀察的資料,預測未知的結果或值。例如:冰淇淋店結合歷史銷售數據+天氣紀錄,根據天氣預測,推測未來銷售額。 什麼是監督式學習與非監督式學習?分類和分群怎麼辨別?
Thumbnail
2025/09/06
學習筆記 × 心智圖 × 考試心得 本系列文章整理 Microsoft Azure AI Fundamentals (AI-900) 中英文官方教材,解決官方機器翻譯不精確問題,並附上心智圖與操作截圖,方便掌握重點與應試。 文中附上:考試資源、2025年考試心得
Thumbnail
2025/09/06
學習筆記 × 心智圖 × 考試心得 本系列文章整理 Microsoft Azure AI Fundamentals (AI-900) 中英文官方教材,解決官方機器翻譯不精確問題,並附上心智圖與操作截圖,方便掌握重點與應試。 文中附上:考試資源、2025年考試心得
Thumbnail
看更多
你可能也想看
Thumbnail
透過蝦皮分潤計畫,輕鬆賺取零用金!本文分享5-6月實測心得,包含數據流程、實際收入、平臺優點及注意事項,並推薦高分潤商品,教你如何運用空閒時間創造被動收入。
Thumbnail
透過蝦皮分潤計畫,輕鬆賺取零用金!本文分享5-6月實測心得,包含數據流程、實際收入、平臺優點及注意事項,並推薦高分潤商品,教你如何運用空閒時間創造被動收入。
Thumbnail
單身的人有些會養寵物,而我養植物。畢竟寵物離世會傷心,植物沒養好再接再厲就好了~(笑)
Thumbnail
單身的人有些會養寵物,而我養植物。畢竟寵物離世會傷心,植物沒養好再接再厲就好了~(笑)
Thumbnail
不知你有沒有過這種經驗?衛生紙只剩最後一包、洗衣精倒不出來,或電池突然沒電。這次一次補貨,從電池、衛生紙到洗衣精,還順便分享使用心得。更棒的是,搭配蝦皮分潤計畫,愛用品不僅自己用得安心,分享給朋友還能賺回饋。立即使用推薦碼 X5Q344E,輕鬆上手,隨時隨地賺取分潤!
Thumbnail
不知你有沒有過這種經驗?衛生紙只剩最後一包、洗衣精倒不出來,或電池突然沒電。這次一次補貨,從電池、衛生紙到洗衣精,還順便分享使用心得。更棒的是,搭配蝦皮分潤計畫,愛用品不僅自己用得安心,分享給朋友還能賺回饋。立即使用推薦碼 X5Q344E,輕鬆上手,隨時隨地賺取分潤!
Thumbnail
身為一個典型的社畜,上班時間被會議、進度、KPI 塞得滿滿,下班後只想要找一個能夠安靜喘口氣的小角落。對我來說,畫畫就是那個屬於自己的小樹洞。無論是胡亂塗鴉,還是慢慢描繪喜歡的插畫人物,那個專注在筆觸和色彩的過程,就像在幫心靈按摩一樣,讓緊繃的神經慢慢鬆開。
Thumbnail
身為一個典型的社畜,上班時間被會議、進度、KPI 塞得滿滿,下班後只想要找一個能夠安靜喘口氣的小角落。對我來說,畫畫就是那個屬於自己的小樹洞。無論是胡亂塗鴉,還是慢慢描繪喜歡的插畫人物,那個專注在筆觸和色彩的過程,就像在幫心靈按摩一樣,讓緊繃的神經慢慢鬆開。
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 129 中說,Bidirectional Encoder Representations from Transformers (BER
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 129 中說,Bidirectional Encoder Representations from Transformers (BER
Thumbnail
前言 讀了許多理論,是時候實際動手做做看了,以下是我的模型訓練初體驗,有點糟就是了XD。 正文 def conv(filters, kernel_size, strides=1): return Conv2D(filters, kernel_size,
Thumbnail
前言 讀了許多理論,是時候實際動手做做看了,以下是我的模型訓練初體驗,有點糟就是了XD。 正文 def conv(filters, kernel_size, strides=1): return Conv2D(filters, kernel_size,
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 從 AI說書 - 從0開始 - 82 到 AI說書 - 從0開始 - 85 的說明,有一個很重要的結論:最適合您的模型不一定是排行榜上最好的模型,您需要學習 NLP 評
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 從 AI說書 - 從0開始 - 82 到 AI說書 - 從0開始 - 85 的說明,有一個很重要的結論:最適合您的模型不一定是排行榜上最好的模型,您需要學習 NLP 評
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 繼 AI說書 - 從0開始 - 82 與 xxx ,我們談論了衡量 AI 模型的方式,那當你訓練的模型比 State-of-the-Art 還要好並想要進行宣稱時,需要
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 繼 AI說書 - 從0開始 - 82 與 xxx ,我們談論了衡量 AI 模型的方式,那當你訓練的模型比 State-of-the-Art 還要好並想要進行宣稱時,需要
Thumbnail
在機器學習領域中,監督學習、無監督學習和強化學習是三種核心方法,它們在解決不同類型的問題時發揮著重要作用。
Thumbnail
在機器學習領域中,監督學習、無監督學習和強化學習是三種核心方法,它們在解決不同類型的問題時發揮著重要作用。
Thumbnail
筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型 三個步驟: 1.預訓練,訓練一次要用幾萬顆處理器、訓練時間要1個月,ChatGPT訓練一次的成本為1000萬美金。 2.微調(
Thumbnail
筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型 三個步驟: 1.預訓練,訓練一次要用幾萬顆處理器、訓練時間要1個月,ChatGPT訓練一次的成本為1000萬美金。 2.微調(
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News