AI時代系列(3) 機器學習三部曲: 🔹 第一部:《機器學習 —— AI 智慧的啟航》
60/100 第六週:模型評估與優化
60. 小結與測驗-AI Fairness(公平性與偏見處理) ⚖ 避免 AI 存在種族、性別等偏見,讓科技更公平!
第 6 章 小結:讓模型更強、更穩、更可信!
本章重點是讓 AI 模型不僅準確,更要穩健、可解釋、可信賴且能落地應用。以下是核心概念回顧:
單元 重點摘要
6.1 過擬合與欠擬合 ⚠ 過擬合像死記,欠擬合像亂猜,找到「剛剛好」才能泛化好
6.2 交叉驗證 🔁 多次切分訓練測試,避免運氣好壞,讓評估更客觀
6.3 超參數調整 🎛 Grid、Random、Bayesian 找出最佳超參數,讓模型表現最大化
6.4 早停技術 ⏳ 適時踩煞車,避免模型過度記憶,提升泛化力
6.5 模型正則化 📏 L1/L2 懲罰過度學習,讓模型簡化、穩健
6.6 模型解釋性(SHAP, LIME) 🔍 打開 AI 黑箱,解釋預測邏輯,提升可信度
6.7 特徵重要性分析 📊 找出決策關鍵因素,輔助業務決策與特徵工程
6.8 提升泛化策略 🏆 多方法並用,讓 AI 遇強更強,不只會考題庫
6.9 模型壓縮與部署 🚀 壓縮模型、加速推理,讓 AI 真正落地到手機、IoT、邊緣設備
________________________________________
📌 新增重點單元:AI Fairness(公平性與偏見處理) ⚖
讓 AI 不帶偏見,科技更公平!
🔎 一、什麼是 AI 公平性(Fairness)?
• 避免模型因為訓練資料偏差,產生 種族、性別、年齡、收入等不公平決策
• 例子: ✅ AI 拒貸女性多於男性
✅ 招聘模型自動忽略某族群簡歷
✅ 臉部辨識系統對某些膚色辨識失誤率高
________________________________________
📚 二、常見 AI 偏見來源
✅ 數據偏差(Data Bias)
✅ 特徵設計偏差(Feature Bias)
✅ 模型訓練過程偏差(Algorithmic Bias)
✅ 人為標註偏差(Human Bias)
________________________________________
🛠 三、解決 AI 偏見的常見方法
方法 說明
數據平衡(Re-sampling): 增加弱勢樣本比例,降低偏見
公平性指標監控(Fairness Metrics): 監控不同族群下的精確率、召回率
去偏特徵處理: 移除或調整帶偏見的特徵(如性別、種族)
公平性強化學習: 導入公平性約束,訓練過程中自動調整
________________________________________
📝 第 6 章 測驗(選擇題+問答)
📖 選擇題
1️⃣ 以下哪個方法可有效防止過擬合?
• A. 增加模型層數
• B. Early Stopping ✅
• C. 只用訓練集評估
• D. 去除正則化
說明:
Early Stopping 是在訓練過程中監控驗證集誤差,當誤差開始上升時就提前停止訓練,避免模型記住太多訓練資料細節(過擬合)。
其餘選項說明:
2️⃣ 哪一個技術能用來解釋 AI 模型預測結果?
• A. Batch Normalization
• B. Pooling Layer
• C. SHAP / LIME ✅
• D. Dropout
說明:
SHAP 和 LIME 是目前最常用的可解釋 AI 技術,用於解釋模型為何做出某個預測,能提供每個特徵對預測的貢獻分析,提升模型透明度。
3️⃣ 以下關於 AI 公平性描述正確的是?
• A. AI 模型天生公平
• B. 不需特別考慮少數族群
• C. 數據偏差會導致模型決策不公平 ✅
• D. 公平性與 AI 性能無關
說明:
AI 是依據訓練資料學習而來,若資料本身存在偏差(如性別、種族不均),模型可能在預測上重複甚至放大這些偏見,導致決策不公平。
________________________________________
📖 問答題(
1️⃣ 請說明什麼是「知識蒸餾」?它在模型部署優化中的作用是什麼?
✅ 參考答案: 知識蒸餾是讓大型複雜模型(Teacher)訓練一個小模型(Student)的方法。小模型學習老師模型的預測邏輯,達到減小模型體積與運算量,同時保持預測準確。適合應用在手機、IoT 等資源有限場景。
________________________________________
2️⃣ 試舉例說明 AI 可能產生的偏見,並提出至少兩種改善方法。
✅ 參考答案: 例:信用貸款模型對女性、低收入群體拒貸率高。
改善方法:
• 進行數據重取樣,平衡不同群體數量
• 引入公平性指標監控各群體預測表現
• 移除敏感特徵(性別、種族)
________________________________________
📌 本章口訣精華:
✅ AI 模型不只要 「會做題」,更要 「理解題目,解釋得出來」
✅ 避免黑箱,避免偏見,讓 AI 真正可用、可解釋、可信任!
✅ 模型壓縮 → 上線運行,AI 才能真正走進生活
________________________________________