這指南帶您快速掌握考試的四大核心領域,深入理解關鍵技術的差異與應用
核心模型對比:BERT vs. GPT
• BERT (閱讀理解高手)
◦ 訓練方式: 雙向訓練。它會同時觀察一個字的左右上下文,擅長理解完整的語句脈絡。
◦ 核心優勢: 語意理解、上下文掌握。
◦ 應用場景: 問答系統、情感分析、文本分類。
• GPT (寫作生成高手)
◦ 訓練方式: 單向自迴歸。由左至右預測下一個字,生成流暢連貫的文本。
◦ 核心優勢: 文本生成、內容創作。
◦ 應用場景: 文章撰寫、聊天機器人、創意寫作。
關鍵增強技術:RAG (檢索增強生成)
• 運作原理:
1. 檢索 (Retrieve): 先從外部知識庫 (如:公司內部文件) 尋找相關資料。
2. 增強 (Augment): 將檢索到的資料作為參考資訊提供給大型語言模型。
3. 生成 (Generate): 模型根據這些可靠的資料生成答案。
• 主要效益: 大幅減少模型產生幻覺(亂編故事)的問題,特別適用於需要高準確性的企業內部應用。
--------------------------------------------------------------------------------
2. 電腦視覺 (Computer Vision) - 讓機器看懂世界
關鍵差異:物件偵測 vs. 物件分割
• 物件偵測 (Object Detection)
◦ 目標: 「在哪裡?是什麼?」。
◦ 方法: 使用方形邊界框 (Bounding Box) 框出物體位置並加上標籤。
◦ 範例: 在照片中框出一隻狗,並標示為「狗」。
• 物件分割 (Object Segmentation)
◦ 目標: 「物體的精確輪廓是什麼?」。
◦ 方法: 描繪出物體精確到像素等級 (Pixel-level) 的邊緣輪廓。
◦ 應用場景:
▪ 醫療影像: 準確判讀腫瘤邊界。
▪ 自動駕駛: 精確辨識行人與車輛的形狀。
--------------------------------------------------------------------------------
3. 模型部署與維運 (MLOps) - 從實驗室到現實世界
核心理念:MLOps (Machine Learning Operations)
• 目標: 將機器學習模型的開發、測試、部署到監控的整個生命週期,進行自動化與流程化管理。
• 包含環節: 模型版本控制 (如 DVC)、實驗追蹤 (如 MLflow)、自動化部署 (CI/CD) 與上線後監控。
關鍵技術:容器化 (Containerization)
• 工具代表: Docker。
• 運作方式: 將應用程式及其所有依賴項 (函式庫、設定檔) 打包成一個標準化的「容器」。
• 最大優勢: 解決「在我的電腦上可以跑」的問題,確保在任何環境(開發、測試、雲端)都能有一致的執行結果,讓部署變得快速且易於管理。
--------------------------------------------------------------------------------
4. 核心統計概念 - 評估與衡量的基礎
Z-Score (Z分數)
• 用途: 衡量一個數據點偏離平均值多少個標準差。
• 公式: (觀測值 - 平均值) / 標準差。
• 應用:
1. 比較不同基準的數據 (如不同科目的分數相對位置)。
2. 偵測異常值 (Z分數極高或極低的點)。
F1-Score (F1分數)
• 用途: 綜合評估模型的精確率 (Precision) 與召回率 (Recall),特別適用於資料不平衡的場景 (如:信用卡盜刷偵測)。
• 核心指標:
◦ 精確率: 模型預測為「正」的樣本中,有多少是「真的正」。
◦ 召回率: 所有「真的正」的樣本中,模型成功抓出了多少。
• 公式: 兩者的調和平均數,可記口訣:「2 * 精確率 * 召回率 / (精確率 + 召回率)」 或 「二乘積除以和」