ITS AI國際認證考試準備與筆記整理

Miranda Cheng

更新於 2025/08/02發佈於 2025/08/02閱讀時間約 19 分鐘

在使用了一陣子AI相關的應用工具，思考是否有相關的AI證照可在準備的過程也同時更瞭解AI的整體概念。有機會看到Tibame有ITS AI的課程，就參與了課程及考試準備。

證照說明參考來自Tibame楊老師的「何謂ITS AI國際認證」

ITS AI考試大綱

有關ITS AI考試內容方向可參考 Certiport的官網:Certiport IT SPECIALIST Artificial

或是碁峰資訊的官方說明: 碁峰資訊ITS Artificial Intelligence 考試大綱

內容包含五大主題：

1.AI問題定義

2.數據收集、處理與工程

3.AI 演算法與模型

4.應用整合與部署

5.AI的維護和監控

各章節重點筆記

於7月參與Tibame楊宏文老師的「 ITS AI國際認證應考攻略」的課程後，對於各章節內容研讀後，匯整如下筆記：

ITS AI 證照考試筆記整理

🟦 第 1 章：AI 問題定義與規劃（AI Problem Definition）

AI 的分類

機器學習類型分類及解決問題：

分類 / 分群

🟨 第 2 章：資料收集、處理與工程（Data Collection, Processing, and Engineering）

資料的類型：結構化 / 半結構化 / 非結構化

- 資料來源：
- - 內部數據：企業內部交易數據、客戶數據、運營數據
  - 外部數據：來自外部公開數據、第三方數據、社交媒體
資料蒐集方法與合法性
- 資料蒐集方式：
- - 手動蒐集: 問卷調查、面訪收集
  - 自動蒐集: 網路爬蟲、API接口、自動化工具第三方數據購買: 購買專業數據提供商的數據服務
- 資料遵循合法性（GDPR、CCPA）
- - GDPR: 歐盟一般資料保護規定 (GDPR)
  - CCPA: 加州消費者隱私法,為加州消費者提供隱私權和義務
資料處理：
- 數據品質：及時性、完整性、準確性、一致性.
- 資料協作：共享數據
- 資料清理：Data cleaning從資料庫中檢測和糾正(或刪除)損壞或不正確的記錄.
- 特徵工程(Feature engineering)又稱提取特徵(屬性、特性)的過程。將原始數據轉換為更適合機器學習模型使用的過程，常見的編碼技術：
- - 1)標籤編碼(Label Encoding): 依序將出現的類別編上流水號。
  - 2)一位有效編碼(One-Hot Encoding):將類別型數據轉換為二進位向量。
  - _{📌 意義：為每個類別新增一個欄位，該欄位代表是否為該類別，是為1，否為0。}
  _{📘 使用方式：適用於「無順序性」的類別資料，常見於大多數機器學習模型。}_{✅ 優點：不會產生誤解的順序或大小關係, 多數模型（如邏輯回歸、決策樹等）能正確理解.}_{⚠️ 缺點：維度膨脹(尤其類別數多時會造成資料稀疏).}
  - 3)虛擬編碼(Dummy Encoding)：為了避免「共線性」，把其中一欄省略，作為「基準值」
  - 多重共線性問題：在迴歸分析或其它統計模型中，指自變數(特徵)之間存在高度線性相關的情況。
ML模型訓練與評估流程
- 分割資料集：將原始資料區分不同子集，例如訓練集70%、驗證集15%、測試集15%
- 訓練模型：使用訓練集訓練模型
- 調參數：使用「驗證集」調整參考模形 超參數 選擇最佳模形。
- - 超參數(Hyperparameter)：是在機器學習和深度學習模型中，由開發者在訓練過程開始前設定的參數，並在多次試驗之間進行設定或調整，而不會在訓練過程中進行更新。超參數對模型的性能和結果有著重要影響，需要通過試驗和調整來尋找最佳值。
- 最終測試：使用測試集進行最終評估，以檢查模形的泛化性能。
- 交叉驗證：將不同子集的資料，如測試集及訓練集交替驗證。
大語言模型：(LLM)是一種語言模型，由具有許多參數的人工神經網路組成，透過監督式學習、非監督式學習等機器學習的方法對大量文字、圖片、聲音、影片進行訓練。
給AI的能力測驗：MMLU、GPQA
- MMLU (Massive Multitask Language Understanding): 用以評估大型語言模型在 “廣泛知識領域”的理解和推理能力，像是給AI做的一份綜合能力測驗。涵蓋了57個學科，範圍廣泛，包含：
- - _{STEM領域：例如數學、物理、化學、生物、電腦科學等。}
  - _{人文領域：例如歷史、哲學、文學、語言學等。}
  - _{社會科學領域：例如政治學、經濟學、心理學、社會學等。}
  - _{以及其他更專業的領域，例如法律、倫理學等。}
  - _{MMLU Pro: 聚焦14學科，以大量推理題取代知識題。}
- GPQA (Graduate-Level Google-Proof Q&A) : 是一個針對大型語言模型 (LLM) 設計的高難度問答資料集，用來測試模型在研究生程度的專業知識和推理能力。它著重於那些即使使用 Google 搜尋也很難找到直接答案的問題。GPQA 也涵蓋了多個學術領域，包含：
- - _{科學：例如生物學、化學、物理學、電腦科學等。}
  - _{人文學：例如歷史、哲學、文學等。}
  - _{社會科學：例如經濟學、政治學等。}
- LMSYS (Large Model Systems Organization): 給AI的能力測驗，透過全球使用者「盲測對決」的方式，評比各家LLMs的回應品質，並整理出排行。

🟩 第 3 章：AI演算法與模型（AI Algorithms and Models）

機器學習種類：
- 監督式學習
- 非監督式學習
- 半監督式學習
- 強化學習(增強式)

AI偏見
- 數據偏見(Data Bias)
- 算法偏見(Algorithmic Bias)
- 人類反饋和交互偏差(Interaction Bias)
- 系統偏差(System Bias)
如何避免偏見
- 多元化和平衡數據集
- 透明和可解釋的系統
- 持續監控和評估
- 多學科視角的合作
常見演算法：KNN、SVM、決策樹、K-Means、神經網路

演算法類型適用任務定義與核心概念特點及常見應用場景:

線性迴歸：適用於解決迴歸問題；
邏輯迴歸：適用於解決分類問題。
類神經網路：每個神經元都是一個激發函數，多個神經元連接在一起，類似生物神經網路的網狀結構，多層節點(神經元)組成的模型，通過學習數據中的模式進行預測、分類或其它任務。
- 機器學習核心概念是從資料中自行學會一套技能，並根據新的數據、自行更正預測錯誤的地方、不斷優化。學習過程分成：
- - 前向傳播(Forward-Propagation)
  - 反向傳播(Backward-Propagation)
- 類神經網路關鍵：
- - 輸入層：接收數據
  - 隱藏層：進行特徵提取和數據轉換
  - 輸出層：給出預測或結果
  - 學習：使用反向傳播法，通過調整權重和偏置來最小化誤差。
深度學習 (Deep Learning)：以多層神經網路(Deep Neural Network)為基礎的機器學習方法。
- 神經網路基礎：
- - 結構：輸入層、隱藏層、輸出層。
  - 神經元 (Neuron)：權重 (Weights)、偏置 (Bias)。
  - 激勵函數 (Activation Functions)： Sigmoid, Tanh, ReLU, Leaky ReLU, Softmax。
- 常見深度學習模型：
- - 卷積神經網路 (Convolutional Neural Networks, CNN)：核心概念（卷積核、池化層）、主要應用（圖像識別、物體檢測）。
  - 循環神經網路 (Recurrent Neural Networks, RNN)：處理序列數據、記憶能力、存在問題（梯度消失/爆炸）。
  - 長短期記憶網路 (Long Short-Term Memory, LSTM) 和門控循環單元 (Gated Recurrent Unit, GRU)：解決 RNN 梯度問題，應用於 NLP。
  - 生成對抗網路 (Generative Adversarial Networks, GAN)：生成器 (Generator) 和判別器 (Discriminator) 的對抗學習。
混淆矩陣(Confusion Matrix):是一種在「分類問題」中用來評估分類模型好壞與錯誤類型的工具，幫助我們挑對模型與評估方法。展示預測結果與實際分類之間的對比。
- 四個值：True Positive (TP)、True Negative (TN)、False Positive (FP)、False Negative (FN)；True/False是指預測和實際是否為一致。
- 用途：計算分類準確率、精確率、召回率、F1-分數(綜合衡量精確率和召回率)
準確 (Accuracy)：指的是「彈著點與靶心的距離」，也就是擊中目標的程度。
精確 (Precision)：指的是「所有彈著點是否集中」，也就是一致性或穩定性。
準確率：衡量整體預測的正確性；精確率：著重於陽性預測的可靠性。
指標計算：
模型擬合：
- 低度擬合 (Underfitting)：模型過於簡單，無法捕捉訓練數據中的基本模式，導致其在訓練數據和測試數據上都表現不佳。
- - 模型對不同訓練數據集的敏感度，稱為方差Variance; 低度擬合--->低方差
- 過度擬合 (Overfitting)：模型過於複雜，擁有太多參數，過於適應訓練數據中的細節和噪音，導致新的未見過的數據 (測試集)上泛化能力差。訓練資料表現好，但在測試資料或實際應用表現不佳。避免過度擬合：限制決策樹的最大深度、剪枝。

🟥 第 4 章：應用整合與部署（Application Integration and Deployment）

企業導入AI的三大面向：
- 政策：合規性標準、AI資安政策
- 技術：企業級安全方案、技術基礎設施
- 教育：風險意識培訓、員工教育訓練
RAI (Responsible AI)負責任的AI概念：
- 道德(Ethical)：確保AI的使用符合道德標準，包括數據收集與使用。
- 安全(Safe)：確保AI行為符合人類期望，確保其決策與運作方式不會導致危害.
- 導明(Transparent)：公開數據收集目的，保留決策記錄，並提供模型透明度。
- 合規(Compliant)：確保AI系統的開發和部署符合相關法律與法規要求。
AI治理與策略：
- 企業應制定明確的AI策略
- 企業需了解AI的機會與限制，確保安全與隱私，避免潛在風險。
- 資料治理與風險管理是AI治理的關鍵。
- 企業應確保AI模型的安全性與合規性。
- 針對AI應用，企業需要策略並進行風險評估。
AI模型部署選項：本地 / 雲端 / 混合
- 雲端AI (Cloud AI)：雲服務商提供AI運算資料，無需維護硬體，彈性擴展，使用最新LLM。
- 地端AI (On Prem AI)：AI運行在企業內部伺服器，數據掌控於內部，初期建置成本高。
- 混合雲：結合雲端及本地，透過VPN互通，兼顧安全性與彈性，降低雲端API成本，提升AI服務的穩定性。
RAG：檢索增強生成 (Retrieval-Augmented Generation) 是透過「檢索外部知識」來增強 AI 生成內容的準確性，特別適用於需要即時資訊或廣泛知識的應用場景。
- 檢索 (Retrieval)：先從LLM的外部知識庫 (如企業內部文件、向量資料庫、網頁搜尋) 中檢索相關資訊。檢索的核心技術：
- - 嵌入 Embeddings：將資料轉換成向量Vector，在多維空間中表示語意
  - 向量資料庫 (Vector Database)：利用最近鄰檢索 (Nearest Neighbor Search, NNS) 快速查找與輸入語句相關的向量。
  - 檢索算法：例如 FAISS (Facebook AI Similarity Search)，用於高效檢索相似內容。
  - 資料預處理：將文本分段並建立索引，以提升檢索效率。
- 增強 (Augmented)：將檢索到的資訊作為上下文，提供給LLM。
- 生成 (Generation)：LLM 根據檢索到的內容進行回應，而不是單純依賴模型內部記憶。
CAG：快取增強生成 (Cache-Augmented Generation) 透過「快取歷史回應」來加速 AI 生成，適用於高頻查詢、低變動性內容，能顯著降低計算成本並提升回應速度。
- 建立快取機制（Caching）：將結果存入快取，例如 Redis、Memcached、向量快取庫。針對相同或相似的查詢，直接去快取拿，避免 LLM 再計算。
- 快取策略（Cache Strategy）例如：用LRU淘汰較久未使用的快取，用TTL對於需要定期更新的內容 (如財報、新聞摘要)，設置有效期限。
Workflow Automation & Robotic Process Automation
- WA (Workflow Automation): 工作流程自動化，透過預設流程、API等，自動執行任務。
- RPA (Robotic Process Automation) : 機器人流程自動化，透過模擬人類操作UI

邊緣運算(Edge computing) 是一種分散式運算架構，將資料處理、儲存與應用分析的作業，從雲端伺服器(網路中心節點)「移到靠近資料來源(網路邏輯上的邊緣節點)（如感測器、手機、工廠設備等）」的「邊緣設備」上進行。特點：
✅ 低延遲：不用將資料回傳雲端，反應更即時。
✅ 節省頻寬：大量資料在本地處理，減少傳輸。
✅ 資料隱私性高：重要資料不需上傳雲端，安全性高。
✅ 即時決策能力強：適合工業、醫療、車聯網等場景。

🟪 第 5 章：在生產/正式環境中的AI維護與監控（Maintaining and Monitoring AI in Production）

優化模型推理(持續優化推理效能做法)
- 監控效能健康度
- 效能推斷調整
- 再訓練
- 硬體與框架環境優化
- 強化MLOps自動化流程
模型飄移：數據分佈或特徵隨時間推移，其性能逐漸下降。
- 資料飄移(Data Drift)：訓練模型所用資料和實際收到的新資料間的差異。
- 概念飄移(Concept Drift)：要預測的目標或趨勢隨時間改變時發生。
MLOps 自動化流程 (Machine Learning Operations) 是結合機器學習（ML）與 IT 運維（DevOps）的一套流程與實踐框架，用來協助：
- 將機器學習模型從實驗室推向生產/正式環境
- 持續監控、部署與更新模型
- 自動化並標準化機器學習生命週期管理
- MLOps 生命週期流程
MLOps 涵蓋完整 ML 專案的生命週期，可拆成下列階段：
- 1. 資料收集與前處理-建立數據管線，自動化 ETL 流程
- 2. 模型訓練與驗證
- 3. 模型儲存與版本管理-使用 Git 等工具追蹤與管理模型版本
- 4. 模型部署-將模型部署至生產環境（如 REST API、雲端平台）
- 5. 模型監控與再訓練-監測模型效能（如飄移、準確率下降），自動觸發重訓練與更新
- 6. CI/CD for ML- 建立自動化流程(如每次提交後自動訓練,測試與部署）
推斷調整：
- 量化(Quantization)：降低、壓縮模型的數值精度，提升執行速度。
- 剪枝(Pruning)：移除影響較小的神經元或權重，減少計算量，提高效率。
- 知識蒸餾(Knowledge Distillation)：用小模形學習大模形。
- 批次與管道化(Batching & Pipeline Optimization)：
- - 將多個請求合併，減少所需I/O.將模形分散在不同GPU/TPU執行.
模型需要重訓練的情境
- 數據變化
- 性能下降
- 目標變更
- 技術進步
- 錯誤修正
- 合規要求
AI專案利益關係人
- 內部關係人：
- - 公司高層管理者CxO開發團隊：AI工程師、機器學習工程師、數據科學家
  - 營運團隊：生產環境機器學習工程團隊、IT支持團隊產品和
  - 產品和市場團隊：產品經理、市場營銷專家
- 外部關係人：
- - 客戶：終端用戶、企業客戶
  - 供應商和合作夥伴：技術應商、業務合作夥伴
  - 監管機構：政府機構
  - 行業專家和顧問
系統透明度
- 操作透明度
- 數據透明度
- 決策透明度
- 變更透明度
- 結果透明度
- 合規與倫理透明度
有助提供透明度的文件：留下相關評估報告
- 超參數組態和設定文件：包含所有超參數組態和設定的可解釋特徵。
- 模型版本控制文件：建立模型版本的方式和做法。
- 模型訓練數據記錄：詳細描述訓練數據集，包括數據來源、數據清理過程及數據集分割策略。
- 模型評估報告：包括模型性能評估指標（如準確率、精確率、召回率、F1分數等）及對不同測試數據集的性能比較。
- 其它相關文件：
- - 模型解釋文檔：使用模型解釋技術（如SHAP值、LIME等）說明模型決策過程。變更記錄和版本控制：詳細記錄模型的每次更新、改進和變更，包括修改內容、原因和效果。合規性和倫理性評估報告：確保模型遵循相關法律法規和倫理標準，並提供相關評估報告。
評估系統升級
- 1)現狀分析：(效能指標)，目前系統關鍵效能指標(如處理速度、負載量、穩定性等)是否達到預定的服務水準(SLA)?
- 2)效能評估：(繼續用的可行性)，繼續現有軟硬體架構是否能滿足短期內(6個月或1年)的負載需求?若無法持續維運，哪個部分的問題最嚴重?
- 3)技術檢視：(新技術的成熟度)，業界是否已有更先進或更高效的新技術或框架?
- 4)新技術分析：(核心指標或功能)，新技術能取代/補強/解決現有系統的哪些瓶頸? 導入新技術所需的資源、預算、開發時程、人員培訓是否在公司可接收的範圍內?
- 5)功能比較：(與現有系統相比)，繼有與新技術/功能相比能帶來多少效益?是否cover升級過程中的投入成本? 升級是否有替代選項?
後記：
- ITS AI的內容範圍含概AI基本概念，從資料收集到機器學習、主要模型演算法、及AI導入與維運等概念，對於後續要再繼續深入AI進階領域如NLP、LLM等開發前，先有一個概念性瞭解是有一定的幫助。考試內容除了自己準備外，Tibame楊老師開立的2天課程對於考試的準備是相當加分，也順利取得證照。