嗨 我是CCChen
今天5/17剛參加完 “AI應用規劃師 中級 05/17 第一場 考試”
感謝AI學習Line群~群友們分享記憶的考題,目前群裡累計約有100位以上群友都是有通過AI應用規劃師初級。大家的學習與成長很快速,也越來越專業了。在此我統一彙整題目如下, 供大家參考。
AI應用規劃師 中級 05/17 第一場 考試的題目收集很重要, 原因如下:
1. 目前iPAS官網還不會公布考古題目,考生只能自己收集重點與官方樣題練習。
2. 藉由應考的考生憑記憶蒐集實際考試題目,可以知道考試方向與題型,對於準備考試,是很重要的參考方向。
3. 知道考甚麼? 考多難? 考多廣? 很重要,往往知道題目題型佔比與出題方向,考生就能針對高頻率出題主題去加強學習,提高得分與合格機會。
4. 每一次的考題收集,都是為了下一次考試的參考與準備,收集越多訊息,合格機會就越高。
本篇文章分別記錄科目一+二+三 部分考試題目的關鍵字, 大家再去自行應用與擴展範圍.
AI應用規劃師 中級 05/17 第一場~科目一 人工智慧技術應用與規劃
考試題目: 50題 考試時間: 90分鐘
考題蒐集:
1. BERT與GPT的差異?
BERT是雙向訓練 GPT是單向訓練
2. PCA的第一個主成分相關?
第一個主成分 (First Principal Component, PC1) 是 PCA 中最重要的一個方向,它是數據集中變異數最大的方向。
3. PCA主成分分析基於甚麼?
基於最大變異數原則。
4. CNN池化層目的?
用於減少特徵圖 (Feature Map) 的尺寸,同時保留重要特徵。其主要目的是降低計算量、防止過擬合、增強模型的容忍度和特徵不變性。
5. 電腦視覺的物件偵測與物件分割 約考2~3題
6. 哪一類模型通常不涉及生成機率?
判別式模型 (Discriminative Models) 如邏輯迴歸,SVM 通常不涉及生成機率。
7. VAE的KL散度應用?
用於衡量生成模型中的潛在空間分佈與標準正態分佈之間的差異。
8. 語意分析與語意分割的應用?
9. 圖片題 圖中有羊與狗, 問選項對應 物件偵測,物件分析,語意分割?
考四張圖片對應abcd單字意思

10. 詞崁入原理?
詞嵌入 (Word Embedding) 是將文字轉換為數值向量的一種方法,其目的是將語義上相似的詞表示為相似的向量,以捕捉詞語之間的語義關係。
11. 數據飄移相關考2題, 數據飄移用哪個評估方式?
12. K-mean與DBSCAN差異?
K-means: 基於距離計算,適用於球形、均勻分布數據,對噪聲敏感,需預先設定 KKK 值。
DBSCAN: 基於密度計算,可檢測任意形狀聚類,具有抗噪聲能力,但對參數 ε\varepsilonε 和 MinPtsMinPtsMinPts 敏感。
13. 語意切割是甚麼?
語義切割 (Semantic Segmentation) 是計算機視覺中的一項技術,用於將圖像中的每個像素分配到一個特定的分類標籤,以便對圖像中的不同對象或區域進行分類和標註。
14. HITL於模型自動優化的應用?
HITL (Human-in-the-Loop) 是指在 機器學習模型訓練、調整和優化過程中引入人工干預,以改善模型的準確性和可解釋性。它將人類專家知識與自動化模型訓練相結合,用於提高模型性能、糾正誤差和避免偏差。
15. 選項中哪一個現象屬於線性回歸?
16. 超參數調整是哪一個技術?
超參數調整 是機器學習和深度學習中的 重要技術,用於尋找最佳參數組合,以優化模型性能。常見方法包括:Grid Search、Random Search、Bayesian Optimization、Genetic Algorithm、Hyperband 等。建議: 當參數空間較大時,優先考慮 隨機搜索或貝葉斯優化;當計算資源充足且需全面搜索時,選擇 網格搜索。
17. MLflow相關?
MLflow 是一個開源平台,用於管理 機器學習項目的完整生命週期 (Machine Learning Lifecycle),包括 實驗追蹤、模型訓練、部署和模型註冊 等功能。它支援多種開發環境 (如 TensorFlow、PyTorch、Keras) 並與常見雲端平台集成。
18. 知識蒸餾?
知識蒸餾 (Knowledge Distillation) 是一種 模型壓縮技術,通過將大型模型 (Teacher Model) 的知識遷移到輕量級模型 (Student Model),從而實現 模型壓縮、加速推理 並保持較高的預測精度。
19. 模型壓力測試?
模型壓力測試 (Model Stress Testing) 是指對機器學習模型進行極端數據輸入、異常條件設置或高並發負載測試,以評估模型的 穩定性、可靠性和容錯能力。
這種測試方法通常應用於金融風險管理、醫療系統檢測、自動駕駛系統等對模型準確性和穩定性要求較高的場景。
20. AI模型於實驗跟蹤與管理要用哪個選項? Git , DVC ??
21. LoRA?
LoRA (Low-Rank Adaptation) 是一種針對 大型預訓練模型 (Large Language Models, LLMs) 進行高效微調 (Fine-Tuning) 的技術。
它通過引入 低秩矩陣分解 (Low-Rank Matrix Decomposition),在保持預訓練模型權重不變的前提下,實現參數量的顯著減少,從而降低訓練成本並提升訓練速度。
22. RAG相關?
23. 剪枝技術?
剪枝 (Pruning) 是指在 神經網絡 (Neural Networks) 中,根據一定的規則移除不重要的神經元或權重,以減少模型大小、降低計算成本,同時儘量保持模型性能的方法。
24. 決策樹剪枝目的?
決策樹剪枝 (Pruning) 是指在決策樹構建完成後,通過移除一些不必要的分支或節點,從而降低模型複雜度、減少過擬合並提高模型泛化能力的一種技術。
25. RMSE均方根誤差?
RMSE (均方根誤差, Root Mean Squared Error) 是用於衡量預測模型預測值與實際值之間偏差的一種評估指標。它通過計算預測誤差的平方均值再開平方根,以避免誤差抵消並放大較大誤差對模型評估的影響。
26. MLops 相關考3題
27. AI佈署相關
28. AI導入相關
29. 微調應用?
30. 多模態相關考2題
31. 何者無法預防網路爬蟲有效封鎖?
32. 電商平台客戶選擇歌曲與購賣行為屬於哪種模型?
33. 醫療影用腫瘤的邊界判定,屬於何種技術?
在醫療影像分析中,對腫瘤進行邊界判定屬於 圖像分割 (Image Segmentation) 技術範疇。
34. 邊緣計算的優勢?
邊緣計算 (Edge Computing) 是將計算和數據存儲從中心化的雲端遷移到靠近數據源(如設備、感測器、IoT 設備)的邊緣節點進行處理的技術。
它有效減少數據傳輸延遲、降低帶寬需求,適用於實時數據處理場景。
35. 偏見偵測的技術?
36. 模型壓縮影響?
37. NLP相關?
38. 提示攻擊的影響?
提示攻擊 (Prompt Injection Attack) 是針對 生成式 AI 模型 (如 GPT, ChatGPT, BERT) 的攻擊方式,攻擊者通過設計特定的輸入提示 (Prompt),引導模型生成不良或惡意內容,從而破壞系統的預期行為。
39. 容器化功能?
容器化 (Containerization) 是一種將應用程序及其依賴環境打包成單一可執行單元(即容器)的技術。
它允許應用程序在不同計算環境中保持一致性,並且易於部署、擴展和管理。
40. 模型重訓練Retraining目的?
重訓練 (Retraining) 是指基於新數據、更新數據或特定需求,重新調整 AI 模型的參數或結構,以提升模型性能、適應環境變化、降低偏差或應對數據漂移的過程。
41. 遷移學習技術?
遷移學習 (Transfer Learning) 是一種機器學習技術,它通過將已訓練模型中的知識遷移到新的任務或數據集上,從而縮短訓練時間並提升模型性能。
它適用於新任務數據量較少但與原始任務相關的場景,如圖像分類、語音識別和自然語言處理 (NLP)。
AI應用規劃師 中級 05/17 第一場~科目二 大數據處理分析與應用
考試題目: 50題 考試時間: 90分鐘
考題蒐集:
1. 鑑別式AI與生成式AI的應用差異?
2. 分析資料全體分布與趨勢應用哪個圖表?
3. PCA降維應用?
4. t-SNE相關?
5. 虛無假設檢定應用?
虛無假設檢定 (Null Hypothesis Testing),又稱 假設檢定 (Hypothesis Testing),是統計學中用於檢驗樣本數據是否支持某一假設的推論方法。
其核心在於對數據進行統計檢驗,判斷觀察結果是否由隨機性引起,還是具有統計學上的顯著性。
6. 卡方檢定與t檢定差異?
卡方檢定 (Chi-square Test) 和 t 檢定 (t-test) 都是統計學中常用的檢定方法,但它們適用於不同數據類型,檢測不同統計問題。
t 檢定 (t-test)
用於比較 兩組樣本均值之間的差異,檢測樣本均值是否存在顯著性差異。
卡方檢定 (Chi-square Test)
用於檢測 類別變量之間的相關性或適合度,判斷觀察頻數與期望頻數之間的差異是否顯著。
7. 偏態分布的應用?
偏態分布 (Skewed Distribution) 是指數據分佈不對稱,數據點集中於一側而尾部延伸較長的分佈形式。
8. 公司薪資呈現偏右態分布且數據點集中於一側而尾部延伸較長的分佈形式, 有何影響?
平均值被拉高,受極端高值影響,向右偏移
9. 資料倉儲與資料湖儲存差異?
資料倉儲僅存儲結構化數據,而資料湖可存儲(結構化、半結構化和非結構化)原始數據。
10. 常態分布應用判斷?
常態分布 (Normal Distribution),又稱 高斯分布 (Gaussian Distribution),是一種對稱的鐘形分佈,用於描述數據集中大多數數據點分佈在平均值附近且呈現對稱性。
11. 四分衛數應用考2題
四分位數 (Quartiles) 是統計學中用於描述數據集分佈的一種方法,將數據按照大小排序後分為 四個等分區間,用於觀察數據的集中趨勢和變異程度。
四分位數廣泛應用於 數據分析、異常值檢測、風險管理、品質控制 等場景。
四分位距 (IQR) = Q3−Q1
四分位數應用 - 異常值檢測 異常值判斷標準:
· 異常值下界: Q1−1.5×IQRQ1 - 1.5 \times IQRQ1−1.5×IQR
· 異常值上界: Q3+1.5×IQRQ3 + 1.5 \times IQRQ3+1.5×IQR
12. Q-Q圖應用?
Q-Q 圖 (Quantile-Quantile Plot) 是統計學中用於檢查數據分佈與理論分佈(如正態分佈)是否一致的圖形工具。它將 樣本數據的分位數 與 理論分布的分位數 進行對比,並將兩者繪製成散點圖,以觀察數據分佈趨勢。
13. 歐盟GDPR應用範圍?
14. GDPR (一般數據保護條例) 是歐盟的數據保護法規。它適用於 收集、存儲、處理和傳輸歐盟個人數據的所有組織,無論該組織是否位於歐盟內部。
15. 差分概念?
差分 (Difference) 是數學和數據分析中的一種基本操作,用於計算序列中相鄰數據點之間的變化量。它廣泛應用於時間序列分析、統計學、信號處理和機器學習中,以觀察趨勢變化、檢測異常和數據平穩化。
16. 電商平台收集客人的留言與評論資料,屬於何種資料類型?
17. Z分數的公式原理?
Z 分數 (Z-Score) 是統計學中用於衡量數據點與樣本平均值之間距離的標準化值,通常用於檢測數據中的異常點或比較不同數據集中的數據點。
18. 計算題 Z分數?
例如: 某次考試的平均分數為 70 分,標準差為 10 分。
若一名學生的成績為 90 分,請計算 Z 分數 (90-70)/10=2
19. 變異數考2題?
20. 變異數 (Variance) 是統計學中用於衡量數據分佈的一種指標,它表示數據點與均值之間偏離程度的平方平均值。變異數反映數據的波動性或離散程度,即數據分佈的集中或分散狀況。
21. Softmax相關?
Softmax 函數 是機器學習和深度學習中的一種激活函數,用於將輸入數據轉化為 概率分布。它通常用於 多分類問題 (Multi-class Classification) 中,用於將模型輸出轉換為概率值,並確保所有輸出之和為 1。
22. 時間序列分析ARIMA的I代表?
ARIMA 模型 是一種用於 時間序列預測 的統計模型,由三個部分組成:AR (自回歸)、I (整合)、MA (移動平均)。其中,I (Integrated) 表示 差分階數 (Order of Differencing),用於將 非平穩時間序列轉化為平穩序列。
AI應用規劃師 中級 05/17 第一場~科目三 機器學習技術與應用
考試題目: 50題 考試時間: 90分鐘
考題蒐集:
1. 準確率的計算公式?
準確率 (Accuracy) 是分類模型中最常用的衡量指標,用於計算模型對樣本的正確預測比例。 準確率 (Accuracy) = TP+TN/TP+TN+FP+FN
2. 計算題F1分數計算, 例如精確率0.9 召回率0.1 F1是多少?
公式 2x(精x召)/(精+召) 記憶口角 2叉叉除加
F1= 2(0.9x0.1)/(0.9+0.1)=0.18
3. Batch size 從64改為256的影響?
4. 回歸模型輸出函式用哪種?