嗨 我是CCChen
預計參加2025/05/17 iPAS AI應用規劃師 中級 第一場考試
倒數剩下5天, 開始加強學習了.我是報考科目一+科目二的
分享以下學習資料, 每天多準備30題練習,累積知識積少成多.
本文主要針對科目一+二+三 "計算題" 進行加強
iPAS真的很喜歡考計算題, 先準備幾題練習一下
📘 科目一:人工智慧技術應用與規劃(10 題)
1. 某二元分類模型的混淆矩陣如下:TP=70,FP=30,FN=10,TN=90。請問該模型的精確率(Precision)為何?
- A. 70%
- B. 80%
- C. 85%
- D. 90%
正確答案: B. 80%
解析:
精確率 = TP / (TP + FP) = 70 / (70 + 30) = 70 / 100 = 0.8,即 80%。
2. 某模型的召回率(Recall)為 0.75,精確率(Precision)為 0.6,請問其 F1 分數為何?
- A. 0.65
- B. 0.66
- C. 0.67
- D. 0.68
正確答案: B. 0.66
解析:
F1 分數 = 2 × (Precision × Recall) / (Precision + Recall) = 2 × (0.6 × 0.75) / (0.6 + 0.75) = 0.9 / 1.35 ≈ 0.6667,即約 0.66。
3. 在自然語言處理中,若一段文本共有 200 個詞,其中某詞出現 10 次,請問該詞的詞頻(Term Frequency, TF)為何?
- A. 0.05
- B. 0.1
- C. 0.2
- D. 0.5
正確答案: A. 0.05
解析:
TF = 該詞出現次數 / 總詞數 = 10 / 200 = 0.05。
4. 某企業導入 AI 模型後,預期每年可節省 150 萬元,導入成本為 300 萬元,請問投資回收期為多少年?
- A. 1 年
- B. 2 年
- C. 3 年
- D. 4 年
正確答案: B. 2 年
解析:
投資回收期 = 導入成本 / 年節省金額 = 300 / 150 = 2 年。
5. 某模型在訓練集上的準確率為 98%,在測試集上的準確率為 65%,可能的問題是?
- A. 欠擬合
- B. 過擬合
- C. 資料不足
- D. 模型太簡單
正確答案: B. 過擬合
解析:
模型在訓練集上表現良好,但在測試集上表現差,表示模型過度學習訓練資料的細節,導致泛化能力差。
6. 在使用 KNN 演算法時,選擇較大的 K 值可能導致?
- A. 模型過擬合
- B. 模型欠擬合
- C. 計算效率降低
- D. 模型穩定性降低
正確答案: B. 模型欠擬合
解析:
較大的 K 值使模型對訓練資料的細節不敏感,可能導致欠擬合。
7. 某模型的預測結果如下:TP=60,FP=20,FN=15,TN=105。請問模型的召回率(Recall)為何?
- A. 0.75
- B. 0.8
- C. 0.85
- D. 0.9
正確答案: B 0.8
解析:
召回率 = TP / (TP + FN) = 60 / (60 + 15) = 60 / 75 = 0.8,即 80%。
8. 在進行特徵標準化時,將資料轉換為平均值為 0,標準差為 1 的分布,稱為?
- A. 正規化
- B. 標準化
- C. 正態化
- D. 常態化
正確答案: B. 標準化
解析:
標準化是將資料轉換為平均值為 0,標準差為 1 的分布,有助於提升模型的收斂速度和準確性。
9. 某模型的精確率(Precision)為 0.85,召回率(Recall)為 0.9,請問其 F1 分數為何?
- A. 0.87
- B. 0.88
- C. 0.89
- D. 0.9
正確答案: A. 0.87
解析:
F1 分數 = 2 × (Precision × Recall) / (Precision + Recall) = 2 × (0.85 × 0.9) / (0.85 + 0.9) = 1.53 / 1.75 ≈ 0.874,即約 0.87。
10. 在進行詞嵌入(Word Embedding)時,常用的技術不包括?
- A. Word2Vec
- B. GloVe
- C. TF-IDF
- D. BERT
正確答案: C. TF-IDF
解析:
TF-IDF 是一種統計方法,用於評估詞語在文檔中的重要性,並不屬於詞嵌入技術。
📗 科目二:大數據處理分析與應用(10 題)
11. 某資料集的平均值為 60,標準差為 10,請問數值 80 的 Z 分數為何?
- A. 1
- B. 2
- C. 3
- D. 4
正確答案: B. 2
解析:
Z 分數 = (X - 平均值) / 標準差 = (80 - 60) / 10 = 20 / 10 = 2。
12. 在資料清理過程中,若發現某欄位有 15% 的缺失值,常見的處理方法不包括?
- A. 刪除含缺失值的資料列
- B. 使用平均值填補
- C. 使用中位數填補
- D. 隨機生成值填補
正確答案: D. 隨機生成值填補
解析:
隨機生成值可能引入噪聲,影響資料品質,通常不建議使用。
13. 某資料集共有 2000 筆資料,其中某特徵的值為 0 的筆數為 400,請問該特徵的稀疏率為何?
- A. 10%
- B. 20%
- C. 30%
- D. 40%
正確答案: B 20%
解析:
稀疏率 = 值為 0 的筆數 / 總筆數 = 400 / 2000 = 0.2,即 20%。
14. 在進行主成分分析(PCA)時,主要目的是?
- A. 增加資料的維度
- B. 降低資料的維度
- C. 增加資料的複雜度
- D. 提高資料的冗餘性
正確答案: B. 降低資料的維度
解析:
PCA 透過找出資料中的主成分,達到降維的目的,減少資料的維度。
15. 某資料集的平均值為 100,標準差為 20,請問數值 80 的 Z 分數為何?
- A. -1
- B. -2
- C. 1
- D. 2
正確答案: A. -1
解析:
Z 分數 = (X - 平均值) / 標準差 = (80 - 100) / 20 = -20 / 20 = -1。
16. 在資料分群分析中,常用的演算法不包括?
- A. K-means
- B. 階層式分群
- C. DBSCAN
- D. 線性回歸
正確答案: D. 線性回歸
解析:
線性回歸是用於預測的監督式學習方法,不適用於分群分析。
題目 17:
某醫療機構針對癌症患者進行預測性分析,收集了 500 名患者的數據,特徵包括年齡、血壓、體重、吸菸狀況、家族病史等 10 個特徵。為了降低模型計算負擔,應用 PCA 分析,將 10 個特徵降維至 3 個主成分,解釋變異量分別為 40%、30%、20%。請問這 3 個主成分共解釋了多少百分比的數據變異量?
- A. 70%
- B. 80%
- C. 85%
- D. 90%
正確答案:D 90%
解析:
變異量解釋總比例 = 40% + 30% + 20% = 90%
題目 18:
某企業計劃對 1000 筆交易數據進行異常檢測,其中 50 筆被標記為異常交易。當使用 KNN 模型進行異常檢測時,模型預測結果如下:
- 正確標記為異常:45 筆
- 錯誤標記為異常:15 筆
- 錯誤標記為正常:5 筆
請問此模型的 F1 分數為多少?
- A. 0.75
- B. 0.8
- C. 0.85
- D. 0.9
正確答案: C. 0.85
解析:
Precision = TP / (TP + FP) = 45 / (45 + 15) = 45 / 60 = 0.75 Recall = TP / (TP + FN) = 45 / (45 + 5) = 45 / 50 = 0.9 F1 Score = 2 × (Precision × Recall) / (Precision + Recall) = 2 × (0.75 × 0.9) / (0.75 + 0.9) = 1.35 / 1.65 ≈ 0.818 ≈ 0.85
題目 19:
在進行時間序列預測時,企業使用 ARIMA 模型對銷售數據進行分析。經模型訓練後,得出的預測值為 1200 萬美元,而實際銷售數據為 1100 萬美元。請問此預測模型的絕對百分比誤差 (MAPE) 為多少?
- A. 8.33%
- B. 9.09%
- C. 10%
- D. 12%
正確答案: B. 9.09%
解析:
MAPE = |實際值 - 預測值| / 實際值 × 100% = |1100 - 1200| / 1100 × 100% = 100 / 1100 × 100% ≈ 9.09%
題目 20:
某數據集包含 5000 筆交易記錄,其中 450 筆被標記為詐欺交易。模型對詐欺交易的預測結果如下:
- 正確標記為詐欺:400 筆
- 錯誤標記為詐欺:150 筆
- 錯誤標記為正常:50 筆
請問此模型的 AUC 值若為 0.85,則其 Gini 指數 (Gini Index) 為多少?
- A. 0.60
- B. 0.65
- C. 0.70
- D. 0.75
正確答案: B. 0.70
解析:
Gini 指數 = 2 × AUC - 1 = 2 × 0.85 - 1 = 1.7 - 1 = 0.70
我是CCChen 一起努力準備"iPAS AI應用規劃師 中級"