iPAS AI應用規劃師考試攻略 : 資料處理與分析概論模擬試題與重點整理 CCChen

CHENG-CHIEN CHEN

發佈於CChen的AI學習

更新於 2025/03/24私密發佈閱讀時間約 13 分鐘

嗨我是CCChen:

自114年起，iPAS將「巨量資料分析師」與「機器學習工程師」能力鑑定整合至「AI應用規劃師」

其中「巨量資料分析師」的考試科目"資料處理與分析概論" 也是包含在AI應用規劃師的考試範圍中, 下表 L112 資料處理與分析概念, 基本上大同小異, 占比預估為20~30%, 應該會出題5~10題.

因此, 我將「巨量資料分析師」公開的考試範例題目"資料處理與分析概論"35頁題目資料中, 利用AI工具 "NotebookLM" 進行重點整理, 方便學習.

分享整理結果給大家參考, 一起為"AI應用規劃師"備考努力學習.

然後, 再模擬題目類型與出題概念, 提供40題相關範例題目供刷題

提醒: 以下題目為AI模擬生成, 僅供個人參考, 非官方正式題目.

1.下列何者不是資料前處理的步驟？ (A) 資料清理（Cleaning） (B) 資料操弄（Manipulation） (C) 資料建模（Modeling） (D) 資料變形（Reshaping）答案：(C)

2.假設您收到一份包含姓名、性別、年齡等1000位用戶的Facebook資料，在R語言中，最適合用哪種資料結構來儲存？ (A) 資料框架（Data frame） (B) 串列（List） (C) 向量（Vector） (D) 矩陣（Matrix）答案：(A)

3.如何判斷資料中是否存在偏差甚大的離群值？ (A) 將該欄位資料繪製成盒鬚圖（Box plot） (B) 將資料以直方圖（Histogram）表示 (C) 計算平均值與中位數的差異 (D) 以上皆是答案：(D)

4.下列哪一項不屬於資料倉儲的特性？ (A) 主題導向的（Subject-oriented） (B) 經過整合的（Integrated） (C) 不會流失的（Non-volatile） (D) 屬於 OLTP 系統答案：(D)

5.下列何者為資料遺缺的狀況？ (A) 完全隨機誤差（Missing Completely at Random，MCAR） (B) 隨機誤差（Missing at Random，MAR） (C) 非隨機誤差（Not Missing at Random，NMAR） (D) 以上皆是答案：(D)

6.繪製下列何種圖表，資料集內至少需要包含兩個變量？ (A) 直方圖（Histogram） (B) 圓餅圖（Pie chart） (C) 散佈圖（Scatter plot） (D) 盒鬚圖（Box plot）答案：(C)

7.下列何者不屬於資料的相關性分析（Correlation Analysis）方法？ (A) 卡方檢定 (B) 相關係數 (C) 共變異數 (D) 四分位數答案：(D)2

8.從SQL Database的角度，若要輕鬆計算不同性別的平均體重，資料表欄位應如何設計？ (A) 男性，女性，其他，男性體重，女性體重，其他體重 (B) 性別，男性體重，女性體重 (C) 性別，體重 (D) 以上皆非答案：(C)

9.哪種圖表適合展示時間序列（Time Series）類型的資料？ (A) 圓餅圖（Pie chart） (B) 散佈圖（Scatter plot） (C) 折線圖（Line chart） (D) 長條圖（Bar chart）答案：(C)

10.下列何者是利用時間序列來觀察不同維度之間隨時間變化的資訊？ (A) 勝率比（Odds ratio） (B) 平行座標圖（Parallel coordinates） (C) 目標投影追蹤（Targeted projection pursuit） (D) 運行圖（Run chart）答案：(D)

11.若將一群客戶的消費額（最大值3800元，最小值1800元）經最小最大正規化（Min-Max Normalization）轉換至0到1的範圍，消費額2300元會被轉換為多少？ (A) 0.2 (B) 0.25 (C) 0.4 (D) 0.5 答案：(B)

12.下列何者不是常用來儲存log file的資料格式？ (A) Doc (B) Csv (C) Textfile (D) Parquet 答案：(A)

13.下列哪種方法可以用來進行特徵轉換？ (A) Diffusion maps (B) Locally-linear embedding (C) Relational perspective map (D) 以上皆是答案：(D)

14.下列何者不是降維的好處？ (A) 減少運算時間與儲存空間 (B) 移除共線性資料能有效提高線性模型的效能 (C) 當資料維度降至 2～3 維時，能很容易的直接視覺化展示資料分佈 (D) 降維後的資料集訊息量增加，不會減少答案：(D)

15.下列何項不是迴歸分析常用的維度縮減技術？ (A) 係數縮減法（Shrinkage） (B) 逐步迴歸法（Stepwise Regression） (C) 子集挑選法（Subset Selection） (D) 事後修剪法（Post-pruning）答案：(D)

16.欲擷取網頁內容時，若網頁內容改變但網址不變，較可能為何種請求方法？ (A) POST (B) PUT (C) GET (D) READ 答案：(A)

17.下列何者並非現今巨量資料系統架構的設計趨勢？ (A) 主從式分散架構（Master-Slave） (B) P2P 架構（P2P Architecture） (C) 分片機制（Sharding） (D) 高度集中化運算平台（Centalized Computing Platform）答案：(D)

18.關於巨量資料平台Hadoop，下列敘述何者正確？ (A) Name-Node 節點需要配置較多的記憶體，用來儲存文件資料 (B) 在 HDFS（Hadoop Distributed File System）上的文件，不支援隨機存取 (C) 支援一次寫入一次存取，確保資料完整存取 (D) 以上皆是答案：(B)

19.下列何者不是HDFS（Hadoop Distributed File System）的特色？ (A) 不需要 Master Node 來管理集群 (B) 可以將文件分散式儲存 (C) 適合儲存文字型資料 (D) 自動備份存入的檔案答案：(A)

20.在撰寫MapReduce的程式時，下列何者操作不適合在Reducer中實現？ (A) x - y (B) x * y (C) x + y (D) count 答案：(A)

21.若要比較兩公司員工薪資的離散程度，應採用下列哪種統計量？ (A) 變異數 (B) 全距 (C) 平均數 (D) 變異係數答案：(D)

22.盒鬚圖（Box plot）沒有顯示哪個統計量？ (A) 第一四分位數 (B) 中位數 (C) 第三四分位數 (D) 標準差答案：(D)

23.下列何種情形適合使用單因子變異數分析（One-way Analysis of Variance）？ (A) 檢驗數據是否服從常態分配 (B) 比較某班級男生與女生數學成績的變異數 (C) 比較兩間輪胎工廠，輪胎平均使用年限是否不同 (D) 比較某工廠 4 部機器由不同人員操作下，其每小時平均產量是否不同答案：(D)

24.二個獨立事件 A 與 B，機率分別是 60%與 40%，則 Pr{A∪B}=？ (A) 50% (B) 20% (C) 76% (D) 100% 答案：(C)

25.下列敘述何者正確？ (A) 若一組資料的最大值為 90，最小值為 0，其中位數為 60，則此資料為右偏 (B) 一組資料的所有數值與其算術平均數的差，其總和為 0 (C) 若二組資料有相同標準差，且平均數皆為正數，則平均數愈大者，變異係數愈大 (D) 兩組不同單位的資料可藉標準差來比較資料之離散程度答案：(B)

26.若有四群學生的人數分別為 10、20、30、40 人，平均體重依序為 60、70、55、65 公斤，則全部學生的平均體重是？ (A) 60 公斤 (B) 62.5 公斤 (C) 65 公斤 (D) 67.5 公斤答案：(B)

27.有一汽車業務員隨機拜訪 3 位客戶，依過去經驗客戶購買車的機率為 10%，試問這三位客戶中，至少有一位會購買車的機率？ (A) 23.1% (B) 25.1% (C) 27.1% (D) 29.1% 答案：(C)

28.統計資料分為離散型與連續型，請問下列何項與其他不同？ (A) 體重 (B) 身高 (C) 成績 (D) 國家數目答案：(D)

29.關於連續型機率分配，下列敘述何者正確？ (A) 常態分配中，平均值為 0、變異數為 0 之分配，稱為標準常態分配 (B) 已知均勻分配為 U(a, b)，則平均值為(a-b)/2 (C) 伽瑪分配是指數分配的特例 (D) 已知隨機變數為標準常態分配，則取其平方為卡方分配且自由度為 1 答案：(D)

30.下列何者不是卡方檢定（Chi-square Test）的功能？ (A) 適合度檢定 (B) 獨立性檢定 (C) 變異數檢定 (D) 齊一性檢定答案：(C)

31.下列何者為「非監督式學習」演算法？ (A) 決策樹（Decision tree） (B) 集成方法（Ensemble Methods） (C) K 平均法（K-Means） (D) 支援向量機（Support Vector Machine）答案：(C)

32.關於非監督式學習，下列敘述何者正確？ (A) 意指不需要人看著就能學習 (B) 常見的集群分析屬於非監督式學習 (C) 常見的分類模型屬於非監督式學習 (D) 以上皆非答案：(B)

33.關於 K 平均法（K-means）的分群，下列敘述何者不正確？ (A) 一開始群的中心點可以是隨機選擇的 (B) 每次分群的結果都一模一樣 (C) 每次分群結果必須讓組內平方和最小 (D) 一開始必須告知該演算法欲分群的群數答案：(B)

34.下列何種分群演算法，是基於「密度」概念所設計的？ (A) OPTICS 演算法（Ordering Points To Identify the Clustering Structure） (B) K 平均法（K-means） (C) 聚合式階層分群法（Agglomerative Hierarchical Clustering） (D) 社群偵測（Community Detection）答案：(A)

35.計算資料百分位數的 R 指令為何？ (A) quantile (B) percent (C) median (D) sum 答案：(A)

36.在 R 語言中使用 arules 套件，下列哪一個指令可將 dataset 轉換成關聯規則分析用資料？ (A) as(arules, "dataset") (B) as(dataset, "arules") (C) as(transactions, "dataset") (D) as(dataset, "transactions") 答案：(D)

37.欲呈現二維平面中檢視資料點之間的關係（例如：相似度或距離），一般會使用下列哪種方法？ (A) 詞頻-逆文檔頻率（Term Frequency Inverse Document Frequency，TF-IDF） (B) 多維尺度法（Multidimensional Scaling，MDS） (C) 最鄰近搜索（Approximate Nearest Neighbor，ANN） (D) 社會網路分析（Social Network Analysis，SNA）答案：(B)

38.有一個數列1...，若要找出此數列中的離群值，下列何者計算是不必要的？ (A) 計算此數列的平均數 (B) 計算此數列的標準差 (C) 計算此數列的峰度係數 (D) 將各數值標準化答案：(C)

39.有一筆資料[1,2,5,6,10,22,...]，下列何種方式無法測量數列集中趨勢？ (A) 平均數 (B) 標準差 (C) 眾數 (D) 中位數答案：(B)

40.下列何者不屬於非監督式學習？ (A) 局域離群因子（Local Outlier Factor） (B) 獨立成份分析（Independent Component Analysis） (C) 最近鄰法（Nearest Neighbor Methods） (D) 奇異值分解（Singular Value Decomposition）答案：(C)

我是CCChen:

如果你覺得這篇文章對你有幫助，請幫我按個愛心，也歡迎按讚 + 收藏 + 分享，我將持續分享更多 AI 學習攻略、考試技巧、AI 工具應用等精彩內容！

留言

留言分享你的想法！

CCChen的沙龍

510會員

85內容數

關於學習經驗分享, 學習心得, 學習方法與資料整理. 1.已取得2024年 iPAS 淨零碳規劃管理師初級合格 2.已取得2024年 iPAS 食品品保工程師初級合格 3.已取得2024年金融研訓院永續發展基礎能測驗合格 4.已取得2025年資策會生程式AI能力認證合格

CCChen的沙龍的其他內容

2025/04/29

iPAS AI應用規劃師初級05/03 考前題目練習(二)CCChen

嗨我是CCChen iPAS AI應用規劃師初級第二場測試預計於2025/05/03考試, 您準備好了嗎? 分享考前倒數, 整理的一些 "科目二生成式AI應用與規劃" 的練習題目, 多少檢驗自己的學習效果: No-Code / Low-Code 基本概念模擬題（共1

2025/04/29

iPAS AI應用規劃師初級05/03 考前題目練習(二)CCChen

2025/04/29

iPAS AI應用規劃師初級05/03 考前題目練習(一)CCChen

嗨我是CCChen iPAS AI應用規劃師初級第二場測試預計於2025/05/03考試, 您準備好了嗎? 分享考前倒數, 整理的一些 "科目一" 的練習題目, 多少檢驗自己的學習效果: 資料分析與處理實體題（共10題 1. 你收到一份資料集，有大量空白（null）欄位，

2025/04/29

iPAS AI應用規劃師初級05/03 考前題目練習(一)CCChen

2025/04/28

iPAS品牌企劃師 (初級) 科目二行銷企劃實務整理CCChen

嗨我是CCChen 已報名參加2025/05/24 品牌企劃師初級測試根據官方公告簡章與評鑑主題，個人進行加強學習的資料整理，分享整理如下: 本次整理參考資料: 1. 114年度品牌企劃師能力鑑定簡章。 2. 114年品牌企劃師 (初級)能力鑑定_行銷企劃實務樣題.

2025/04/28

iPAS品牌企劃師 (初級) 科目二行銷企劃實務整理CCChen

看更多

你可能也想看

Dr HI的眼科沙龍

光的選擇，就是視力的選擇— Philips 飛利浦 A5 軒博全光譜智能LED護眼檯燈

大家好，我是一名眼科醫師，也是一位孩子的媽身為眼科醫師的我，我知道視力發展對孩子來說有多關鍵。每到開學季時，診間便充斥著許多憂心忡忡的家屬。近年來看診中，兒童提早近視、眼睛疲勞的案例明顯增加，除了3C使用過度，最常被忽略的，就是照明品質。然而作為一位媽媽，孩子能在安全、舒適的環境

#momo購物網#Philips飛利浦#軒博

2025/04/30

Dr HI的眼科沙龍

光的選擇，就是視力的選擇— Philips 飛利浦 A5 軒博全光譜智能LED護眼檯燈

#momo購物網#Philips飛利浦#軒博

2025/04/30

方格子 vocus 官方沙龍

♥️ 5 月主題活動：我的媽呀！母親節快樂！

我的「媽」呀！母親節即將到來，vocus 邀請你寫下屬於你的「媽」故事——不管是紀錄爆笑的日常，或是一直想對她表達的感謝，又或者，是你這輩子最想聽她說出的一句話。也歡迎你曬出合照，分享照片背後的點點滴滴 ♥️ 透過創作，將這份情感表達出來吧！🥹

#母親節#媽媽美照#媽媽日常

2025/05/01

方格子 vocus 官方沙龍

♥️ 5 月主題活動：我的媽呀！母親節快樂！

#母親節#媽媽美照#媽媽日常

2025/05/01

廣告雜誌

從資料清洗到 RAG，大型語言模型的必需品，做出專屬企業的 AI 知識庫！

在當今快速變化的數位時代，企業面臨著前所未有的數據處理需求。為了應對這些挑戰，企業紛紛建立自己的大型語言模型（LLM），利用大量數據進行訓練，讓模型能夠理解並生成自然語言，從而實現人機協作，優化業務流程並提升客戶體驗。

#廣告雜誌#專欄#cacaFly

2024/07/31

廣告雜誌

從資料清洗到 RAG，大型語言模型的必需品，做出專屬企業的 AI 知識庫！

#廣告雜誌#專欄#cacaFly

2024/07/31

林的怪東西集中地

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習#人工智慧#數據

2024/07/30

林的怪東西集中地

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習#人工智慧#數據

2024/07/30

普普文創

【文創漫談】程式設計與技術能力 | 如何利用AI | 增強能力

程式設計與技術能力在現代社會中的重要性越來越明顯，尤其是在人工智能（AI）和自動化技術迅速發展的背景下。理解編程語言，如Python、R等，以及熟悉相關技術架構和工具，能夠幫助個人在這樣的環境中更好地工作。這種能力不僅對技術專業人士至關重要，也對非技術領域的人士日益重要，因為基礎的程式設計知識已

#文創漫談#程式設計與技術能力#如何利用AI

2024/07/29

普普文創

【文創漫談】程式設計與技術能力 | 如何利用AI | 增強能力

#文創漫談#程式設計與技術能力#如何利用AI

2024/07/29

普普文創

【文創漫談】數據分析與解讀 | 如何利用AI | 增強能力

數據分析與解讀隨著數據的爆炸式增長，能夠分析、解讀和應用數據的能力變得至關重要。這包括熟悉數據分析工具和技術，如統計學、數據挖掘、機器學習等。然而，僅靠短時間的數據分析並不足以提供深入見解。要熟悉數據分析工具和技術，如統計學、數據挖掘和機器學習，可以從以下幾個方面入手：基礎知識的學習

#文創漫談#數據分析與解讀#如何利用AI增強能力

2024/07/28

普普文創

【文創漫談】數據分析與解讀 | 如何利用AI | 增強能力

#文創漫談#數據分析與解讀#如何利用AI增強能力

2024/07/28

你的職涯陪伴者葉紹平(平哥)

AI時代下我們需要具備的職能有哪些

本文討論了在AI時代下我們需要具備的職能，例如提問力、判斷力和專業能力。同時也提到了在使用AI時需要注意的事情，以及一些問答希望可以跟讀者有所互動與交流。另外作者也分享了自己使用AI工具的心得，並期待可以幫助初學者更快地瞭解如何應對AI的基礎邏輯。

#初學者AI指南#AI時代職能#AI工具使用

2024/07/26

你的職涯陪伴者葉紹平(平哥)

AI時代下我們需要具備的職能有哪些

#初學者AI指南#AI時代職能#AI工具使用

2024/07/26

張家惟 Evan Chang的沙龍

產品經理要懂哪些 AI 名詞，以 AI 自傳生成為例｜EP54

產品經理想做 AI 產品要懂哪些基本名詞？這篇整理我過往參與 AI 自傳生成時，和 NLP 工程師有討論到的概念，AI 應用目前還尚未普及，未來我會再陸續整理不同功能或產業需要知道的 AI 基礎知識。

#AI產品經理#產品經理#AI自傳

2024/07/21

張家惟 Evan Chang的沙龍

產品經理要懂哪些 AI 名詞，以 AI 自傳生成為例｜EP54

#AI產品經理#產品經理#AI自傳

2024/07/21

Darren的沙龍

解密 AI 與資料科學 (二) : AI 的類型與實戰場景

本文要探討AI的任務與實戰場景。AI技術已深入生活各層面，從違約預測到都市交通管理。AI任務主要有三類：數值型資料處理、自然語言處理（NLP）和電腦影像辨識。時間序列資料和強化學習方法（如AlphaGo）也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化，了解這些基礎有助選擇適合研究方向

#ChatGPT#AlphaGo#人工智慧

2024/07/19

Darren的沙龍

解密 AI 與資料科學 (二) : AI 的類型與實戰場景

#ChatGPT#AlphaGo#人工智慧

2024/07/19

默默超的人機協作城

AI助手數據收集和訓練過程簡介

本文介紹了AI助手在數據收集和訓練過程中的工作原理和不斷進步的過程。關注的內容包括從公開的網絡資源、書籍、文章等渠道收集數據，數據的清洗和結構化處理，知識庫的增量更新以及訓練算法和模型的優化。如果大家對AI助手的發展還有任何其他感興趣的話題或建議，歡迎隨時告訴我們，讓我們共同探索，攜手進步。

2024/07/11

2024/07/11

解密 AI 與資料科學 (一) : AI 開發鏈, 跨領域溝通 & 最具未來性的職業

本文談及資料科學的領域與分工。首先是建造一個AI的研發流程，資料收集到 AI 模型訓練的過程，AI經歷這一切流程被創造出來並產生價值；再來本文也提及在這個領域中的各種腳色、資料工程師、數據庫工程師、資料科學家和資料分析師的各種介紹。並且強調跨領域合作的重要性。

#人工智慧#AI#資料科學

2024/07/05

Darren的沙龍

解密 AI 與資料科學 (一) : AI 開發鏈, 跨領域溝通 & 最具未來性的職業

#人工智慧#AI#資料科學

2024/07/05

美國人力資源港 - 九思觀點

何謂「人工智能」？What is AI?

AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域，包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性，還可解決複雜的問題和挑戰。

2024/02/23

2024/02/23

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News