建議先看完對應教學影片再作答,效果加倍。 👉 YouTube 教學頻道
第 1 題
某零售集團的資料分析師需要向管理層呈現「過去 12 個月各產品類別的月銷售額趨勢」。資料包含 8 個產品類別、每類別 12 個月的銷售額數值。分析師正在評估長條圖(Bar Chart)、折線圖(Line Chart)、圓餅圖(Pie Chart)、散佈圖(Scatter Plot)四種選項。下列何者最能正確說明圖表選用的邏輯,以及哪種圖表最適合此情境?
(A) 圓餅圖最適合,因為管理層關心各類別佔總銷售額的比例,圓餅圖能直觀呈現各類別的相對比重,且 8 個類別的扇形能清楚區分
(B) 散佈圖最適合,因為需要同時呈現 8 個類別和 12 個月的二維資訊,散佈圖的 X 軸放月份、Y 軸放銷售額,能同時顯示所有資料點
(C) 折線圖最適合,時間序列趨勢應優先選擇折線圖,每條線代表一個產品類別,8 條折線能同時呈現各類別的月變化趨勢,讓管理層直覺地看出哪個類別在成長、哪個在下滑
(D) 長條圖最適合,因為銷售額是數值型資料,長條圖能精確呈現每個月每個類別的絕對數值,比折線圖更能讓管理層比較不同類別在同一月份的差異
答案:C
深度導讀解析
正確答案:C
核心技術點:圖表選用的核心原則——依據「想回答的問題」而非「資料類型」選圖
中級理論拆解:圖表選用的第一個問題是「這張圖要回答什麼問題」。「趨勢」問題 → 折線圖;「比較」問題 → 長條圖;「比例」問題 → 圓餅圖;「相關性」問題 → 散佈圖。本題核心是「12 個月的趨勢」,折線圖的連續線條讓眼睛自然追蹤時間走向,8 條不同顏色的折線能同時比較各類別的趨勢方向。圓餅圖適合靜態比例,無法呈現時間變化;散佈圖適合兩個連續變數的相關性,不適合此多類別時序場景。
選項坑洞掃描:A 說圓餅圖最適合,圓餅圖呈現靜態比例,無法呈現 12 個月的時間變化,且 8 個扇形的標籤會擠在一起難以辨識。B 說散佈圖最適合,散佈圖的設計是讓每個點代表一筆資料,觀察兩個連續變數的相關性,不適合呈現多類別的時間趨勢。D 說長條圖更能比較絕對數值,長條圖適合靜態比較,但要呈現 8 個類別 × 12 個月 = 96 個長條,視覺上極度混亂,趨勢完全無法識別。
破題反射字:時間趨勢 → 折線圖 / 靜態比例 → 圓餅圖 / 兩變數相關 → 散佈圖 / 類別比較 → 長條圖
第 2 題
某製造業品管團隊收集了 2,000 個產品的重量資料,想同時了解資料的中位數、四分位距(IQR)、離群值分布,以及不同生產線之間的重量分布是否有差異。資料視覺化工程師評估了直方圖(Histogram)、箱型圖(Box Plot)、折線圖、熱力圖(Heatmap)。下列何者最能正確描述箱型圖在此情境的優勢,以及它與直方圖的核心差異?
(A) 箱型圖最適合此情境,它直接呈現中位數(箱中線)、Q1 和 Q3(箱邊界)、IQR(箱高)、最小最大值(鬚線)、以及超出鬚線的離群值(獨立點),且多個箱型圖並排能直覺比較不同生產線的分布差異;直方圖雖能呈現分布形狀但難以直接讀出四分位數並排比較多組
(B) 直方圖比箱型圖更適合此情境,因為直方圖能呈現資料的完整分布形狀(如雙峰、偏態),箱型圖只顯示五個摘要統計量,無法讓品管人員看到分布的細節特徵
(C) 熱力圖最適合此情境,將 2,000 個產品按重量範圍分組後顯示在熱力圖中,顏色深淺代表各重量區間的產品數量,能同時呈現分布密度和跨生產線比較
(D) 折線圖最適合此情境,以產品序號為 X 軸、重量為 Y 軸繪製折線,能呈現 2,000 個產品的重量走勢,生產線異常會在折線的突然上升或下降中顯現
答案:A
深度導讀解析
正確答案:A
核心技術點:箱型圖的五數摘要結構與多組分布比較的設計優勢
中級理論拆解:箱型圖(Box Plot)由五個統計量構成:最小值、Q1(第 25 百分位)、中位數(Q2)、Q3(第 75 百分位)、最大值,其中箱體代表 IQR(Q3 - Q1),鬚線延伸至 1.5 倍 IQR 範圍,超出的點標記為離群值。這個設計讓品管團隊一眼讀出分布的中心趨勢、變異程度和異常值位置。最重要的是多組並排比較——將三條生產線的箱型圖並排,品管人員能立即看出哪條線的中位數偏高、哪條線的 IQR 更寬(變異更大)。直方圖雖能呈現完整分布形狀,但多組並排時視覺比較困難。
選項坑洞掃描:B 說直方圖更適合,直方圖確實能呈現更多分布細節,但題目明確要求「同時了解 IQR、離群值,以及跨生產線比較」,這三個需求都指向箱型圖,直方圖在跨組比較上遠不如箱型圖直觀。C 說熱力圖最適合,熱力圖適合呈現矩陣型的數值密度,不是呈現分布摘要統計量的工具,題目的需求用熱力圖無法直接讀出中位數或 IQR。D 說折線圖最適合,折線圖呈現時間序列趨勢,2,000 個產品按序號畫折線只能看到波動,無法讀出分布的統計特性。
破題反射字:中位數 + IQR + 離群值 → 箱型圖 / 多組分布比較 → 並排箱型圖 / 完整分布形狀 → 直方圖的優勢
第 3 題
某電商平台資料科學家想探索「用戶特徵」與「購買行為」之間的相關性,資料集包含 15 個數值型特徵(年齡、消費頻率、平均客單價、頁面停留時間等)。分析師希望一張圖就能呈現所有特徵對之間的相關係數強度與方向,讓團隊快速識別高相關的特徵組合供後續特徵工程參考。下列哪種視覺化工具最能滿足此需求,以及它的設計邏輯為何?
(A) 使用散佈圖矩陣(Scatter Plot Matrix),將 15 個特徵兩兩組合繪製成 15×15 的散佈圖陣列,每個子圖呈現兩個特徵的實際資料點分布,讓分析師觀察非線性相關關係
(B) 使用相關性熱力圖(Correlation Heatmap),以矩陣形式呈現所有特徵對的 Pearson 相關係數,顏色深淺與冷暖代表相關係數的強度與正負方向,讓 15×15 的相關矩陣一目了然
(C) 使用雷達圖(Radar Chart),將 15 個特徵作為 15 個軸,每個用戶的特徵值繪製為多邊形,重疊多個用戶的多邊形能呈現高購買意願用戶的特徵輪廓
(D) 使用氣泡圖(Bubble Chart),X 軸和 Y 軸各放一個特徵,氣泡大小代表第三個特徵的數值,通過多張氣泡圖的組合能逐步探索所有特徵間的相關性
答案:B
深度導讀解析
正確答案:B
核心技術點:相關性熱力圖(Correlation Heatmap)的設計邏輯與多特徵相關性的一覽式呈現
中級理論拆解:相關性熱力圖將特徵兩兩計算的 Pearson 相關係數(值域 -1 到 1)填入矩陣,用顏色映射:深紅 → 高正相關(接近 1)、深藍 → 高負相關(接近 -1)、白色或淡色 → 近似無相關(接近 0)。15 個特徵產生 15×15 = 225 個相關係數格,分析師掃描顏色深淺就能立即識別哪些特徵對高度相關(需要考慮共線性問題或進行特徵選擇),哪些與目標變數(購買行為)最相關(特徵重要性參考)。這是特徵工程前的標準探索性分析工具。
選項坑洞掃描:A 說散佈圖矩陣,散佈圖矩陣確實能呈現非線性關係,但 15×15 = 225 個子圖在一張圖裡每個子圖都非常小,難以閱讀,且題目要求快速識別而非深入觀察每對特徵的分布,熱力圖的顏色編碼更符合「快速識別」的需求。C 說雷達圖,雷達圖呈現的是單一樣本在多個維度的數值輪廓,不是特徵之間的相關性,完全不適合此需求。D 說氣泡圖,氣泡圖一次只能呈現三個特徵的關係,15 個特徵需要多張圖,無法達到「一張圖一目了然」的目標。
破題反射字:多特徵相關性 → 相關性熱力圖 / 顏色冷暖 → 相關係數正負方向 / 顏色深淺 → 相關係數強度
第 4 題
某醫療研究團隊分析了 500 名患者的手術後恢復時間資料,想呈現恢復時間在不同年齡組(20 多歲、30 多歲、40 多歲、50 多歲、60 歲以上)之間的差異。資深統計師指出,僅用長條圖呈現各組平均值會遺漏重要資訊,建議改用能同時呈現「分布形狀、中位數、離群值」的視覺化。下列何者最能正確描述小提琴圖(Violin Plot)相較於箱型圖在此情境的附加價值?
(A) 小提琴圖與箱型圖呈現的資訊完全相同,差異只在外觀美觀程度,小提琴圖的曲線外形讓非技術背景的管理層更容易接受,但統計資訊沒有增加
(B) 小提琴圖在箱型圖的五數摘要外,額外呈現核密度估計(KDE)曲線,讓讀者看到分布是單峰還是雙峰、左偏還是右偏等完整形狀特徵;箱型圖只呈現摘要統計量,若恢復時間存在雙峰分布(如輕症與重症患者混合),箱型圖完全無法顯示這個特徵
(C) 小提琴圖只適合資料量超過 10,000 筆時才有統計意義,500 名患者的資料量不足以讓核密度估計曲線穩定,此情境應選擇標準箱型圖而非小提琴圖
(D) 小提琴圖的主要優勢是能呈現資料的時間序列變化,將五個年齡組排列後能看出恢復時間隨年齡增長的動態趨勢,這是箱型圖無法呈現的資訊
答案:B
深度導讀解析
正確答案:B
核心技術點:小提琴圖的核密度估計(KDE)附加資訊與雙峰分布識別能力
中級理論拆解:箱型圖只顯示五個摘要統計量(最小、Q1、中位數、Q3、最大),若資料呈現雙峰分布(bimodal),箱型圖完全無法顯示這個特徵,中位數和 IQR 看起來和單峰分布一樣。小提琴圖在箱型圖的核心結構外,疊加核密度估計(KDE)曲線——曲線越寬代表該值域的資料越密集。若 40 多歲患者的恢復時間呈雙峰(輕症 5 天、重症 20 天),小提琴圖的曲線會呈現兩個鼓包,這個重要的分布特徵在箱型圖中完全隱藏。醫療研究中,分布形狀往往比摘要統計量更有臨床意義。
選項坑洞掃描:A 說兩者資訊完全相同,小提琴圖的 KDE 曲線提供了箱型圖完全沒有的分布形狀資訊,這個差異是本質性的而非僅外觀差異。C 說 500 筆資料量不足以使用小提琴圖,KDE 在樣本量 50 以上通常就能提供合理估計,500 筆對小提琴圖來說是充足的資料量。D 說小提琴圖能呈現時間序列,五個年齡組是類別變數而非時間序列,小提琴圖也不具備時間序列分析能力,這個說法完全錯誤。
破題反射字:雙峰分布 → 箱型圖無法顯示 / 小提琴圖可以 / KDE → 核密度估計曲線 / 分布形狀 → 小提琴圖的核心附加價值
第 5 題
某 AI 規劃師在為高層主管準備季度業績報告時,發現設計視覺化時犯了幾個常見錯誤:Y 軸從 95 開始而非從 0 開始(讓 1% 的成長看起來像翻倍)、使用 3D 長條圖(讓後方的長條因透視而看起來更短)、在一張圖裡同時放了 15 種顏色。下列何者最能正確描述這三個錯誤各自違反的視覺化設計原則?
(A) Y 軸截斷 → 違反資料誠信原則,人為誇大差異誤導讀者;3D 效果 → 違反感知準確性原則,透視失真讓視覺比較不準確;15 種顏色 → 違反視覺負荷原則,顏色超過 7±2 個人類工作記憶上限後難以區分
(B) Y 軸截斷 → 違反色彩使用原則;3D 效果 → 違反資料完整性原則;15 種顏色 → 違反圖表類型選擇原則;三個錯誤都屬於資料呈現的技術失誤而非設計原則問題
(C) 三個錯誤都屬於美觀性問題而非資訊準確性問題,在商業報告中為了讓圖表更具視覺吸引力,適度的 Y 軸截斷、3D 效果和豐富色彩是可以接受的設計選擇
(D) Y 軸截斷只在負向操弄時才是問題,若是讓正面成長更明顯則屬於合理的強調技巧;3D 效果和 15 種顏色是純粹的美觀偏好,不影響資料的準確解讀
答案:A
深度導讀解析
正確答案:A
核心技術點:視覺化設計的三個核心原則——資料誠信、感知準確性、視覺負荷控制
中級理論拆解:Y 軸截斷是最常見的視覺欺騙手法,從 95 開始讓 1% 的差異在圖中佔據 50% 的高度,嚴重誇大差異,違反「資料誠信(Data Integrity)」原則,數值型長條圖原則上 Y 軸應從 0 開始。3D 效果在二維螢幕呈現三維物件,前方長條的深度陰影讓後方長條因透視縮小,讀者無法從高度準確判斷數值,違反「感知準確性(Perceptual Accuracy)」原則。人類工作記憶的 7±2 法則(Miller's Law)限制了同時處理的資訊量,15 種顏色遠超感知負荷,讀者無法對應圖例,違反「視覺負荷控制」原則,通常建議一張圖顏色不超過 7 種。
選項坑洞掃描:B 把三個錯誤各自對應到錯誤的原則,Y 軸截斷是資料誠信問題不是色彩問題,分類完全混亂且說法沒有依據。C 說三個錯誤是美觀問題不影響準確性,Y 軸截斷確實在商業環境中被用來操弄解讀,稱為「統計視覺欺騙」,這不是美觀選擇而是倫理問題。D 說 Y 軸截斷只在負向才有問題,無論是正向還是負向,截斷 Y 軸都會讓讀者對差異幅度產生錯誤認知,不因動機而改變其誤導效果。
破題反射字:Y 軸截斷 → 誇大差異、資料誠信問題 / 3D 效果 → 透視失真、感知準確性問題 / 過多顏色 → 超過工作記憶負荷
還在用零散筆記備考?
這份《iPAS 中級白話備考筆記》把三科考綱重點全部用人話整理好,考點速記、實戰場景、常見陷阱一次收錄。適合非本科、時間有限、想快速抓住考試方向的自學者。
👉 立即取得備考筆記