[假設檢定與統計推論1]模擬考題

更新 發佈閱讀 10 分鐘

先衝影片!再戰模考!考前這一步,讓你的努力更有方向 👉

🎓 iPAS自學路:https://youtu.be/VYrbdgxnEQg

問題 1 (中級)

------------------------------

題目: 一位AI應用規劃師在評估一個新推薦系統的用戶滿意度時,抽取了1000名用戶作為樣本,計算出樣本平均滿意度為8.5分(滿分10分)。他同時計算了一個95%的信賴區間為[8.3, 8.7]。請問,這個信賴區間的「95%信心水準」最精確的解釋為何?

選項:

A) 實際的母體平均滿意度有95%的機率落在8.3到8.7分之間。

B) 如果重複進行100次同樣的抽樣與區間估計,大約會有95個信賴區間包含實際的母體平均滿意度。

C) 有95%的用戶滿意度會介於8.3到8.7分之間。

D) 規劃師對於他的估計結果有95%的肯定。


答案: B) 如果重複進行100次同樣的抽樣與區間估計,大約會有95個信賴區間包含實際的母體平均滿意度。

解析: 信心水準是指重複抽樣多次時,所建構的信賴區間能夠包含母體參數的比例。它並非指母體參數落在單一信賴區間內的機率。


問題 2 (中級)

------------------------------

題目: 某電商平台希望評估導入新AI客服系統後,顧客等待時間是否顯著減少。舊系統的平均等待時間為5分鐘。AI應用規劃師應如何設定虛無假設(H₀)與對立假設(H₁),以檢定新系統是否「顯著減少」等待時間?

選項:

A) H₀: μ = 5;H₁: μ ≠ 5

B) H₀: μ ≥ 5;H₁: μ < 5

C) H₀: μ ≤ 5;H₁: μ > 5

D) H₀: μ < 5;H₁: μ ≥ 5


答案: B) H₀: μ ≥ 5;H₁: μ < 5

解析: 虛無假設通常是「無改變」或「沒有預期效果」的保守說法,研究者希望去推翻它。對立假設則是研究者希望證明成立的觀點。題目希望檢定是否「顯著減少」,因此對立假設應為μ < 5。虛無假設是其互補情況,即μ ≥ 5。


問題 3 (中級)

------------------------------

題目: 在進行A/B測試以比較兩個網頁設計對用戶轉換率的影響時,AI應用規劃師設定顯著水準(α)為0.05。檢定結果的P值為0.03。基於此結果,最恰當的決策為何?

選項:

A) 拒絕虛無假設,因為P值小於顯著水準,表明兩個網頁設計的轉換率存在顯著差異。

B) 不拒絕虛無假設,因為P值很小,表示差異不顯著。

C) 接受虛無假設,因為P值接近於零。

D) 需增加樣本量,因為P值太小可能導致型一錯誤。


答案: A) 拒絕虛無假設,因為P值小於顯著水準,表明兩個網頁設計的轉換率存在顯著差異。

解析: 當P值小於或等於顯著水準(α)時,我們有足夠的證據拒絕虛無假設。這意味著觀察到的差異不太可能是由隨機機會造成的,因此是統計上顯著的。


問題 4 (中級)

------------------------------

題目: 某AI模型開發團隊在進行新模型的效能評估時,希望證明新模型在某項指標上優於現有模型。他們進行了假設檢定,並最終得到了P值為0.01。如果顯著水準α設定為0.05,但實際上新模型並沒有優於舊模型(即虛無假設H₀為真),那麼這個團隊所犯的錯誤是什麼?

選項:

A) 型二錯誤 (Type II Error)

B) 型一錯誤 (Type I Error)

C) 抽樣錯誤 (Sampling Error)

D) 測量錯誤 (Measurement Error)


答案: B) 型一錯誤 (Type I Error)

解析: 型一錯誤是指當虛無假設實際上是正確的,但我們卻錯誤地拒絕了它。在這個情境中,由於P值(0.01)小於α(0.05),團隊會拒絕H₀並聲稱新模型優於舊模型,但如果H₀實際上為真,這就是犯了型一錯誤。


問題 5 (中級)

------------------------------

題目: AI應用規劃師小王正在為一個新的智慧醫療診斷系統進行區間估計。他計算出了一個99%的信賴區間。如果他現在想要在其他條件不變的情況下,縮小信賴區間的寬度(使其更精確),他可以怎麼做?

選項:

A) 提高信心水準到99.9%。

B) 降低顯著水準α到0.001。

C) 增加樣本容量。

D) 減少樣本容量。


答案: C) 增加樣本容量。

解析: 信賴區間的寬度(邊際誤差)與樣本容量呈反比關係。增加樣本容量會減少抽樣誤差,從而縮小信賴區間。提高信心水準會使信賴區間變寬;降低顯著水準(等同於提高信心水準)也會使信賴區間變寬。


問題 6 (中級)

------------------------------

題目: 在進行一個關於智慧城市交通流量預測模型的評估時,AI應用規劃師設定了虛無假設H₀為「新模型與舊模型的預測誤差無顯著差異」,對立假設H₁為「新模型的預測誤差顯著小於舊模型」。這屬於哪種檢定方向?

選項:

A) 雙尾檢定

B) 左單尾檢定

C) 右單尾檢定

D) 無方向性檢定


答案: B) 左單尾檢定

解析: 對立假設H₁中明確指出「新模型的預測誤差顯著小於舊模型」,這表示我們只關心單一方向的差異(小於),因此這是一個左單尾檢定。


問題 7 (中級)

------------------------------

題目: 某公司AI部門開發了一款新的圖像辨識演算法,聲稱其辨識準確率超過90%。為了驗證此說法,統計部門進行了假設檢定。若他們最終得出結論「沒有足夠證據支持新演算法準確率超過90%」,但實際上新演算法的準確率確實超過90%。請問這是犯了哪種錯誤?

選項:

A) 型一錯誤 (Type I Error)

B) 型二錯誤 (Type II Error)

C) 抽樣誤差 (Sampling Error)

D) 系統誤差 (Systematic Error)


答案: B) 型二錯誤 (Type II Error)

解析: 型二錯誤是指當虛無假設實際上是錯誤的(即對立假設為真),但我們卻錯誤地沒有拒絕虛無假設。在這個情境中,對立假設H₁是「準確率 > 90%」是真,但結論卻是「沒有足夠證據支持」,即沒有拒絕H₀(準確率 ≤ 90%),這就犯了型二錯誤。


問題 8 (中級)

------------------------------

題目: AI應用規劃師在評估一個個性化推薦系統的用戶點擊率時,希望使用區間估計來提供一個對母體點擊率的可靠範圍。若他想要更高的「信心水準」同時保持「信賴區間」的寬度不變,他在實務上最需要做什麼?

選項:

A) 增加抽樣調查的複雜度。

B) 減少樣本容量。

C) 增加樣本容量。

D) 改變抽樣方法,改為非隨機抽樣。


答案: C) 增加樣本容量。

解析: 提高信心水準通常會導致信賴區間變寬。為了在提高信心水準的同時保持信賴區間寬度不變(或縮小),最直接且有效的方法就是增加樣本容量,因為更大的樣本量會提供更精確的估計。


問題 9 (中級)

------------------------------

題目: 在進行假設檢定時,如果P值為0.06,而AI應用規劃師設定的顯著水準(α)為0.05。請問下列哪項敘述是正確的?

選項:

A) 有6%的機率,觀測到的結果是隨機發生的。

B) 我們有足夠證據拒絕虛無假設。

C) 拒絕虛無假設會導致型二錯誤。

D) 沒有足夠證據拒絕虛無假設。


答案: D) 沒有足夠證據拒絕虛無假設。

解析: P值代表在虛無假設為真的前提下,觀察到目前數據或更極端數據的機率。當P值(0.06)大於顯著水準(0.05)時,表示觀察到的結果可能是由隨機機會造成的,因此沒有足夠的統計證據來拒絕虛無假設。


問題 10 (中級)

------------------------------

題目: 某AI公司推出一款聲稱能有效提升農作物產量的新型智慧灌溉系統。為驗證其效益,農業專家進行了田間試驗,並採用了假設檢定。若虛無假設為「新系統對產量無顯著提升」,對立假設為「新系統對產量有顯著提升」。如果試驗結果的P值為0.008,且顯著水準設定為0.01。則合理的結論是什麼?

選項:

A) 沒有足夠證據證明新系統對產量有顯著提升。

B) 有足夠證據證明新系統對產量有顯著提升。

C) 新系統對產量的提升幅度不大。

D) 需要重新設計實驗,因為P值過小。


答案: B) 有足夠證據證明新系統對產量有顯著提升。

解析: P值(0.008)小於顯著水準(0.01),表示在虛無假設為真的前提下,觀察到目前或更極端結果的機率非常低。因此,我們有充分的統計證據拒絕虛無假設,轉而支持對立假設,即新系統對產量有顯著提升。

留言
avatar-img
留言分享你的想法!
avatar-img
iPAS AI 自學路
10會員
47內容數
我是一位正在追求職涯升級的 40 歲非本科系上班族。我會將自己摸索出的高效白話筆記與聽覺學習法無私分享,助你:克服術語障礙、利用零碎時間學習、系統化整理考點。 也歡迎到我的頻道逛逛https://www.youtube.com/@ipasstudybuddy
iPAS AI 自學路的其他內容
2025/10/27
先衝影片!再戰模考! 考前這一步,讓你的努力更有方向 👉 🎓 iPAS自學路:https://www.youtube.com/@ipasstudybuddy
2025/10/27
先衝影片!再戰模考! 考前這一步,讓你的努力更有方向 👉 🎓 iPAS自學路:https://www.youtube.com/@ipasstudybuddy
2025/10/26
📺 先看影片,再挑戰模擬考! 理解比死背更重要,看完影片再測驗,效果直接翻倍! 👉 https://www.youtube.com/@ipasstudybuddy
2025/10/26
📺 先看影片,再挑戰模擬考! 理解比死背更重要,看完影片再測驗,效果直接翻倍! 👉 https://www.youtube.com/@ipasstudybuddy
2025/10/25
問題 1 (中級) ------------------------------ 題目: 一家AI新創公司正在開發一個模型,旨在預測客戶在收到促銷郵件後是否會點擊連結。若要對單一客戶的點擊行為進行建模,下列哪一種機率分佈最為適合? 選項: A) 泊松分佈 B) 二項分佈 C) 伯努利分佈
2025/10/25
問題 1 (中級) ------------------------------ 題目: 一家AI新創公司正在開發一個模型,旨在預測客戶在收到促銷郵件後是否會點擊連結。若要對單一客戶的點擊行為進行建模,下列哪一種機率分佈最為適合? 選項: A) 泊松分佈 B) 二項分佈 C) 伯努利分佈
看更多
你可能也想看
Thumbnail
搬家不只添購必需品,更能透過蝦皮分潤計畫賺取零用金!本文分享近期搬家時添購的各種實用好物,包含多功能工作桌、電競椅、氣炸烤箱、收納神器等,並詳述如何透過蝦皮雙 11 活動聰明購物、善用優惠,同時利用分潤機制將敗家行為轉化為被動收入,推薦給想聰明消費又想賺額外收入的你!
Thumbnail
搬家不只添購必需品,更能透過蝦皮分潤計畫賺取零用金!本文分享近期搬家時添購的各種實用好物,包含多功能工作桌、電競椅、氣炸烤箱、收納神器等,並詳述如何透過蝦皮雙 11 活動聰明購物、善用優惠,同時利用分潤機制將敗家行為轉化為被動收入,推薦給想聰明消費又想賺額外收入的你!
Thumbnail
貓奴每月進貢的時間又來啦! 身為專業貢品官,我從蝦皮搜尋各種零食,只為取悅家中三位貓主子!結果究竟會是龍心大悅,亦或是冷眼相待,就讓我們繼續看下去~
Thumbnail
貓奴每月進貢的時間又來啦! 身為專業貢品官,我從蝦皮搜尋各種零食,只為取悅家中三位貓主子!結果究竟會是龍心大悅,亦或是冷眼相待,就讓我們繼續看下去~
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 回顧 AI說書 - 從0開始 - 87 說:Wang 等人 2019 年的論文,提供了合理答案的選擇 (Choice of Plausible Answers, COP
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 從 AI說書 - 從0開始 - 82 到 AI說書 - 從0開始 - 85 的說明,有一個很重要的結論:最適合您的模型不一定是排行榜上最好的模型,您需要學習 NLP 評
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 從 AI說書 - 從0開始 - 82 到 AI說書 - 從0開始 - 85 的說明,有一個很重要的結論:最適合您的模型不一定是排行榜上最好的模型,您需要學習 NLP 評
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 xxx 提到,既然提到訓練,就表示要有一套衡量基準供大家遵守,有鑑於此,以下繼續介紹幾類衡量方式: MCC: 首先介紹 True (T) Positive (
Thumbnail
我想要一天分享一點「LLM從底層堆疊的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續 xxx 提到,既然提到訓練,就表示要有一套衡量基準供大家遵守,有鑑於此,以下繼續介紹幾類衡量方式: MCC: 首先介紹 True (T) Positive (
Thumbnail
1. 資訊來源: 檢查視頻中引用的資訊來源是否可靠和權威。 2. 事實核查: 嘗試交叉驗證視頻中的主要觀點和聲明。 3. 專家意見: 尋找相關領域專家對這些話題的看法。 4. 一致性: 觀察創作者的內容是否前後一致,或是否存在矛盾。....
Thumbnail
1. 資訊來源: 檢查視頻中引用的資訊來源是否可靠和權威。 2. 事實核查: 嘗試交叉驗證視頻中的主要觀點和聲明。 3. 專家意見: 尋找相關領域專家對這些話題的看法。 4. 一致性: 觀察創作者的內容是否前後一致,或是否存在矛盾。....
Thumbnail
終於要開始講統計檢定的實作部分了。因為是舉實例所以滿長的。 為了讓順序比較恰當,這篇比較晚發的文章被設定成假設檢定後的下一篇。
Thumbnail
終於要開始講統計檢定的實作部分了。因為是舉實例所以滿長的。 為了讓順序比較恰當,這篇比較晚發的文章被設定成假設檢定後的下一篇。
Thumbnail
比賽過程中,評審聽不懂意味著他們不太知道怎麼評分......
Thumbnail
比賽過程中,評審聽不懂意味著他們不太知道怎麼評分......
Thumbnail
本文探討了監督式學習、分群和相似度這幾個推薦系統算法,分別討論了它們的優點、缺點以及適用場景。這些算法在推薦系統中扮演著重要角色,並透過特徵選擇與預處理、相似度度量和鄰居的選擇等關鍵因素進行深入分析。文章最後提出在選擇推薦系統算法時應該考慮的因素,以及未來的研究方向。
Thumbnail
本文探討了監督式學習、分群和相似度這幾個推薦系統算法,分別討論了它們的優點、缺點以及適用場景。這些算法在推薦系統中扮演著重要角色,並透過特徵選擇與預處理、相似度度量和鄰居的選擇等關鍵因素進行深入分析。文章最後提出在選擇推薦系統算法時應該考慮的因素,以及未來的研究方向。
Thumbnail
本選擇題組共有十題,每題只有一個正確答案。
Thumbnail
本選擇題組共有十題,每題只有一個正確答案。
Thumbnail
今天來講:統計模擬研究的入門文章。(2023-08-23)
Thumbnail
今天來講:統計模擬研究的入門文章。(2023-08-23)
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News