先衝影片!再戰模考!考前這一步,讓你的努力更有方向 👉
🎓 iPAS自學路:https://youtu.be/EbCB4B9pbHs
問題 1 (中級)------------------------------
題目: 在評估一個房價預測模型時,如果我們特別不希望模型在預測高價位房屋時出現「大額」的錯誤(例如,實際價值1億元的房屋預測成9千萬,雖然誤差絕對值不大,但比例上仍是高價),您會傾向使用哪種指標來評估模型效能?
選項:
A) MAE (Mean Absolute Error)
B) RMSE (Root Mean Squared Error)
C) MAPE (Mean Absolute Percentage Error)
D) R-squared
答案: B) RMSE (Root Mean Squared Error)
解析: RMSE對大錯誤(squared error)的懲罰會比MAE更重,因此在重視避免極端大錯誤的場景(如高價房屋的預測誤差)中更適用。
問題 2 (中級)
------------------------------
題目: 某電商公司開發了一個銷售預測模型,用於預測未來7天的商品銷售量。在某次評估中發現模型的MAE是50件,而RMSE是80件。這種情況最可能說明了什麼?
選項:
A) 模型在大多數預測中都有大錯誤。
B) 模型預測的錯誤分佈中存在一些較大的異常錯誤。
C) 模型的預測結果普遍偏低。
D) 模型的預測結果普遍偏高。
答案: B) 模型預測的錯誤分佈中存在一些較大的異常錯誤。
解析: 當RMSE遠大於MAE時,這通常表示數據中存在較大的預測誤差。由於RMSE對大錯誤進行平方處理,因此它對異常值或大誤差的敏感性更高,會使其值顯著增加。MAE則是對所有錯誤一視同仁,所以不會被少數大錯誤過度影響。
問題 3 (中級)
------------------------------
題目: 一家零售商需要比較不同產品線的預測模型表現。由於不同產品線的銷售額量級差異巨大(例如,A產品線平均日銷量10000件,B產品線平均日銷量100件),為了能公平地進行模型比較,並提供一個直觀的錯誤百分比,您作為AI規劃師會推薦哪個評估指標?
選項:
A) MSE (Mean Squared Error)
B) RMSE (Root Mean Squared Error)
C) MAE (Mean Absolute Error)
D) MAPE (Mean Absolute Percentage Error)
答案: D) MAPE (Mean Absolute Percentage Error)
解析: MAPE以百分比的形式衡量誤差,因此它能夠跨不同量級的數據進行比較,提供了一個相對誤差的概念,非常適合用於比較銷售額量級差異大的不同產品線的模型表現。
問題 4 (中級)
------------------------------
題目: 某能源公司欲建立模型預測下個小時的發電量。如果預測值 ŷ_i 為 95 MWh,而實際值 y_i 為 100 MWh。請問此單一預測點對該模型的MSE貢獻值為何?
選項:
A) 5
B) 25
C) 0.05
D) 0.25
答案: B) 25
解析: MSE的計算公式為 (y_i - ŷ_i)^2 的平均值。對於單一預測點,其貢獻為 (100 - 95)^2 = 5^2 = 25。
問題 5 (中級)
------------------------------
題目: 下列關於R-squared的敘述,何者為錯誤?
選項:
A) R-squared值介於0到1之間,越接近1表示模型解釋變異能力越強。
B) R-squared可以衡量模型擬合資料的好壞程度。
C) R-squared可以判斷模型的預測值是否系統性地高估或低估實際值。
D) 引入更多解釋變數,即使這些變數與因變數不相關,R-squared值也可能隨之上升。
答案: C) R-squared可以判斷模型的預測值是否系統性地高估或低估實際值。
解析: R-squared衡量的是模型解釋因變數變異的比例,無法判斷模型的預測值是高估還是低估,也無法判斷誤差是否具有系統性。這是R-squared的一個局限性,通常需要結合殘差圖等分析來判斷。
問題 6 (中級)
------------------------------
題目: 在使用`scikit-learn`進行機器學習模型評估時,若要計算RMSE,下列哪個 Python 程式碼片段是正確且常見的做法?
選項:
A) `from sklearn.metrics import mean_squared_error; rmse = mean_squared_error(y_true, y_pred)`
B) `from sklearn.metrics import mean_absolute_error; rmse = mean_absolute_error(y_true, y_pred)**0.5`
C) `from sklearn.metrics import mean_squared_error; rmse = mean_squared_error(y_true, y_pred, squared=False)`
D) `from sklearn.metrics import r2_score; rmse = r2_score(y_true, y_pred)**0.5`
答案: C) `from sklearn.metrics import mean_squared_error; rmse = mean_squared_error(y_true, y_pred, squared=False)`
解析: `sklearn.metrics.mean_squared_error` 函數在 `squared=False` 時會返回RMSE。選項A返回的是MSE。選項B和D是錯誤的計算方式。
問題 7 (中級)
------------------------------
題目: 某公司正在開發一個模型來預測不同商品的價格。在某些商品中,實際價格可能非常接近0(例如,免費贈品的估值或非常低價的商品)。如果在這些情況下,你使用MAPE作為主要評估指標,可能會遇到什麼問題?
選項:
A) MAPE會給予這些商品過高的權重,導致整體MAPE失真。
B) MAPE會變成負值,難以解釋。
C) MAPE會無限大或未定義,因為分母 y_i 接近或等於零。
D) MAPE的計算會變得非常慢,影響模型訓練效率。
答案: C) MAPE會無限大或未定義,因為分母 y_i 接近或等於零。
解析: MAPE的計算公式中包含 `|y_i - ŷ_i| / |y_i|`。當實際值 `y_i` 接近或等於零時,分母會趨近於零,導致MAPE的值趨向無限大或變得無意義,這使得它不適用於實際值為零或非常小的情況。
問題 8 (中級)
------------------------------
題目: 在一個金融風險預測模型中,模型需要預測潛在的貸款違約金額。對於單一筆貸款,若實際違約金額為 $10,000,模型預測為 $8,000。請問這個預測點對MAE的貢獻值為何?
選項:
A) $2000
B) $4000
C) $20000
D) $4000000
答案: A) $2000
解析: MAE的計算是取預測值與實際值之差的絕對值。因此,`|10000 - 8000| = |2000| = 2000`。
問題 9 (中級)
------------------------------
題目: 假設你在為一個交通流量預測系統選擇評估指標。這個系統的目標是避免在尖峰時間出現任何大錯誤的預測(例如,預測流量遠低於實際值會導致交通堵塞準備不足),同時也希望模型能夠對所有時間段的預測錯誤給出一個穩定、易於理解的平均值。你會如何權衡並選擇主要評估指標?
選項:
A) 主要使用MAE,因為它對異常值不敏感,提供穩定的平均錯誤。
B) 主要使用MSE,因為它對大錯誤敏感,能有效懲罰尖峰時間的嚴重預測偏差。
C) 綜合使用RMSE和MAE,RMSE作為主要指標以懲罰大錯誤,MAE作為輔助指標提供平均誤差的直觀理解。
D) 主要使用MAPE,因為它以百分比形式呈現,便於交通規劃者理解。
答案: C) 綜合使用RMSE和MAE,RMSE作為主要指標以懲罰大錯誤,MAE作為輔助指標提供平均誤差的直觀理解。
解析: 這個情境要求同時滿足兩個目標:避免尖峰時間的大錯誤(需要對大錯誤敏感的指標,如RMSE)和提供易於理解的平均錯誤(MAE)。單獨使用MAE無法有效懲罰大錯誤,單獨使用MSE/RMSE則可能不如MAE直觀。因此,綜合使用兩者能更好地滿足需求,RMSE聚焦於控制大錯誤,MAE提供整體錯誤的穩健平均。
問題 10 (中級)
------------------------------
題目: 在機器學習模型訓練過程中,優化器通常會嘗試最小化損失函數。如果損失函數是MSE,則下列哪個性質是其優點,使其在梯度下降等優化方法中表現良好?
選項:
A) 對異常值不敏感,使訓練更穩定。
B) 單位與目標變數一致,易於解釋。
C) 數學上可導,且導函數連續。
D) 能夠直接衡量模型的解釋能力。
答案: C) 數學上可導,且導函數連續。
解析: MSE是一個連續且可導的函數,其導函數也連續,這使得它在基於梯度的優化演算法(如梯度下降)中非常適用,因為可以方便地計算梯度來更新模型參數。其他選項描述的是其他指標的特性或MSE的缺點。




















