建議先看完影片在做題目,效果加倍https://youtu.be/FP8g2kFMTOo
問題 1 (中級)
------------------------------
題目: 在處理大型語言模型(LLM)的微調任務時,如果專案面臨計算資源極度有限且時間壓力大的情況,相較於傳統的全參數微調 (Full Fine-tuning),選擇 LoRA (Low-Rank Adaptation) 技術進行微調,其最主要的「權衡考量」(Trade-off) 是什麼?
選項:
A) LoRA 能保證更高的模型精準度,但會犧牲模型解釋性。
B) LoRA 訓練成本較低且速度快,但可能在某些複雜任務上略遜於全參數微調的極致性能。
C) LoRA 僅適用於影像生成任務,不適用於自然語言處理。
D) LoRA 會大幅增加模型的部署大小,導致推理延遲。
答案: B) LoRA 訓練成本較低且速度快,但可能在某些複雜任務上略遜於全參數微調的極致性能。
解析: LoRA 透過只訓練少量額外參數,大幅降低計算資源需求和訓練時間,這在資源受限的情況下是巨大優勢。然而,這種參數效率的提升,有時會導致在極其複雜或需要模型深層理解的任務上,其最終性能可能無法完全超越理論上能達到最佳性能的全參數微調。
問題 2 (中級)
------------------------------
題目: 參數高效微調 (PEFT) 技術,如 LoRA,在大型語言模型 (LLM) 部署中為何越來越受到青睞?其核心優勢體現在哪裡?
選項:
A) 能夠完全避免模型產生偏見,確保絕對的公平性。
B) 顯著降低微調所需的計算資源和儲存空間,並緩解過擬合風險。
C) 大幅提升模型的通用能力,使其能處理所有未知任務。
D) 僅限於對模型架構進行根本性的修改,不涉及權重更新。
答案: B) 顯著降低微調所需的計算資源和儲存空間,並緩解過擬合風險。
解析: PEFT 的核心優勢在於其效率。透過僅更新或引入少量參數,它大幅減少了訓練成本、GPU需求和存儲空間,同時由於修改的參數較少,也有助於減輕在小數據集上進行全參數微調時容易出現的過擬合問題。
問題 3 (中級)
------------------------------
題目: 在進行 Prompt Engineering 時,除了指令的清晰度和具體性外,AI 應用規劃師還應特別注意哪些因素,以最大化大型語言模型 (LLM) 輸出品質,特別是在生成創意內容時?
選項:
A) 模型的訓練數據量大小,因為這直接決定了模型的記憶能力。
B) 提示中包含的「角色設定」與「輸出格式要求」,這些能有效引導模型風格與結構。
C) 模型的部署硬體規格,高階顯卡能自動優化 Prompt 效果。
D) 每次生成都必須使用相同的隨機種子 (seed),以確保結果的一致性。
答案: B) 提示中包含的「角色設定」與「輸出格式要求」,這些能有效引導模型風格與結構。
解析: Prompt Engineering 不僅是提供清晰指令,更包含透過「角色扮演」(如「扮演一位資深行銷專家」)和「輸出格式規範」(如「以JSON格式輸出,包含標題和內文」)來引導模型生成符合特定風格、語氣和結構的內容,這對於創意或特定領域的內容生成尤其關鍵。
問題 4 (中級)
------------------------------
題目: 一家跨國金融機構希望自動化處理全球客戶的合約文件。這些文件包含多種語言,且需要從中精確提取客戶姓名、公司名稱、合約日期和金額等關鍵資訊,以便後續的風險評估和數據庫錄入。在此情境下,哪兩種自然語言處理 (NLP) 技術的組合最為關鍵且有效?
選項:
A) 情感分析 (Sentiment Analysis) 與文字分類 (Text Classification)。
B) 機器翻譯 (Machine Translation) 與命名實體辨識 (Named Entity Recognition, NER)。
C) 問答系統 (Question Answering Systems) 與文本摘要 (Text Summarization)。
D) 語法分析 (Syntactic Parsing) 與主題模型 (Topic Modeling)。
答案: B) 機器翻譯 (Machine Translation) 與命名實體辨識 (Named Entity Recognition, NER)。
解析: 由於文件包含多種語言,首先需要機器翻譯來將其轉換為單一或可處理的語言。接著,為了從大量文本中精確提取客戶姓名、公司名稱、日期和金額等「關鍵資訊」,命名實體辨識 (NER) 是最直接且高效的技術,它專門用於識別和分類文本中的具名實體。
問題 5 (中級)
------------------------------
題目: 某電商平台希望利用情感分析 (Sentiment Analysis) 來即時監測商品評論,以便快速回應負面評價。然而,在實際應用中,他們發現系統經常將「這款手機的功能很『狂』,超乎預期!」判斷為負面評論。這種情況最可能反映了情感分析在應用上的何種挑戰?
選項:
A) 數據量不足導致模型無法泛化。
B) 模型對於語言的「語氣詞」(Sarcasm) 和「網路流行語」(Slang) 理解不足。
C) 缺乏足夠的計算資源進行即時處理。
D) 情感分析模型通常無法處理多語言文本。
答案: B) 模型對於語言的「語氣詞」(Sarcasm) 和「網路流行語」(Slang) 理解不足。
解析: 「狂」在此處表示「很棒、很厲害」的正面意涵,屬於網路流行語或口語表達。傳統的情感分析模型可能未在包含這類表達的數據上訓練,或無法識別其在特定語境下的真正情感極性,導致判斷錯誤。這正是情感分析在處理複雜語言現象時的常見挑戰。
問題 6 (中級)
------------------------------
題目: 一家 AI 醫療診斷系統被發現對特定族群的診斷準確度顯著偏低,引發了對 AI 偏見 (AI Bias) 的擔憂。作為 AI 應用規劃師,為了主動緩解這種偏見,以下哪種策略組合最為有效且應優先考慮?
選項:
A) 僅增加該族群的數據量,並進行模型再訓練。
B) 重新平衡訓練數據集、採用公平性演算法、並實施可解釋性 (XAI) 工具進行偏見分析。
C) 徹底刪除所有包含該族群的數據,以避免偏見。
D) 提高模型複雜度,使用更大的深度學習模型來自動消除偏見。
答案: B) 重新平衡訓練數據集、採用公平性演算法、並實施可解釋性 (XAI) 工具進行偏見分析。
解析: 緩解AI偏見需要多方面策略。重新平衡數據集可以解決數據源的偏差;採用公平性演算法(Fairness-aware algorithms)能直接在模型訓練階段納入公平性考量;而可解釋性 (XAI) 工具則能幫助我們理解模型做出偏見決策的原因,進而對症下藥。單純增加數據量可能無法解決歷史數據中的偏見,刪除數據會損失資訊,提高模型複雜度則不保證能消除偏見。
問題 7 (中級)
------------------------------
題目: 根據歐盟人工智慧法案 (AI Act) 的分類原則,以下哪種 AI 系統最有可能被歸類為「高風險」(High-Risk) 系統,並因此需要遵循更嚴格的合規要求?
選項:
A) 用於個人化商品推薦的電商聊天機器人。
B) 判斷個人在教育機構入學資格或信用評分的系統。
C) 用於生成社群媒體貼文的內容創作輔助工具。
D) 自動翻譯用戶評論以提供多語系客服的系統。
答案: B) 判斷個人在教育機構入學資格或信用評分的系統。
解析: 歐盟 AI Act 將「高風險」AI 系統定義為對人們的健康、安全或基本權利產生重大負面影響的系統。判斷個人在教育機構的入學資格或信用評分,直接影響到個人的生活機會和經濟狀況,屬於對基本權利有重大影響的範疇,因此會被列為高風險。其他選項的影響相對較小。
問題 8 (中級)
------------------------------
題目: 對於一個用於輔助醫生診斷罕見疾病的 AI 系統,為何「可解釋性」(Explainability) 被認為是至關重要的特性,甚至比單純追求極高的準確度更受重視?
選項:
A) 可解釋性能夠自動修正診斷錯誤,降低醫療事故風險。
B) 它可以讓醫生理解 AI 的決策邏輯,建立信任,並在必要時對結果進行複核或推翻。
C) 具備可解釋性的 AI 系統,其訓練成本會大幅降低。
D) 可解釋性是 AI 系統實現自動化部署的必要條件。
答案: B) 它可以讓醫生理解 AI 的決策邏輯,建立信任,並在必要時對結果進行複核或推翻。
解析: 在醫療等高風險領域,AI 的決策需要被人類理解和信任。可解釋性 (XAI) 讓醫生能知道 AI 為什麼做出某個診斷,這不僅有助於醫生判斷 AI 建議的可靠性,還能在 AI 出錯時及時糾正,並作為醫學責任追溯的依據,而非盲目接受一個黑箱結果。
問題 9 (中級)
------------------------------
題目: 一家跨國飯店集團希望改善客戶服務效率。他們接收到來自全球各地的客戶意見回饋,包含多種語言,且希望能夠自動將這些意見進行初步分類(例如:設施問題、訂房問題、餐飲服務)並識別客戶情緒(正面、負面、中性),以便快速指派給相應部門處理。若要設計一個高效的 AI 解決方案,以下哪兩種 NLP 技術的組合最能滿足此需求?
選項:
A) 機器翻譯 (Machine Translation) 與命名實體辨識 (NER)。
B) 情感分析 (Sentiment Analysis) 與文字分類 (Text Classification)。
C) 文本摘要 (Text Summarization) 與問答系統 (Question Answering Systems)。
D) 語音辨識 (Speech Recognition) 與主題模型 (Topic Modeling)。
答案: B) 情感分析 (Sentiment Analysis) 與文字分類 (Text Classification)。
解析: 要將客戶意見「初步分類」到不同類別 (設施、訂房、餐飲),最適合的技術是文字分類。同時,要「識別客戶情緒」(正面、負面、中性),則需要情感分析。這兩種技術的組合可以直接且有效地解決將客戶意見分類並判斷情緒的需求。雖然跨國集團可能需要機器翻譯,但題目主要聚焦在意見分類和情緒識別上,而這兩者是核心需求。
問題 10 (中級)
------------------------------
題目: AI 治理 (AI Governance) 框架的建立,對於企業導入 AI 專案具有什麼樣的核心戰略意義?
選項:
A) 主要是為了確保 AI 系統能自動化生成所有所需的數據。
B) 確保 AI 專案能嚴格遵守倫理原則、法律法規,並有效管理潛在風險,提升企業信任度。
C) 主要目標是取代所有人工決策,實現完全自動化。
D) 僅限於對 AI 模型的技術性能進行評估。
答案: B) 確保 AI 專案能嚴格遵守倫理原則、法律法規,並有效管理潛在風險,提升企業信任度。
解析: AI 治理的核心意義在於建立一套全面的管理體系,它超越了單純的技術性能考量,旨在確保 AI 系統在整個生命週期中,都能符合倫理道德、法律法規的要求,並有效地識別和應對潛在風險(如偏見、隱私、安全等)。這有助於企業建立公眾信任,避免法律糾紛,並確保 AI 應用的永續發展。