高階管理者應該了解的六個 AI 問題

更新於 發佈於 閱讀時間約 8 分鐘
raw-image


繼深度學習之後,生成式AI的發展已經大幅度的改變了市場的規則。但是企業的AI專案並非都能順利部署與後續發展,甚至許多AI項目在發展與部署後常常失敗,這不僅造成企業的成本損失,而且也造成高階管理者在決策上的尷尬。即便,近來大幅在生成式AI造成市場大幅成功的微軟,在過往的聊天機器人產品上面也有產生多個失誤。

MIT Sloan Management Review刊登的這篇研究就探討了AI及其深度學習模型如何改變商業決策與運作模式。並且探討數據科學家如何尋找有助於防止未來失敗的模式。


數據科學家都受過高度訓練,但是為何會產生錯誤?

數據科學家的教育訓練都集中在機器學習的處理上,並沒有考慮到產品在使用上的侷限性。因此,本篇研究認為「數據科學家無法有效防止或正確診斷AI模型的失敗?」

AI開發者必須評估「模型的泛化能力」,也就是「模型在未來以及超出其訓練數據集限制」的能力。但是,「模型泛化能力的定義並不清且缺乏嚴謹性。」

因此,這篇文章提出三個觀點就是協助缺乏技術的高階主管針對「辨識有效的AI模型和數據集」提出方法。

  1. 提供數據概念框架: 正確數據的概念,對於高階主管非常重要。在AI項目中使用的實際數據與所需的正確數據之間的不匹配可能是危險的。
  • 提出AI模型開發者應回答的六個問題: 在模型設計、開發和部署之前和期間,詢問模型開發者要回答六個問題。
  • 如何評估六個問題的答案


一、提出一個框架,有效識別正確的數據:

AI項目的成功與否取決於它所使用的數據集。為了幫助團隊找到正確的數據,我們提供了一個包含五個元素的框架。

  1. 待解決的問題與關注的群體。
  2. 正確數據的概念。 對數據質量基礎的重要貢獻是“適用性”概念,數據集是否適合做某個決策、操作或分析。根據問題的不同,適用性可能有許多不同的方面,但“數據是否正確?”和“這是否是正確的數據?”這兩個問題總是非常重要的。在這裡,我們將關注“這是否是正確的數據?”的問題,因為它對評估泛化能力和防止項目失敗至關重要。 正確數據的六個維度:(1)相關性/完整性,數據應具有預測能力。在我們的信用評分示例中,年齡、遲付款歷史和收入等屬性可能有助於此。(2)全面性/足夠的代表性,兩個主要問題是“數據是否足夠涵蓋關注的人群?”以及“是否有足夠的數據來充分訓練模型?”重要的是,隱私或其他顧慮可能要求必須排除某些數據。(3) 免受偏見影響,數據中可能隱藏著多種偏見,這一維度要求消除這些偏見。這在我們的信用評分示例中以及任何涉及人類的問題中都是一個特殊的顧慮。 (4)及時性,關鍵問題是“數據必須多新?”對於某些問題,較舊的數據可能包含難以消除的偏見。而在某些應用中,(未來的)數據在創建後幾秒鐘內就不再相關了。(5)清晰定義,所有術語,包括測量單位,應清晰定義。(6)適當的排除,在上述相關性和全面性的討論中,我們指出了一些數據應該被排除,考慮到法律、監管、倫理和知識產權的因素。例如,使用郵政編碼可以在信用決策中作為種族的代理,組織必須避免違反法律規定如何使用個人身份y資訊。


二、提出六個重要問題

問題定義階段:

  • 假設這個項目成功了,預計開發的模型將如何以及在哪裡被使用? 在答案中尋找什麼? 這個問題旨在確定模型開發者對企業試圖解決的實際問題的理解程度;關於關注的人群,哪些是範圍內的,哪些是範圍外的;以及開發者打算讓模型應用多久。 此外,這個問題為接下來的兩個問題奠定了基礎。我們建議管理者對這一查詢要求非常嚴格。太多的數據科學努力從一開始就因為未能明確問題聲明而註定失敗。


  • 如何獲取符合正確數據標準的訓練數據? 這個問題可能是最關鍵的。在這一點上,模型開發者正在預測他們能獲取什麼數據。確保開發者已經整理出了正確的數據標準(使用上述六個考慮因素,從相關性開始)。接下來,檢查開發者是否有可信的計劃來獲得符合這些標準的數據。如果他們在這一階段的回答不足,應該重新回到設計。


構建AI模型階段

  • 採取了哪些步驟來理解所獲訓練數據的完整歷史、細節、優勢和限制?與正確數據標準相比如何? 高階管理者需要確認 AI 模型開發者實際獲得了他們在第2個問題中預期獲得的數據。要求AI 模型開發者按標準相比較,列出訓練數據與正確數據之間的差距,評估差距的嚴重性,並解釋他們彌補重要差距的計劃。由於現實世界沒有所謂的完美數據集,因此預計會有差距。如果AI模型開發者報告說沒有差距,那就非常可疑。
  • 如何檢查未來數據是否滿足正確數據標準? 在此時探討模型開發者,當AI 模型開發者剛剛完成訓練數據的工作時,確保他們考慮了未來數據的來源。如果沒有,要求他們仔細考慮這一點。 (第5個問題將對此進行後續跟進。)


部署前和部署階段

  • 你將如何確保未來數據符合你的期望?為了確保成功部署和未來數據的模型準確性,你們有哪些對數據和模型的控制措施? 這是基於第4個問題關於未來數據的討論,高階管理者應該要確保開發者已經建立了一套評估未來數據的系統,在使用這些數據於模型或用於更新模型之前進行評估。這一點非常重要,因為公司希望AI模型部署能達到最佳效果,但高階管理者通常會被建議要為最壞的情況做好準備。管理者應確保模型開發者有一個控制計劃,這個計劃能夠防止或至少提前警告未來數據的變化或模型性能的不良。例如,模型準確度隨時間逐漸下降將如何被檢測到?最後,探究開發者更新模型的計劃,隨著未來數據的可用性。
  • 能想像模型在部署中可能失敗的前三種方式是什麼?AI已經採取了哪些步驟來減少這些風險? AI 模型開發者很久以前就已經學會了技術系統常常會在他們最努力的情況下失敗。因此,他們開發了失效模式和效應分析(FMEA),以幫助在問題發生之前預見潛在的失敗並制定應急計劃以避免或至少檢測到它們。

三、結論

高階管理者應該知道許多數據科學家和AI模型開發者可能不喜歡回答這些問題。但考慮到數據科學專案的高失敗率,詢問“如何防止專案失敗?”是良好的管理作為。

更重要的是,正如一個Google研究團隊所指出的,“每個人都想做模型工作,而不是數據工作。”

但是,高階管理者沒有這種奢侈。強調正確的數據的重要性,不僅僅是為了構建模型,而且還包括將來驗證和利用這些模型,這或許是管理者增加機器學習和AI專案成功率最重要的一件事。


資料來源:What Managers Should Ask About AI Models and Data Sets

M-Insight : AI科技創新 分享有關人工智慧對於產業與企業的實務應用、研究成果、產業情報等資訊,歡迎人工智慧、醫藥生技、科技管理領域的同好、專家學者、醫師、研究人員與業界朋友一同參與交流。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
MIT Sloan Management Review 刊登了一篇關於生成式人工智能中獲利者的新觀點文章,從技術架構到主要獲利者,以及面臨的機會與挑戰進行了探討。對於AI行業的從業者和學術研究人員來說,這份文章提供了寶貴的資訊。
大型語言模型 (LLM) 在最近幾年取得了重大進展,並引起了人們對生成式AI將如何影響工作方式的廣泛重視。雖然 LLM 具有強大的文本生成、翻譯和理解能力,但它們對工作的影響仍然是一個複雜且充滿爭議的話題。 本文摘要自MIT 史隆管理評論,分析LLM 對工作帶來的影響。
本文提供了博士生每週的閱讀量必須掌握到10-20篇文章的建議。除了閱讀快、整理快、產出快的重點外,還介紹了使用ChatGPT進行快速閱讀文獻的方法,並提供了具體的指令式和簡報式Prompt。這篇文章還以研究者的角度,使用特定的例子回顧了文獻的內容,並分享了關於實驗設計和步驟的內容。
在閱讀研究文獻時,我們需要整理研究先進們在類似主題中的發展方式與流程。本文介紹了使用ChatGPT協助快速理解文章的方法,特別強調了Prompt的使用。希望與讀者分享Prompt的創意並歡迎各領域研究者合作交流討論。
本文介紹瞭如何使用Prompt解讀醫學研究概念架構圖,並以“Machine Learning to Infer a Health State Using Biomedical Signals”這一主題為例,展開分析。
這一篇文章是我投稿至第83屆AOM國際研討會(Academy of Management)中文版手稿的節錄版本,我將其中比較理論面的部分刪減,把能實務應用的部分進行說明,希望能方便大家閱讀以理解在AI時代,企業面對的知識管理與獨特性競爭策略的議題。 這篇文章獲得 AOM 國際研討會(國科會認可的
MIT Sloan Management Review 刊登了一篇關於生成式人工智能中獲利者的新觀點文章,從技術架構到主要獲利者,以及面臨的機會與挑戰進行了探討。對於AI行業的從業者和學術研究人員來說,這份文章提供了寶貴的資訊。
大型語言模型 (LLM) 在最近幾年取得了重大進展,並引起了人們對生成式AI將如何影響工作方式的廣泛重視。雖然 LLM 具有強大的文本生成、翻譯和理解能力,但它們對工作的影響仍然是一個複雜且充滿爭議的話題。 本文摘要自MIT 史隆管理評論,分析LLM 對工作帶來的影響。
本文提供了博士生每週的閱讀量必須掌握到10-20篇文章的建議。除了閱讀快、整理快、產出快的重點外,還介紹了使用ChatGPT進行快速閱讀文獻的方法,並提供了具體的指令式和簡報式Prompt。這篇文章還以研究者的角度,使用特定的例子回顧了文獻的內容,並分享了關於實驗設計和步驟的內容。
在閱讀研究文獻時,我們需要整理研究先進們在類似主題中的發展方式與流程。本文介紹了使用ChatGPT協助快速理解文章的方法,特別強調了Prompt的使用。希望與讀者分享Prompt的創意並歡迎各領域研究者合作交流討論。
本文介紹瞭如何使用Prompt解讀醫學研究概念架構圖,並以“Machine Learning to Infer a Health State Using Biomedical Signals”這一主題為例,展開分析。
這一篇文章是我投稿至第83屆AOM國際研討會(Academy of Management)中文版手稿的節錄版本,我將其中比較理論面的部分刪減,把能實務應用的部分進行說明,希望能方便大家閱讀以理解在AI時代,企業面對的知識管理與獨特性競爭策略的議題。 這篇文章獲得 AOM 國際研討會(國科會認可的
你可能也想看
Google News 追蹤
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
AI 的應用已經成為企業管理的重點。本文探討 AI 的三層次應用,包括如何與團隊協作提升工作表現、融合好奇心與同理心,以及恆毅力在工作中的重要性。同時,分析 Apple Intelligence 及其策略,瞭解 AI 背後的機會與挑戰,讓企業在這個數據驅動的時代中脫穎而出。
Thumbnail
現代技術背景下的挑戰與機遇 隨著技術團隊和項目規模的擴大,領導力與項目管理的重要性日益凸顯。特別是在AI技術飛速發展的今天,如何有效地管理項目、激勵團隊並推動技術變革,已成為每一位技術領導者面臨的核心挑戰。 技術熟悉度與應用能力 領導者必須對AI技術有深刻的理解,了解其能力和限制。這樣
N001|【AI 訓練陷阱:AI 訓練數據品質下降的危機】 ── 1. 模型崩潰(Model Collapse) 2. 資料來源的重要性(Importance of Data Source) 3. 多樣性和代表性(Diversity and Representativeness)4. 保持數據品質
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
現代AI產品經理需要具備的六大核心能力 一、策略與願景:專注於改善用戶生活 二、負責任的AI管理:風險和責任 三、深入了解數據:數據來源和安全 四、模型開發與生命周期 五、評估:系統性能和輸出的評估 六、推向市場:從內部測試到外部發布
Thumbnail
使用AI生成圖片對品牌行銷會造成什麼負面影響? 或許很多人會想,AI算圖有這麼嚴重嗎?許多企業公司不是都這麼做。 身為從事品牌行銷長達十五年的創意人員,我必須誠實的說,有,真的有這麼嚴重, 為什麼會這麼說是因為...
Thumbnail
自從 2022 年 11 月 30 日 ChatGPT 推出後,引發了一場狂熱,世界也就改變了。生成式 AI 在企業中的應用迅速擴展,帶來新的效率與商機。由於企業內部安裝設罝必要安控護欄的速度,遠不及生成式 AI 的使用擴展速度,因此增加企業潛在的風險,並產生巨大的隱憂。
Thumbnail
根據 Gartner 的預測,到 2030 年,80% 的專案管理工作將會由人工智慧完成。 專案經理看到這樣的數據可能會感到憂心。但換個思維與態度,這個趨勢應該被視為一個機會,你會發現 AI 無法完全取代你的工作。它反而會讓你的專案管理工作變得更有效率、更具成效,同時還能提供更深入與前瞻性的見解,
Thumbnail
已經成真的AI生成文字、圖片、音樂、影片,以及接下來更多的AI運用場景,每一項都將對人類社會產生重大的影響:包括抽象的人心、文化、審美、親密關係,以及實質的就業、經濟、生活、生涯規劃等。 本文我會以大量使用、測試AI的經驗,輔以田野調查的經驗,詳細說明AI時代最應該培養的四項能力。
Thumbnail
你還在欣賞網友們以生成式 AI 創作的龍年賀卡嗎?事實上,已經有許多企業主管開始思考:如何為企業部署生成式 AI 人才發展策略。 這篇文章介紹了生成式 AI 在人才管理和學習與發展領域的應用,包括人才管理和學習內容的個性化、技能和能力的評估,以及不同角色在IT行業中的例子....
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
AI 的應用已經成為企業管理的重點。本文探討 AI 的三層次應用,包括如何與團隊協作提升工作表現、融合好奇心與同理心,以及恆毅力在工作中的重要性。同時,分析 Apple Intelligence 及其策略,瞭解 AI 背後的機會與挑戰,讓企業在這個數據驅動的時代中脫穎而出。
Thumbnail
現代技術背景下的挑戰與機遇 隨著技術團隊和項目規模的擴大,領導力與項目管理的重要性日益凸顯。特別是在AI技術飛速發展的今天,如何有效地管理項目、激勵團隊並推動技術變革,已成為每一位技術領導者面臨的核心挑戰。 技術熟悉度與應用能力 領導者必須對AI技術有深刻的理解,了解其能力和限制。這樣
N001|【AI 訓練陷阱:AI 訓練數據品質下降的危機】 ── 1. 模型崩潰(Model Collapse) 2. 資料來源的重要性(Importance of Data Source) 3. 多樣性和代表性(Diversity and Representativeness)4. 保持數據品質
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
現代AI產品經理需要具備的六大核心能力 一、策略與願景:專注於改善用戶生活 二、負責任的AI管理:風險和責任 三、深入了解數據:數據來源和安全 四、模型開發與生命周期 五、評估:系統性能和輸出的評估 六、推向市場:從內部測試到外部發布
Thumbnail
使用AI生成圖片對品牌行銷會造成什麼負面影響? 或許很多人會想,AI算圖有這麼嚴重嗎?許多企業公司不是都這麼做。 身為從事品牌行銷長達十五年的創意人員,我必須誠實的說,有,真的有這麼嚴重, 為什麼會這麼說是因為...
Thumbnail
自從 2022 年 11 月 30 日 ChatGPT 推出後,引發了一場狂熱,世界也就改變了。生成式 AI 在企業中的應用迅速擴展,帶來新的效率與商機。由於企業內部安裝設罝必要安控護欄的速度,遠不及生成式 AI 的使用擴展速度,因此增加企業潛在的風險,並產生巨大的隱憂。
Thumbnail
根據 Gartner 的預測,到 2030 年,80% 的專案管理工作將會由人工智慧完成。 專案經理看到這樣的數據可能會感到憂心。但換個思維與態度,這個趨勢應該被視為一個機會,你會發現 AI 無法完全取代你的工作。它反而會讓你的專案管理工作變得更有效率、更具成效,同時還能提供更深入與前瞻性的見解,
Thumbnail
已經成真的AI生成文字、圖片、音樂、影片,以及接下來更多的AI運用場景,每一項都將對人類社會產生重大的影響:包括抽象的人心、文化、審美、親密關係,以及實質的就業、經濟、生活、生涯規劃等。 本文我會以大量使用、測試AI的經驗,輔以田野調查的經驗,詳細說明AI時代最應該培養的四項能力。
Thumbnail
你還在欣賞網友們以生成式 AI 創作的龍年賀卡嗎?事實上,已經有許多企業主管開始思考:如何為企業部署生成式 AI 人才發展策略。 這篇文章介紹了生成式 AI 在人才管理和學習與發展領域的應用,包括人才管理和學習內容的個性化、技能和能力的評估,以及不同角色在IT行業中的例子....