高階管理者應該了解的六個 AI 問題

閱讀時間約 8 分鐘
raw-image


繼深度學習之後,生成式AI的發展已經大幅度的改變了市場的規則。但是企業的AI專案並非都能順利部署與後續發展,甚至許多AI項目在發展與部署後常常失敗,這不僅造成企業的成本損失,而且也造成高階管理者在決策上的尷尬。即便,近來大幅在生成式AI造成市場大幅成功的微軟,在過往的聊天機器人產品上面也有產生多個失誤。

MIT Sloan Management Review刊登的這篇研究就探討了AI及其深度學習模型如何改變商業決策與運作模式。並且探討數據科學家如何尋找有助於防止未來失敗的模式。


數據科學家都受過高度訓練,但是為何會產生錯誤?

數據科學家的教育訓練都集中在機器學習的處理上,並沒有考慮到產品在使用上的侷限性。因此,本篇研究認為「數據科學家無法有效防止或正確診斷AI模型的失敗?」

AI開發者必須評估「模型的泛化能力」,也就是「模型在未來以及超出其訓練數據集限制」的能力。但是,「模型泛化能力的定義並不清且缺乏嚴謹性。」

因此,這篇文章提出三個觀點就是協助缺乏技術的高階主管針對「辨識有效的AI模型和數據集」提出方法。

  1. 提供數據概念框架: 正確數據的概念,對於高階主管非常重要。在AI項目中使用的實際數據與所需的正確數據之間的不匹配可能是危險的。
  • 提出AI模型開發者應回答的六個問題: 在模型設計、開發和部署之前和期間,詢問模型開發者要回答六個問題。
  • 如何評估六個問題的答案


一、提出一個框架,有效識別正確的數據:

AI項目的成功與否取決於它所使用的數據集。為了幫助團隊找到正確的數據,我們提供了一個包含五個元素的框架。

  1. 待解決的問題與關注的群體。
  2. 正確數據的概念。 對數據質量基礎的重要貢獻是“適用性”概念,數據集是否適合做某個決策、操作或分析。根據問題的不同,適用性可能有許多不同的方面,但“數據是否正確?”和“這是否是正確的數據?”這兩個問題總是非常重要的。在這裡,我們將關注“這是否是正確的數據?”的問題,因為它對評估泛化能力和防止項目失敗至關重要。 正確數據的六個維度:(1)相關性/完整性,數據應具有預測能力。在我們的信用評分示例中,年齡、遲付款歷史和收入等屬性可能有助於此。(2)全面性/足夠的代表性,兩個主要問題是“數據是否足夠涵蓋關注的人群?”以及“是否有足夠的數據來充分訓練模型?”重要的是,隱私或其他顧慮可能要求必須排除某些數據。(3) 免受偏見影響,數據中可能隱藏著多種偏見,這一維度要求消除這些偏見。這在我們的信用評分示例中以及任何涉及人類的問題中都是一個特殊的顧慮。 (4)及時性,關鍵問題是“數據必須多新?”對於某些問題,較舊的數據可能包含難以消除的偏見。而在某些應用中,(未來的)數據在創建後幾秒鐘內就不再相關了。(5)清晰定義,所有術語,包括測量單位,應清晰定義。(6)適當的排除,在上述相關性和全面性的討論中,我們指出了一些數據應該被排除,考慮到法律、監管、倫理和知識產權的因素。例如,使用郵政編碼可以在信用決策中作為種族的代理,組織必須避免違反法律規定如何使用個人身份y資訊。


二、提出六個重要問題

問題定義階段:

  • 假設這個項目成功了,預計開發的模型將如何以及在哪裡被使用? 在答案中尋找什麼? 這個問題旨在確定模型開發者對企業試圖解決的實際問題的理解程度;關於關注的人群,哪些是範圍內的,哪些是範圍外的;以及開發者打算讓模型應用多久。 此外,這個問題為接下來的兩個問題奠定了基礎。我們建議管理者對這一查詢要求非常嚴格。太多的數據科學努力從一開始就因為未能明確問題聲明而註定失敗。


  • 如何獲取符合正確數據標準的訓練數據? 這個問題可能是最關鍵的。在這一點上,模型開發者正在預測他們能獲取什麼數據。確保開發者已經整理出了正確的數據標準(使用上述六個考慮因素,從相關性開始)。接下來,檢查開發者是否有可信的計劃來獲得符合這些標準的數據。如果他們在這一階段的回答不足,應該重新回到設計。


構建AI模型階段

  • 採取了哪些步驟來理解所獲訓練數據的完整歷史、細節、優勢和限制?與正確數據標準相比如何? 高階管理者需要確認 AI 模型開發者實際獲得了他們在第2個問題中預期獲得的數據。要求AI 模型開發者按標準相比較,列出訓練數據與正確數據之間的差距,評估差距的嚴重性,並解釋他們彌補重要差距的計劃。由於現實世界沒有所謂的完美數據集,因此預計會有差距。如果AI模型開發者報告說沒有差距,那就非常可疑。
  • 如何檢查未來數據是否滿足正確數據標準? 在此時探討模型開發者,當AI 模型開發者剛剛完成訓練數據的工作時,確保他們考慮了未來數據的來源。如果沒有,要求他們仔細考慮這一點。 (第5個問題將對此進行後續跟進。)


部署前和部署階段

  • 你將如何確保未來數據符合你的期望?為了確保成功部署和未來數據的模型準確性,你們有哪些對數據和模型的控制措施? 這是基於第4個問題關於未來數據的討論,高階管理者應該要確保開發者已經建立了一套評估未來數據的系統,在使用這些數據於模型或用於更新模型之前進行評估。這一點非常重要,因為公司希望AI模型部署能達到最佳效果,但高階管理者通常會被建議要為最壞的情況做好準備。管理者應確保模型開發者有一個控制計劃,這個計劃能夠防止或至少提前警告未來數據的變化或模型性能的不良。例如,模型準確度隨時間逐漸下降將如何被檢測到?最後,探究開發者更新模型的計劃,隨著未來數據的可用性。
  • 能想像模型在部署中可能失敗的前三種方式是什麼?AI已經採取了哪些步驟來減少這些風險? AI 模型開發者很久以前就已經學會了技術系統常常會在他們最努力的情況下失敗。因此,他們開發了失效模式和效應分析(FMEA),以幫助在問題發生之前預見潛在的失敗並制定應急計劃以避免或至少檢測到它們。

三、結論

高階管理者應該知道許多數據科學家和AI模型開發者可能不喜歡回答這些問題。但考慮到數據科學專案的高失敗率,詢問“如何防止專案失敗?”是良好的管理作為。

更重要的是,正如一個Google研究團隊所指出的,“每個人都想做模型工作,而不是數據工作。”

但是,高階管理者沒有這種奢侈。強調正確的數據的重要性,不僅僅是為了構建模型,而且還包括將來驗證和利用這些模型,這或許是管理者增加機器學習和AI專案成功率最重要的一件事。


資料來源:What Managers Should Ask About AI Models and Data Sets

M-Insight : AI科技創新 分享有關人工智慧對於產業與企業的實務應用、研究成果、產業情報等資訊,歡迎人工智慧、醫藥生技、科技管理領域的同好、專家學者、醫師、研究人員與業界朋友一同參與交流。
留言0
查看全部
發表第一個留言支持創作者!
MIT Sloan Management Review 刊登了一篇關於生成式人工智能中獲利者的新觀點文章,從技術架構到主要獲利者,以及面臨的機會與挑戰進行了探討。對於AI行業的從業者和學術研究人員來說,這份文章提供了寶貴的資訊。
大型語言模型 (LLM) 在最近幾年取得了重大進展,並引起了人們對生成式AI將如何影響工作方式的廣泛重視。雖然 LLM 具有強大的文本生成、翻譯和理解能力,但它們對工作的影響仍然是一個複雜且充滿爭議的話題。 本文摘要自MIT 史隆管理評論,分析LLM 對工作帶來的影響。
本文提供了博士生每週的閱讀量必須掌握到10-20篇文章的建議。除了閱讀快、整理快、產出快的重點外,還介紹了使用ChatGPT進行快速閱讀文獻的方法,並提供了具體的指令式和簡報式Prompt。這篇文章還以研究者的角度,使用特定的例子回顧了文獻的內容,並分享了關於實驗設計和步驟的內容。
在閱讀研究文獻時,我們需要整理研究先進們在類似主題中的發展方式與流程。本文介紹了使用ChatGPT協助快速理解文章的方法,特別強調了Prompt的使用。希望與讀者分享Prompt的創意並歡迎各領域研究者合作交流討論。
本文介紹瞭如何使用Prompt解讀醫學研究概念架構圖,並以“Machine Learning to Infer a Health State Using Biomedical Signals”這一主題為例,展開分析。
這一篇文章是我投稿至第83屆AOM國際研討會(Academy of Management)中文版手稿的節錄版本,我將其中比較理論面的部分刪減,把能實務應用的部分進行說明,希望能方便大家閱讀以理解在AI時代,企業面對的知識管理與獨特性競爭策略的議題。 這篇文章獲得 AOM 國際研討會(國科會認可的
MIT Sloan Management Review 刊登了一篇關於生成式人工智能中獲利者的新觀點文章,從技術架構到主要獲利者,以及面臨的機會與挑戰進行了探討。對於AI行業的從業者和學術研究人員來說,這份文章提供了寶貴的資訊。
大型語言模型 (LLM) 在最近幾年取得了重大進展,並引起了人們對生成式AI將如何影響工作方式的廣泛重視。雖然 LLM 具有強大的文本生成、翻譯和理解能力,但它們對工作的影響仍然是一個複雜且充滿爭議的話題。 本文摘要自MIT 史隆管理評論,分析LLM 對工作帶來的影響。
本文提供了博士生每週的閱讀量必須掌握到10-20篇文章的建議。除了閱讀快、整理快、產出快的重點外,還介紹了使用ChatGPT進行快速閱讀文獻的方法,並提供了具體的指令式和簡報式Prompt。這篇文章還以研究者的角度,使用特定的例子回顧了文獻的內容,並分享了關於實驗設計和步驟的內容。
在閱讀研究文獻時,我們需要整理研究先進們在類似主題中的發展方式與流程。本文介紹了使用ChatGPT協助快速理解文章的方法,特別強調了Prompt的使用。希望與讀者分享Prompt的創意並歡迎各領域研究者合作交流討論。
本文介紹瞭如何使用Prompt解讀醫學研究概念架構圖,並以“Machine Learning to Infer a Health State Using Biomedical Signals”這一主題為例,展開分析。
這一篇文章是我投稿至第83屆AOM國際研討會(Academy of Management)中文版手稿的節錄版本,我將其中比較理論面的部分刪減,把能實務應用的部分進行說明,希望能方便大家閱讀以理解在AI時代,企業面對的知識管理與獨特性競爭策略的議題。 這篇文章獲得 AOM 國際研討會(國科會認可的
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
導言: 在現代生活中,人們越來越注重家居清潔和生活品質。高階掃地機器人已成為現代家庭的必備良伴,能夠輕鬆解決家中灰塵和污垢的問題,同時節省寶貴的時間。本文將為您推薦兩款高階掃地機器人,分別是iRobot Roomba Combo j7+和Dreame追覓科技 L10s Ultra。
我做合盤 不會用類型說誰與誰「合不合」! 不會把2人混合一個人類圖 不會因為相連通道使2人著色。 人類圖合盤 第一 了解人生角色 2人如何溝通? 1爻如何要清楚? 6爻卻未說便以為對方明白? 3爻要試,5爻卻1口咬定 卻未必有實際細節。 1-6爻 單是在2人溝通
Thumbnail
這本書的作者許詮,90後當上外商副總、28歲時年薪就以破700萬。 身為BD人的我,更想知道作者多年闖蕩外商的背後心法, 如何讓自己除了努力之外,能突破更多可能。 一起來收聽這集節目吧! 聽眾信箱,給個機會讓我更了解妳吧:) https://www.surveycake.com/s/rvkDd
Thumbnail
每一層主管發展都需要能力標準與評鑑工具。評鑑中最難的是評鑑中心。 我見過一家公司很自豪的建立一個給總經理候選人評鑑的模擬。在決策部分,他引用了招聘的人才選擇個案。列出工作的標準,以及五個候選人的基本資料,在當中選擇一位候選人。個案設計得還不錯。 問題在於太簡單。多重方案中篩選是中階主管的決策技巧,到
Thumbnail
矩陣式 LED 頭燈光源技術:矩陣頭燈的燈組由數個高亮度LED單體所組成,通過排列組合以及燈組前的透鏡和反光鏡等部件, 讓系統控制每個LED單體調整照明角度與範圍,不需要傳統的機械旋轉結構就能實現調節照明範圍的效果。工程師更易於掌控每個燈組內的LED數量,造型的自由度變得更大。
Thumbnail
※本專欄之文章僅供參考之用,並不構成要約、招攬或邀請、誘使、任何不論種類或形式之申述或訂立任何建議及推薦,請讀者運用個人獨立思考能力,自行作出投資決定,如因相關建議招致損失,概與《麥斯產業前瞻分析》及作者無涉。
Thumbnail
香港是個變化相當大的城市,要新舊交融不容易,特別政府不重視保育,只有靠民間的小店小商家共同努力,才得以保住代表香港的東西。
花過多的時間,再了解、掌控部屬的所有行蹤,最後部門的成效仍然無法提升。以自己的專業為基礎,提出相關的改善計畫,成員卻不想配合、一堆藉口,甚至勉強執行,結果也不如預期。越來越著重保障自己的職位,害怕自己或部屬犯錯。越來越深信,讓公司收益大幅提升是自己做不到的事。
Thumbnail
文/陳亭妘 圖/MMDC關鍵數位行銷提供   12月21日,由MMDC關鍵數位行銷、資策會主辦、dcplus數位行銷實戰家協辦的「第四屆高階經理人數位策略高峰會」,在張榮發基金會國際會議廳舉辦,邀請8位講師以馬拉松式分享,探討大數據採集及如何精準應用,發揮行銷效益。 How digit
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
導言: 在現代生活中,人們越來越注重家居清潔和生活品質。高階掃地機器人已成為現代家庭的必備良伴,能夠輕鬆解決家中灰塵和污垢的問題,同時節省寶貴的時間。本文將為您推薦兩款高階掃地機器人,分別是iRobot Roomba Combo j7+和Dreame追覓科技 L10s Ultra。
我做合盤 不會用類型說誰與誰「合不合」! 不會把2人混合一個人類圖 不會因為相連通道使2人著色。 人類圖合盤 第一 了解人生角色 2人如何溝通? 1爻如何要清楚? 6爻卻未說便以為對方明白? 3爻要試,5爻卻1口咬定 卻未必有實際細節。 1-6爻 單是在2人溝通
Thumbnail
這本書的作者許詮,90後當上外商副總、28歲時年薪就以破700萬。 身為BD人的我,更想知道作者多年闖蕩外商的背後心法, 如何讓自己除了努力之外,能突破更多可能。 一起來收聽這集節目吧! 聽眾信箱,給個機會讓我更了解妳吧:) https://www.surveycake.com/s/rvkDd
Thumbnail
每一層主管發展都需要能力標準與評鑑工具。評鑑中最難的是評鑑中心。 我見過一家公司很自豪的建立一個給總經理候選人評鑑的模擬。在決策部分,他引用了招聘的人才選擇個案。列出工作的標準,以及五個候選人的基本資料,在當中選擇一位候選人。個案設計得還不錯。 問題在於太簡單。多重方案中篩選是中階主管的決策技巧,到
Thumbnail
矩陣式 LED 頭燈光源技術:矩陣頭燈的燈組由數個高亮度LED單體所組成,通過排列組合以及燈組前的透鏡和反光鏡等部件, 讓系統控制每個LED單體調整照明角度與範圍,不需要傳統的機械旋轉結構就能實現調節照明範圍的效果。工程師更易於掌控每個燈組內的LED數量,造型的自由度變得更大。
Thumbnail
※本專欄之文章僅供參考之用,並不構成要約、招攬或邀請、誘使、任何不論種類或形式之申述或訂立任何建議及推薦,請讀者運用個人獨立思考能力,自行作出投資決定,如因相關建議招致損失,概與《麥斯產業前瞻分析》及作者無涉。
Thumbnail
香港是個變化相當大的城市,要新舊交融不容易,特別政府不重視保育,只有靠民間的小店小商家共同努力,才得以保住代表香港的東西。
花過多的時間,再了解、掌控部屬的所有行蹤,最後部門的成效仍然無法提升。以自己的專業為基礎,提出相關的改善計畫,成員卻不想配合、一堆藉口,甚至勉強執行,結果也不如預期。越來越著重保障自己的職位,害怕自己或部屬犯錯。越來越深信,讓公司收益大幅提升是自己做不到的事。
Thumbnail
文/陳亭妘 圖/MMDC關鍵數位行銷提供   12月21日,由MMDC關鍵數位行銷、資策會主辦、dcplus數位行銷實戰家協辦的「第四屆高階經理人數位策略高峰會」,在張榮發基金會國際會議廳舉辦,邀請8位講師以馬拉松式分享,探討大數據採集及如何精準應用,發揮行銷效益。 How digit