給產品經理的AI開發指南#2:如何管理機器學習產品?/Bastiane Huang

更新於 發佈於 閱讀時間約 11 分鐘

在設計機器學習相關產品與服務時,必須瞭解它和一般軟體開發的不同、以及過程中獨特的優先順序與需求。前一篇中探討了機器學習產品開發時,專案經理必須具有的基礎認識和挑戰,本文則延續討論相關的產品管理須知。

Bastiane HuangBastiane Huang目前在舊金山的AI/Robotics新創公司擔任產品經理,擁有近10年產品行銷及市場開發管理經驗;曾在美國《機器人商業評論》及《哈佛商業評論》發表文章及個案研究。如果你也對Robotics 2.0(AI-Enabled Robotics)、產品管理、Future of Work有興趣,歡迎追蹤她的最新訊息
raw-image

比起一般軟體,機器學習(ML)產品需要更多的反覆試驗;因此,作為PM(專案經理),你需要給工程師和資料科學家足夠的空間和時間去探索。

但要如何幫助團隊應對這些不確定性呢?如何在明確定義問題和衡量成功標準的同時,又給團隊足夠彈性進行實驗探索?

1. 規劃:從「明確定義問題」開始

ML是一種工具、也是達到目標的方法之一。如果你想解決的問題並不需要ML,就不應該使用它。

我們要從確定問題開始:找到有市場需求、技術上可行的客戶痛點;先進行市場評估,找出客戶需求。

接下來,則是判斷ML是否可以幫助我們解決使用者的問題。

機器學習有許多可能的應用,但最適合的是用來進行決策或預測。

我們可以將ML應用分為幾種類型:

  • 檢測/檢查(detection/inspection):幫助使用者識別缺陷或異常,例如銀行或保險的欺詐檢測、或是生產線上的產品缺陷檢測;
  • 模式識別(pattern recognition):幫助使用者篩選大量數據,包括推薦、排序、個人化、分類、預測維護、以及人機互動;例如針對Alexa或Google Home等智慧音箱進行自然語言處理(NLP);
  • 高維認知(high-dimension cognition):幫助使用者篩選、處理大量高維感官數據;例如人工智慧機器人、自動駕駛汽車。

在以下情況下,你應該避免在產品中使用機器學習功能:

  • 可以用更簡單的規則解決問題;
  • 正在構建的解決方案不需要因應新數據而改變;
  • 無法取得訓練ML模型所需的數據;
  • 產品要求高精度,不能容許任何一點出錯;
  • 產品需要資訊完全透明。

找到正確的問題之後,下一個關鍵任務就是「明確定義需求」。

開發ML產品是一個需要迅速迭代(iterative)的過程。常會聽到有人說「我們先建一個ML模型,再看看結果如何」,但如果跳過了「事前計劃」和「定義問題」的步驟,最後可能反而會浪費整個團隊大量的時間,而得不到具體結果。

2. 定義「目標函數」和「指標」,保留更多空間和彈性

ML產品不需要我們事先編寫規則,而是由機器自動從大量數據中分析出規則。

與一般的軟體工程相比,它更具實驗性及不確定性,所以很難預測哪些方法有效、哪些無效。這就是為什麼在決定最終解決方案之前,必須給工程師和資料科學家更多的空間和時間去探索。

作為產品經理,你可以藉由以下方法,幫助團隊在廣泛的探索過程中保持專注:

  • 定義一個目標函數(objective function):你的ML模型試圖預測的期望結果是什麼?或者你還在嘗試辨識出資料中的固定模式?有什麼「已知事實」(ground truth)可以用來比較模型的結果、並判斷準確性?例如你設計了一個模型來預測天氣,就可以比較預測結果與實際天氣數據,來驗證模型的性能。
  • 定義性能指標(performance metrics):如何衡量產品的成敗?設置驗收標準並不總是那麼容易。你會如何比較「翻譯模型」和「人工翻譯」的準確度?有時需要先查看模型的初步結果,才能確定標準為何;但最重要的,是儘早開始思考測試標準、並且不斷測試模型,直到找出預測結果令人滿意的ML模型為止。
  • 儘早並頻繁測試ML模型(end-to-end testing): 你可以將ML模型看作一個黑盒子;定義模型的輸入和輸出,但不一定瞭解盒子裡的神經網路如何運作。這就是為什麼儘早、並且儘可能頻繁測試很重要;從簡單的原型(prototype)開始測試關鍵功能,然後進行修改。重點是,盡量避免在驗證好模型的關鍵功能前,就試圖建構太複雜的解決方案。

但需要注意的是,模型本身的準確性通常並不是最好的衡量標準。

我們必須同時考慮測量精確度(true positives/all positive predictions)和召回率(positive predictions/all true positives);精確度是「多少個選定項目的相關性」,而召回率則是「選定多少個相關項目的相關性」。

這沒有適用於所有情況的經驗法則,所以你需要根據使用者的案例來決定權衡。

3. 從第一天就開始考量數據策略

訓練ML模型需要大量高品質的數據。在使用大量數據進行訓練時,深度學習的性能會優於舊的算法;因此,從第一天就開始計畫取得數據的策略和途徑就非常重要。

數據可以來自購買、與其他公司合作、從客戶那裡收集、在內部生成、或是僱用第三方來生成或標記數據。同時,你也需要考慮競爭對手在做什麼、客戶和監管機構在想什麼、以及每種策略的相應可行性和成本。

擬定數據策略的責任不在於資料科學家,而在於產品經理,而且公司高層也需要經過清楚定義的競爭策略。

如果你是一家新創公司, 更需要三思而後行:你想進入的市場,是否有產業巨頭掌握了大多數資料?你可能不想在電子商務上與Amazon競爭、或是在位置資料方面與Google地圖匹敵。

所以,你必須找到目前還沒有一家公司能主導客戶資料的藍海市場。

你是否能夠建立可以保護、而且可以持續的數據管道(data pipeline)?如何遵守使用者的隱私政策?如果你的公司在歐盟和其他數據保護法規範圍內營運,則必須熟悉GDPR(通用資料保護法規)的規定。

例如根據GDPR,公司需要確保個人資料不僅是合法收集的、也要能防止他人濫用;因此,PM必須從產品開發的早期階段就考慮資料保護措施。

PM必須與ML團隊討論,以確定未來需要什麼數據、需要多少數據;同時,也必須讓法務和營運部門等其他相關單位參與。

為機器人和自動駕駛汽車等現實世界應用開發ML產品,帶來了更大的挑戰;所以必須充分利用模擬(simulation)方法、並且注意相關研究領域,包括轉移學習(Transfer Learning)和元學習(Meta Learning),以降低對大量數據的需求、並加快模型訓練過程。

4. 不能只考慮ML

構建ML產品的過程,其實是跨領域的;而且在大多數情況下,我們開發的並不只是ML模型而已。為了做出完整、可立即投入生產的產品,我們還需要使用者介面(UI)、執行模型預測的軟體、以及硬體的搭配組合。

如果過度專注於ML模型上,而忽略了使用者體驗(UX),產品就不會成功。你需要一個不僅包括ML工程師和資料科學家,還包括數據工程師、軟體工程師、UI/UX設計專家和硬體工程師的跨領域的團隊;此外,還需要與後端工程師合作,以打造出支持ML產品的基礎結構。

作為PM,必須盡量減少不同職能或團隊之間的相互依賴和衝突。如前所述,ML的性質與一般軟體開發完全不同,因此在組織上也應該有所改變。

例如,雖然每日的站立會議(stand-up meetings)可能有助於保持軟體工程團隊的生產力,但對於ML團隊而言,這可能不是最好的時間利用方式。所以,ML開發不僅僅是技術上的改變,還牽涉到組織變革。

作為產品經理,你可以幫助其他團隊瞭解ML產品在本質上的不同、並協助解決潛在的衝突。

PM與內部團隊和客戶的溝通也很重要。ML產品的性能,會隨著時間的推移而提高;但這也代表著,客戶可能無法在一開始就獲得最好的結果。使用者可以接受這一點嗎?

如何減輕使用者的風險、並保證可接受的最低性能?如何設計產品,以降低不確定性、並獲得最好的使用體驗?

5. 投資ML產品的理由

  • 改善使用者體驗或產品功能:ML可以用來讓產品更個人化、或是客製化;例如讓使用者更容易找到最相關的結果,或是應用ML來提高預測的準確性。這些都是對公司內部或外部使用者(客戶)潛在需求應用的考量。
  • 將流程或重複性任務自動化:公司同仁或客戶是否需要重複執行一些可以自動化的流程?透過自動執行重複性工作,可以節省時間、成本、資源,甚至創造更好的使用體驗。如果流程太複雜,是否可以將部分流程自動化、或幫助使用者更有效率地完成工作?Gmail的「Smart Compose」(字句建議)是一個很好的例子:現在,Gmail可以自動幫使用者完成句子,不需要每次都手動輸入「你好」這類重複的單詞或句子。
  • 開創新的商機:是否有新的商機或使用者問題,是以往無法解決、但現在可以用ML完成的?例如在倉庫中,貨物分揀通常需要人工完成,因為很難幫機器手臂編寫程式,讓它們識別和處理數百萬種產品;但是有了ML,機器人可以在最少的人工幫助下,自行學會識別各種物體。ML與人工智慧的這種能力,為倉庫機器人打開了龐大的商機。

6. 有些好的PM直覺,反而不適用於ML產品

有時候,管理軟體產品的方法不一定適用於ML產品。我常會提醒自己以下幾點:

  • 必須清楚認知開發ML和軟體產品之間的區別。要讓單一組織流程適用於所有產品,是不太可能的;必要的時候,你必須調整產品計畫流程(sprint planning)、產品藍圖、甚至整個組織。
  • 不需要太詳細列出產品需求書(Product Requirement Document)上的所有需求,而要著重於定義目標功能和衡量標準,讓ML團隊有更多探索和試驗的空間。
  • 與其在開發過程開始時向ML團隊詢問可能結果,不如與團隊密切合作,儘早開發和測試產品原型。
  • ML只是方法之一,並不一定非用不可。

總結

關於管理AI產品,我認為最重要的幾件事包括:

  • ML產品管理比一般軟體更具挑戰性,因為它涉及更多的不確定;不僅需要技術上的改變,還需要組織上的改變。
  • ML最適合用於協助決策或預測。
  • ML產品經理最重要的工作:明確定義問題,確定需求,設定衡量成功的標準,並為ML工程師提供足夠的空間和時間探索解決方案。
  • 從第一天就開始計畫數據策略。
  • 構建ML產品是跨領域的,牽涉到的職能並不只是機器學習而已。
留言
avatar-img
留言分享你的想法!
avatar-img
吐納商業評論的沙龍
1.4K會員
2.0K內容數
為您送上頂尖作者的最新管理與科技產業思維。
2022/07/07
「管理者」設計流程的真正重點,在於:流程越簡單越不會出錯、沒有作用的動作不要做、尤其是做不到的事情不要讓別人產生期待。
Thumbnail
2022/07/07
「管理者」設計流程的真正重點,在於:流程越簡單越不會出錯、沒有作用的動作不要做、尤其是做不到的事情不要讓別人產生期待。
Thumbnail
2022/07/06
從企業經營管理的角度,來回顧自己這次確診的經歷,我可以斷定許多問題出在政府的組織架構、和其分工合作上。政府組織架構和企業的不同,造成了在防疫過程中不同單位間的整合問題。
Thumbnail
2022/07/06
從企業經營管理的角度,來回顧自己這次確診的經歷,我可以斷定許多問題出在政府的組織架構、和其分工合作上。政府組織架構和企業的不同,造成了在防疫過程中不同單位間的整合問題。
Thumbnail
2022/07/06
在疫情之中,「恐懼製造鏈」充斥每個角落;不管有意或無意、善意或惡意,每天都有人製造恐懼。但恐懼在傳播之後往往會失控,造成可怕的後果。所以每個人都必須瞭解散佈恐懼之後可能造成的惡果、謹慎發言,避免自己遭到反噬。
Thumbnail
2022/07/06
在疫情之中,「恐懼製造鏈」充斥每個角落;不管有意或無意、善意或惡意,每天都有人製造恐懼。但恐懼在傳播之後往往會失控,造成可怕的後果。所以每個人都必須瞭解散佈恐懼之後可能造成的惡果、謹慎發言,避免自己遭到反噬。
Thumbnail
看更多
你可能也想看
Thumbnail
常常被朋友問「哪裡買的?」嗎?透過蝦皮分潤計畫,把日常購物的分享多加一個步驟,就能轉換成現金回饋。門檻低、申請簡單,特別適合學生與上班族,讓零碎時間也能創造小確幸。
Thumbnail
常常被朋友問「哪裡買的?」嗎?透過蝦皮分潤計畫,把日常購物的分享多加一個步驟,就能轉換成現金回饋。門檻低、申請簡單,特別適合學生與上班族,讓零碎時間也能創造小確幸。
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
想做產品都要具備產品思維,但要如何培養?這篇想分享產品思維的概念,以及可以透過哪些行為來進行日常累積。
Thumbnail
想做產品都要具備產品思維,但要如何培養?這篇想分享產品思維的概念,以及可以透過哪些行為來進行日常累積。
Thumbnail
本文深入探討機器學習的核心概念,包括迴歸、分類和生成式學習。我們解釋了如何使用特定函式來實現期望任務,並將此過程分為設定範圍、確立標準和實現目標三個階段。文章還介紹了如何使用機器學習來訓練和測試模型,並以寶可夢應用為例說明迴歸和分類問題。
Thumbnail
本文深入探討機器學習的核心概念,包括迴歸、分類和生成式學習。我們解釋了如何使用特定函式來實現期望任務,並將此過程分為設定範圍、確立標準和實現目標三個階段。文章還介紹了如何使用機器學習來訓練和測試模型,並以寶可夢應用為例說明迴歸和分類問題。
Thumbnail
新冠肺炎敲響警鐘,也提醒所有AI機器人和無人駕駛公司停止開發「華而不實」的功能展示,而要專注發展真正為使用者帶來價值、不需人工干預,也可以全天24小時自動運作的實用AI解決方案。
Thumbnail
新冠肺炎敲響警鐘,也提醒所有AI機器人和無人駕駛公司停止開發「華而不實」的功能展示,而要專注發展真正為使用者帶來價值、不需人工干預,也可以全天24小時自動運作的實用AI解決方案。
Thumbnail
互聯網產品基本上都會涉及到軟體的開發,而互聯網產品經理很重要的工作就是:定義軟體要開發哪些功能,並確保這些功能在要求的標準下順利發布,提供給目標用戶價值,進而帶來商業利益。而在管理整個產品週期的過程中,主要的工作流程會包含5個步驟……
Thumbnail
互聯網產品基本上都會涉及到軟體的開發,而互聯網產品經理很重要的工作就是:定義軟體要開發哪些功能,並確保這些功能在要求的標準下順利發布,提供給目標用戶價值,進而帶來商業利益。而在管理整個產品週期的過程中,主要的工作流程會包含5個步驟……
Thumbnail
上個月,筆者在舊金山舉辦了第二次的AI與ML產品經理論壇;五位AI/ML產品經理分別來自矽谷新創、Google、YouTube等科技公司,橫跨醫療、製造業、App等產業與產品類型,和我們一起進行了豐富多元的討論。本文所節錄的,是會中獲得熱烈討論的三個重要議題。
Thumbnail
上個月,筆者在舊金山舉辦了第二次的AI與ML產品經理論壇;五位AI/ML產品經理分別來自矽谷新創、Google、YouTube等科技公司,橫跨醫療、製造業、App等產業與產品類型,和我們一起進行了豐富多元的討論。本文所節錄的,是會中獲得熱烈討論的三個重要議題。
Thumbnail
在設計機器學習相關產品與服務時,必須瞭解它和一般軟體開發的不同、以及過程中獨特的優先順序與需求。前一篇中探討了機器學習產品開發時,專案經理必須具有的基礎認識和挑戰,本文則延續討論相關的產品管理須知。
Thumbnail
在設計機器學習相關產品與服務時,必須瞭解它和一般軟體開發的不同、以及過程中獨特的優先順序與需求。前一篇中探討了機器學習產品開發時,專案經理必須具有的基礎認識和挑戰,本文則延續討論相關的產品管理須知。
Thumbnail
為什麼管理機器學習(ML)產品比一般軟體困難?因為開發ML產品的不確定性和可變性更高;而一般軟體工程則是為機器編寫規則,原本就有高度的確定性。而ML系統可以自行學習,所以並不需要人來編寫規則。總之,「實驗」就是開發ML產品的關鍵。
Thumbnail
為什麼管理機器學習(ML)產品比一般軟體困難?因為開發ML產品的不確定性和可變性更高;而一般軟體工程則是為機器編寫規則,原本就有高度的確定性。而ML系統可以自行學習,所以並不需要人來編寫規則。總之,「實驗」就是開發ML產品的關鍵。
Thumbnail
本文為「Robotics 2.0系列」第二篇。在前一篇文章〈AI重新定義機器人〉中,我們談到AI機器人和傳統機器人最大的不同在於自主學習能力,而這樣的改變將使得AI機器人有潛力顛覆各大產業。但究竟AI機器人會發展出什麼樣的應用?對各個產業又會有什麼影響?
Thumbnail
本文為「Robotics 2.0系列」第二篇。在前一篇文章〈AI重新定義機器人〉中,我們談到AI機器人和傳統機器人最大的不同在於自主學習能力,而這樣的改變將使得AI機器人有潛力顛覆各大產業。但究竟AI機器人會發展出什麼樣的應用?對各個產業又會有什麼影響?
Thumbnail
人工智慧所造就的機器人技術領域,最大成果是從原先的自動化邁向了真正的自主學習。本文將嘗試揭開人工智慧應用的神秘面紗,協助讀者瞭解AI機器人將如何影響我們的未來,並釐清我們常常聽到,但卻著墨不多、甚至根本尚未全然理解的主題。
Thumbnail
人工智慧所造就的機器人技術領域,最大成果是從原先的自動化邁向了真正的自主學習。本文將嘗試揭開人工智慧應用的神秘面紗,協助讀者瞭解AI機器人將如何影響我們的未來,並釐清我們常常聽到,但卻著墨不多、甚至根本尚未全然理解的主題。
Thumbnail
人工智慧、機器學習、深度學習這三個名詞,都是最近經常被提起的行話;它們彼此緊密相關,但意義又不太相同,偶爾還會被誤用。本文就用白話來說明一下,這三個奇妙的東西到底是什麼。
Thumbnail
人工智慧、機器學習、深度學習這三個名詞,都是最近經常被提起的行話;它們彼此緊密相關,但意義又不太相同,偶爾還會被誤用。本文就用白話來說明一下,這三個奇妙的東西到底是什麼。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News