算法工程師與數據科學家的差異-講座心得|思維增長EP38

更新於 2024/09/03閱讀時間約 4 分鐘

前陣子聽到《尹相志 — 算法工程師與數據科學家之間的距離 (DATA)》的講座,數據科學家在意什麼?如何運用數據?如何成為好的數據科學家?這篇隨筆記錄一下講座的數據思維和模型思維。

raw-image
▍思維增長是什麼?
這裡記錄各種有趣的生活小知識,不限於商業上的經濟學、或工作上的心理成長。

▍誰適合看這篇文章?
✔ 對於思維增長、數據科學、數據思維有興趣的朋友

一、數據科學講座在聊什麼

尹相志講師目前是亞洲資採技術長 / Deepbelief.ai人工智慧科學家,在網路上也有超多的講座影片和經歷。

看完這支影片我認為有三大收穫:

  1. 如何運用數據?
  2. 如何看待模型?
  3. 如何團隊協作?

二、如何運用數據,以電信業為例

Q:「電信業如何預設客戶會離開?」

電信業的數據很龐大,如果是要預設下個月有哪些客戶會走,每個月的歷史紀錄大概要到隔月的 5–8 號才會拿到,接著數據科學家進行資料解析整理,再丟進模型產生名單可能就 15 號了,而現在因為個資法,出來的只有 Key 值,因此需要再送回電信公司進行身分比對、傳到各客戶單位,大概就 20 號了。

先說結論,客戶在合約 24 個月時會不會離開,需要第 18 個月就要知道(提前 6 個月讓行銷能夠提前進行推廣、挽留、續約)。

以電信業來說,客戶離開有兩個原因:

  1. 不想跟現有電信業有往來,想換別家電信
  2. 單純沒繳每月租金而被停號(風險客戶)

那若要分析電信客戶,客戶資料怎麼抓:

  1. 員工號碼:要先排除掉,因為基本上不會走
  2. 未開卡:一定會走,也不需要分析
  3. 三個月內的:因為帳戶超過 3 個月才會有業績獎金,因此有些是假業績
  4. 企業用戶:模型要預測通話行為會不會影響留下的意願,而企業用戶的個人行為不會影響會不會留存,因為是由採購決定的

小結:有些模型產出的結論是已知事實,因此我們必須先扣除無用數據,要懂產業 Knowhow,才能把問題解決掉。


三、如何看待模型

在多數商業問題內,可控的模型、可監控的參數是重要的,若全部透過神經網路,黑盒子發現問題的時機點通常較慢,因為最大的風險是不知道模型什麼時候會失效。

普通的模型和好的模型差在哪?可以從法醫跟名醫差別來聯想:

  • 法醫:根據身體傷亡,對死者進行人身鑑別、外傷鑑定、遺體解剖等,準確率很高。
  • 名醫:根據身體現況,進行病理預測,準確率不一定高,但有價值。

仰賴模型前有幾個準則:

  • 預測一群人的數值,比預測一個人精準
  • 預測相對數值,比預測絕對數值精準
  • 定義分析目標永遠要做最小拆解
  • 不要迷信端到端的模型,適時採取兩步驟策略
  • 謹記 80–20 法則,80% 銷售來自於 20% 商品

小結:準確的模型不一定有用,我們應該追求模型帶來多少效益;模型重點不在於完全精準,而是要能夠改變未來,讓公司降低損失、提高獲利。


四、如何團隊協作

算法工程師和數據科學家的差異是,前者只要做好模型讓他們使用,但後者不僅要會模型,更要懂產業 Knowhow,藉由問對的問題、挖掘對的方向、把問題解決掉。

以不同產業的團隊協作例子:

  • 零售業:模型不只是要預測銷售量,還要加入物流時間,確保存貨能在正確時間抵達,不會造成過多或缺貨。
  • 電信業:模型不只是要知道客戶會什麼時候不續約,還要結合業務團隊,在適當時機點挽留客戶。

做數據科學,需要準備的心態:

  1. 數據處理:永遠都會遇到髒數據,需要從中找出潛在解法,甚至跟客戶說明如何蒐集正確的數據也是一種貢獻。
  2. 時間觀念:要確保大家溝通的情境是同一個時間點,例如「業績很低」究竟是哪個月的業績,若沒有對齊時間,就無法得到正確推論。
  3. 產業差異:電信、保險、金融這種長生命週期才有機會長時間建模分析,電商產業需要用手邊即時數據進行判斷處理。

小結:每個產業都有複雜的商業邏輯和對應的 Knowhow,當我們覺得問題很簡單或數據很奇怪,很有可能是我們根本不懂產業 Insight。


五、總結

若對《思維增長日記》有興趣,可以再往前翻:

《思維的創意想像》是工作之餘發起的 Side Project,因為近期快速吸收各種資訊跟商業知識(Input),但一直沒有地方輸出(Output),因此想透過這系列記錄學到的內容,包含商業知識、產業洞見,或是職場分享等等,目前已有產品開發、客戶成功、社群行銷、思維增長、職場日記等系列文章。
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
差別訂價(aka 價格歧視、差別取價)是指針對不同地區、時間、族群,銷售相同商品或服務,但收取不同的費用。差別訂價可以用在哪些場合?消費者願意為產品付多少錢?這篇想記錄這個概念。
配角意識是《得到 App》的《產品魅力30講》課程提到的概念,針對產品定位、品牌設定都有滿多見解,因此這篇想記錄我的閱讀心得及套用到不同產品的描述情境。
生活黑客是?生活駭客又是?這本書《駭客思維:抓出生活中的不合理,優化你的人生》不僅分享生活駭客的發展脈絡,在每一章節的最後,也不斷提醒追逐系統化時,仍要關注目的、回歸內心需求。
此篇為《行銷提案實戰:讓你的想法被一次買單》課程心得,以下將會記錄我學習到的提案現場三步驟,以及 3 個多做、3 個不做的事項,提供給對行銷提案、業務提案有興趣的朋友參閱。收穫點除了只要有人社群顧問執行長傑哥的分享,我自己覺得在最後的訪談篇貝殼放大執行長林大涵的內容也相當精采。
教練領導是我在某個線上課程看到的概念,意思是:主管藉由提問、同理和指引,而不是下達命令和批判,來促進員工解決問題和協助其發展。
最近在研究《航向成功企業的55種商業模式》這本書,其中提到一種商業模式是「刮鬍刀組」,通常是基本品(刮鬍刀)和附帶品(刀片)的搭配。基本品價格很低,或是免費贈送,而附帶品則必須長期購買來使用。書中提到這個商業邏輯也有另一個名稱「釣鉤與誘餌」,重點在降低購買基本品的門檻。
差別訂價(aka 價格歧視、差別取價)是指針對不同地區、時間、族群,銷售相同商品或服務,但收取不同的費用。差別訂價可以用在哪些場合?消費者願意為產品付多少錢?這篇想記錄這個概念。
配角意識是《得到 App》的《產品魅力30講》課程提到的概念,針對產品定位、品牌設定都有滿多見解,因此這篇想記錄我的閱讀心得及套用到不同產品的描述情境。
生活黑客是?生活駭客又是?這本書《駭客思維:抓出生活中的不合理,優化你的人生》不僅分享生活駭客的發展脈絡,在每一章節的最後,也不斷提醒追逐系統化時,仍要關注目的、回歸內心需求。
此篇為《行銷提案實戰:讓你的想法被一次買單》課程心得,以下將會記錄我學習到的提案現場三步驟,以及 3 個多做、3 個不做的事項,提供給對行銷提案、業務提案有興趣的朋友參閱。收穫點除了只要有人社群顧問執行長傑哥的分享,我自己覺得在最後的訪談篇貝殼放大執行長林大涵的內容也相當精采。
教練領導是我在某個線上課程看到的概念,意思是:主管藉由提問、同理和指引,而不是下達命令和批判,來促進員工解決問題和協助其發展。
最近在研究《航向成功企業的55種商業模式》這本書,其中提到一種商業模式是「刮鬍刀組」,通常是基本品(刮鬍刀)和附帶品(刀片)的搭配。基本品價格很低,或是免費贈送,而附帶品則必須長期購買來使用。書中提到這個商業邏輯也有另一個名稱「釣鉤與誘餌」,重點在降低購買基本品的門檻。
你可能也想看
Google News 追蹤
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
算法稳定币就是一种依据算法调整市场货币总量,在稳定币价格高于锚定价格时增加市场供给,在稳定币价格低于锚定价格时后回收供给,或者以提供套利空间平衡稳定币价格 🚀 币安 - 全球最大加密货币交易所 💥 独家优惠 💥 💰 注册即享 20% 手续费返佣 🔑 专属邀请码: R851UX3N
Thumbnail
今天要介紹的《人生算法》也是中國的商業思維書籍,主要是講人生算法中三大要素:時間、空間、機率。幾個相互疊加,靠著思維工具,幫我們在生活中更好地做出決策。
Thumbnail
本文探討了監督式學習、分群和相似度這幾個推薦系統算法,分別討論了它們的優點、缺點以及適用場景。這些算法在推薦系統中扮演著重要角色,並透過特徵選擇與預處理、相似度度量和鄰居的選擇等關鍵因素進行深入分析。文章最後提出在選擇推薦系統算法時應該考慮的因素,以及未來的研究方向。
Thumbnail
隨著搜索引擎算法的不斷更新,對於SEO的影響也日益凸顯。對於SEO公司和從事數位行銷的專業人士而言,了解這些更新對於他們的工作至關重要。八拓科技有限公司作為一家專業的網路行銷公司,深入研究了這些更新的影響,為客戶提供了專業的咨詢和服務。 首先,搜索引擎算法更新對SEO策略帶來了一系列的挑戰和機遇。
Thumbnail
前陣子聽到《尹相志 — 算法工程師與數據科學家之間的距離 (DATA)》的講座,數據科學家在意什麼?如何運用數據?如何成為好的數據科學家?這篇隨筆記錄一下講座的數據思維和模型思維。
Thumbnail
USDD是基於波場公鏈平台構建,由 TRON DAO Reserve(波場聯合儲備,簡稱「波聯儲」)發行與管理的算法穩定幣項目,而關於算法穩定幣的介紹,可以參考我寫的文章:2022年穩定幣一次介紹大公開,而自從UST穩定幣脫鉤的事件後,大家也在關注USDD是否會步UST後塵,因此我就來統一整理介紹U
Thumbnail
今年美債利率一路向上,一山還有一山高,時不時又有歐洲能源危機、英國財政亂搞掀起高潮。在BoE暫時性救市之後,可望回歸美國本土因素,也就是可以從,FOMC的經濟預測來推估未來利率區間。
Thumbnail
這篇文章記錄與強盜算法有關的職位。 職位#1:Amazon 資深運籌學科學家 職位#2: Tripadbisor 機器學習科學家 II Machine Learning Scientist II 職位#3:BOA 資料科學家 Data Scientist Desired skills:
Thumbnail
最近Disney+上線的《正義的算法》,是由陳柏霖、郭雪芙領銜主演的台灣律政輕喜劇,當金錢至上主義的王牌律師遇上正義熱血的菜鳥律師又會擦出怎麼樣的機智火花!本篇要帶大家除了追劇的同時,也可以知道如果自己或身邊的親戚朋友要找律師的話,要怎麼去判斷我應找哪一種律師呢?
Thumbnail
UST 大脫鉤快速了解發生了甚麼事,大家只想賺錢高APY是否事龐式騙局,LUNA 與 UST 的關係非常的緊密導致 LUNA 嚴重下跌,利用基金會金庫的 BTC 來救火,有投資 UST 的玩家應該都是慘賠連我也不意外,算法穩定幣真的不一定穩定還是需要看背後的機制是怎麼運作的,教你追蹤錢包和 UST
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
算法稳定币就是一种依据算法调整市场货币总量,在稳定币价格高于锚定价格时增加市场供给,在稳定币价格低于锚定价格时后回收供给,或者以提供套利空间平衡稳定币价格 🚀 币安 - 全球最大加密货币交易所 💥 独家优惠 💥 💰 注册即享 20% 手续费返佣 🔑 专属邀请码: R851UX3N
Thumbnail
今天要介紹的《人生算法》也是中國的商業思維書籍,主要是講人生算法中三大要素:時間、空間、機率。幾個相互疊加,靠著思維工具,幫我們在生活中更好地做出決策。
Thumbnail
本文探討了監督式學習、分群和相似度這幾個推薦系統算法,分別討論了它們的優點、缺點以及適用場景。這些算法在推薦系統中扮演著重要角色,並透過特徵選擇與預處理、相似度度量和鄰居的選擇等關鍵因素進行深入分析。文章最後提出在選擇推薦系統算法時應該考慮的因素,以及未來的研究方向。
Thumbnail
隨著搜索引擎算法的不斷更新,對於SEO的影響也日益凸顯。對於SEO公司和從事數位行銷的專業人士而言,了解這些更新對於他們的工作至關重要。八拓科技有限公司作為一家專業的網路行銷公司,深入研究了這些更新的影響,為客戶提供了專業的咨詢和服務。 首先,搜索引擎算法更新對SEO策略帶來了一系列的挑戰和機遇。
Thumbnail
前陣子聽到《尹相志 — 算法工程師與數據科學家之間的距離 (DATA)》的講座,數據科學家在意什麼?如何運用數據?如何成為好的數據科學家?這篇隨筆記錄一下講座的數據思維和模型思維。
Thumbnail
USDD是基於波場公鏈平台構建,由 TRON DAO Reserve(波場聯合儲備,簡稱「波聯儲」)發行與管理的算法穩定幣項目,而關於算法穩定幣的介紹,可以參考我寫的文章:2022年穩定幣一次介紹大公開,而自從UST穩定幣脫鉤的事件後,大家也在關注USDD是否會步UST後塵,因此我就來統一整理介紹U
Thumbnail
今年美債利率一路向上,一山還有一山高,時不時又有歐洲能源危機、英國財政亂搞掀起高潮。在BoE暫時性救市之後,可望回歸美國本土因素,也就是可以從,FOMC的經濟預測來推估未來利率區間。
Thumbnail
這篇文章記錄與強盜算法有關的職位。 職位#1:Amazon 資深運籌學科學家 職位#2: Tripadbisor 機器學習科學家 II Machine Learning Scientist II 職位#3:BOA 資料科學家 Data Scientist Desired skills:
Thumbnail
最近Disney+上線的《正義的算法》,是由陳柏霖、郭雪芙領銜主演的台灣律政輕喜劇,當金錢至上主義的王牌律師遇上正義熱血的菜鳥律師又會擦出怎麼樣的機智火花!本篇要帶大家除了追劇的同時,也可以知道如果自己或身邊的親戚朋友要找律師的話,要怎麼去判斷我應找哪一種律師呢?
Thumbnail
UST 大脫鉤快速了解發生了甚麼事,大家只想賺錢高APY是否事龐式騙局,LUNA 與 UST 的關係非常的緊密導致 LUNA 嚴重下跌,利用基金會金庫的 BTC 來救火,有投資 UST 的玩家應該都是慘賠連我也不意外,算法穩定幣真的不一定穩定還是需要看背後的機制是怎麼運作的,教你追蹤錢包和 UST