算法工程師與數據科學家的差異-講座心得|思維增長EP38

更新於 發佈於 閱讀時間約 4 分鐘

前陣子聽到《尹相志 — 算法工程師與數據科學家之間的距離 (DATA)》的講座,數據科學家在意什麼?如何運用數據?如何成為好的數據科學家?這篇隨筆記錄一下講座的數據思維和模型思維。

raw-image
▍思維增長是什麼?
這裡記錄各種有趣的生活小知識,不限於商業上的經濟學、或工作上的心理成長。

▍誰適合看這篇文章?
✔ 對於思維增長、數據科學、數據思維有興趣的朋友

一、數據科學講座在聊什麼

尹相志講師目前是亞洲資採技術長 / Deepbelief.ai人工智慧科學家,在網路上也有超多的講座影片和經歷。

看完這支影片我認為有三大收穫:

  1. 如何運用數據?
  2. 如何看待模型?
  3. 如何團隊協作?

二、如何運用數據,以電信業為例

Q:「電信業如何預設客戶會離開?」

電信業的數據很龐大,如果是要預設下個月有哪些客戶會走,每個月的歷史紀錄大概要到隔月的 5–8 號才會拿到,接著數據科學家進行資料解析整理,再丟進模型產生名單可能就 15 號了,而現在因為個資法,出來的只有 Key 值,因此需要再送回電信公司進行身分比對、傳到各客戶單位,大概就 20 號了。

先說結論,客戶在合約 24 個月時會不會離開,需要第 18 個月就要知道(提前 6 個月讓行銷能夠提前進行推廣、挽留、續約)。

以電信業來說,客戶離開有兩個原因:

  1. 不想跟現有電信業有往來,想換別家電信
  2. 單純沒繳每月租金而被停號(風險客戶)

那若要分析電信客戶,客戶資料怎麼抓:

  1. 員工號碼:要先排除掉,因為基本上不會走
  2. 未開卡:一定會走,也不需要分析
  3. 三個月內的:因為帳戶超過 3 個月才會有業績獎金,因此有些是假業績
  4. 企業用戶:模型要預測通話行為會不會影響留下的意願,而企業用戶的個人行為不會影響會不會留存,因為是由採購決定的

小結:有些模型產出的結論是已知事實,因此我們必須先扣除無用數據,要懂產業 Knowhow,才能把問題解決掉。


三、如何看待模型

在多數商業問題內,可控的模型、可監控的參數是重要的,若全部透過神經網路,黑盒子發現問題的時機點通常較慢,因為最大的風險是不知道模型什麼時候會失效。

普通的模型和好的模型差在哪?可以從法醫跟名醫差別來聯想:

  • 法醫:根據身體傷亡,對死者進行人身鑑別、外傷鑑定、遺體解剖等,準確率很高。
  • 名醫:根據身體現況,進行病理預測,準確率不一定高,但有價值。

仰賴模型前有幾個準則:

  • 預測一群人的數值,比預測一個人精準
  • 預測相對數值,比預測絕對數值精準
  • 定義分析目標永遠要做最小拆解
  • 不要迷信端到端的模型,適時採取兩步驟策略
  • 謹記 80–20 法則,80% 銷售來自於 20% 商品

小結:準確的模型不一定有用,我們應該追求模型帶來多少效益;模型重點不在於完全精準,而是要能夠改變未來,讓公司降低損失、提高獲利。


四、如何團隊協作

算法工程師和數據科學家的差異是,前者只要做好模型讓他們使用,但後者不僅要會模型,更要懂產業 Knowhow,藉由問對的問題、挖掘對的方向、把問題解決掉。

以不同產業的團隊協作例子:

  • 零售業:模型不只是要預測銷售量,還要加入物流時間,確保存貨能在正確時間抵達,不會造成過多或缺貨。
  • 電信業:模型不只是要知道客戶會什麼時候不續約,還要結合業務團隊,在適當時機點挽留客戶。

做數據科學,需要準備的心態:

  1. 數據處理:永遠都會遇到髒數據,需要從中找出潛在解法,甚至跟客戶說明如何蒐集正確的數據也是一種貢獻。
  2. 時間觀念:要確保大家溝通的情境是同一個時間點,例如「業績很低」究竟是哪個月的業績,若沒有對齊時間,就無法得到正確推論。
  3. 產業差異:電信、保險、金融這種長生命週期才有機會長時間建模分析,電商產業需要用手邊即時數據進行判斷處理。

小結:每個產業都有複雜的商業邏輯和對應的 Knowhow,當我們覺得問題很簡單或數據很奇怪,很有可能是我們根本不懂產業 Insight。


五、總結

若對《思維增長日記》有興趣,可以再往前翻:

留言
avatar-img
留言分享你的想法!
avatar-img
張家惟 Evan Chang的沙龍
107會員
187內容數
《思維的創意想像》是工作之餘發起的 Side Project,因為近期快速吸收各種資訊跟商業知識(Input),但一直沒有地方輸出(Output),因此想透過這系列記錄學到的內容,包含商業知識、產業洞見,或是職場分享等等,目前已有產品開發、客戶成功、社群行銷、思維增長、職場日記等系列文章。
2024/09/28
參加不少實體社群活動時,我總會好奇別人生命中遇到什麼困難、怎麼克服、怎麼做重要決策、最後獲得了什麼。但最近我發現這一切的原因,是我喜歡聆聽別人的「英雄旅程」,那些痛苦的經驗、奮鬥的過程,從對方不斷分享的同時,能感受到對方生命旅途的厚度。
Thumbnail
2024/09/28
參加不少實體社群活動時,我總會好奇別人生命中遇到什麼困難、怎麼克服、怎麼做重要決策、最後獲得了什麼。但最近我發現這一切的原因,是我喜歡聆聽別人的「英雄旅程」,那些痛苦的經驗、奮鬥的過程,從對方不斷分享的同時,能感受到對方生命旅途的厚度。
Thumbnail
2023/08/15
差別訂價(aka 價格歧視、差別取價)是指針對不同地區、時間、族群,銷售相同商品或服務,但收取不同的費用。差別訂價可以用在哪些場合?消費者願意為產品付多少錢?這篇想記錄這個概念。
Thumbnail
2023/08/15
差別訂價(aka 價格歧視、差別取價)是指針對不同地區、時間、族群,銷售相同商品或服務,但收取不同的費用。差別訂價可以用在哪些場合?消費者願意為產品付多少錢?這篇想記錄這個概念。
Thumbnail
2023/04/01
配角意識是《得到 App》的《產品魅力30講》課程提到的概念,針對產品定位、品牌設定都有滿多見解,因此這篇想記錄我的閱讀心得及套用到不同產品的描述情境。
Thumbnail
2023/04/01
配角意識是《得到 App》的《產品魅力30講》課程提到的概念,針對產品定位、品牌設定都有滿多見解,因此這篇想記錄我的閱讀心得及套用到不同產品的描述情境。
Thumbnail
看更多
你可能也想看
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
重點摘要: 6 月繼續維持基準利率不變,強調維持高利率主因為關稅 點陣圖表現略為鷹派,收斂 2026、2027 年降息預期 SEP 連續 2 季下修 GDP、上修通膨預測值 --- 1.繼續維持利率不變,強調需要維持高利率是因為關稅: 聯準會 (Fed) 召開 6 月利率會議
Thumbnail
前陣子聽到《尹相志 — 算法工程師與數據科學家之間的距離 (DATA)》的講座,數據科學家在意什麼?如何運用數據?如何成為好的數據科學家?這篇隨筆記錄一下講座的數據思維和模型思維。
Thumbnail
前陣子聽到《尹相志 — 算法工程師與數據科學家之間的距離 (DATA)》的講座,數據科學家在意什麼?如何運用數據?如何成為好的數據科學家?這篇隨筆記錄一下講座的數據思維和模型思維。
Thumbnail
最近有個小夥伴跟我說,他上家做不到半年就離職,離職的原因是,每天都在重複做沒有價值的事情。我說:讓我猜一下...
Thumbnail
最近有個小夥伴跟我說,他上家做不到半年就離職,離職的原因是,每天都在重複做沒有價值的事情。我說:讓我猜一下...
Thumbnail
開始成為心理師的時候,剛畢業很期待能在醫院裏大顯身手一番,以免不負研究所繳交的學費和學校吸收了那麼多年的知識。一旦在真的在實際衡鑑時忘記做什麼,忘記問什麼,還會深切的反省下一次不要再犯了,再把測驗手冊拿起來好好地重新複習。時間上也因為需要非常努力地把所有學校所學『貢獻』出來...
Thumbnail
開始成為心理師的時候,剛畢業很期待能在醫院裏大顯身手一番,以免不負研究所繳交的學費和學校吸收了那麼多年的知識。一旦在真的在實際衡鑑時忘記做什麼,忘記問什麼,還會深切的反省下一次不要再犯了,再把測驗手冊拿起來好好地重新複習。時間上也因為需要非常努力地把所有學校所學『貢獻』出來...
Thumbnail
「先將設立的理想型條件列出來,然後用電腦分析、引用大數據配對、清查身家背景,最後再簽訂婚前協議,進而快速鎖定「需要」的而非「想要」的伴侶,是避免浪費彼此時間的相親模式。」 這是《戀愛是科學》女主角顏霏主張的戀愛SOP,在劇中 ,她開設一間名為「戀愛科學婚姻仲介所」的公司,藉由大數據的分析...
Thumbnail
「先將設立的理想型條件列出來,然後用電腦分析、引用大數據配對、清查身家背景,最後再簽訂婚前協議,進而快速鎖定「需要」的而非「想要」的伴侶,是避免浪費彼此時間的相親模式。」 這是《戀愛是科學》女主角顏霏主張的戀愛SOP,在劇中 ,她開設一間名為「戀愛科學婚姻仲介所」的公司,藉由大數據的分析...
Thumbnail
你相信算命?這倒不是一竿子打翻一船人,不管是東方的紫微或是西方的星象,其實都算是一種統計學,但即便是科學,如果不洽當的使用,也會形成斷章取義,莫名其妙的怪現象,不管你信不信,很多的老闆比你想像中的相信算命,人在茫然無措時總是容易找錯人、找錯方向。
Thumbnail
你相信算命?這倒不是一竿子打翻一船人,不管是東方的紫微或是西方的星象,其實都算是一種統計學,但即便是科學,如果不洽當的使用,也會形成斷章取義,莫名其妙的怪現象,不管你信不信,很多的老闆比你想像中的相信算命,人在茫然無措時總是容易找錯人、找錯方向。
Thumbnail
Hi 大家好,我是 Alvin 各位業務朋友們,月底悄悄地逼近了,我們又到了每個月壓力最大的時候了,此時此刻,你也許正在擔心這個月的款項到底能不能收齊,已簽約客戶會不會再一次唬弄我?你也許正在煩惱這個月的簽約數字只差一件就能達標,準機會客戶會不會再一次消失?
Thumbnail
Hi 大家好,我是 Alvin 各位業務朋友們,月底悄悄地逼近了,我們又到了每個月壓力最大的時候了,此時此刻,你也許正在擔心這個月的款項到底能不能收齊,已簽約客戶會不會再一次唬弄我?你也許正在煩惱這個月的簽約數字只差一件就能達標,準機會客戶會不會再一次消失?
Thumbnail
「假說思考」是顧問都在用的思考方法,而「分析」是解決問題的關鍵能力!今天要分享的是《用數字做決策的思考術》,不管你是創業者、上班族,還是自由工作者,從選擇伴侶到解讀財報,都需要掌握分析的能力,幫助做生活決策與判斷,學會用數據分析做更好的決定!
Thumbnail
「假說思考」是顧問都在用的思考方法,而「分析」是解決問題的關鍵能力!今天要分享的是《用數字做決策的思考術》,不管你是創業者、上班族,還是自由工作者,從選擇伴侶到解讀財報,都需要掌握分析的能力,幫助做生活決策與判斷,學會用數據分析做更好的決定!
Thumbnail
在這個數據分析的時代,人人都要學會怎麼運用「數據管理思維」來問對問題!
Thumbnail
在這個數據分析的時代,人人都要學會怎麼運用「數據管理思維」來問對問題!
Thumbnail
這並不是一個勵志或完美結局的故事。其實真正挫折的的開始是從第四週後的課程,以及整個課程結束後的日子,整個過程讓我一度懷疑自己當時的決定。
Thumbnail
這並不是一個勵志或完美結局的故事。其實真正挫折的的開始是從第四週後的課程,以及整個課程結束後的日子,整個過程讓我一度懷疑自己當時的決定。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News