理解推薦系統:從召回到重排的完整流程

更新於 發佈於 閱讀時間約 5 分鐘

最近和產品團隊同事討論推薦系統時,發現大家對於推薦系統流程缺乏共通的語言,導致在溝通時耗費了較多時間來釐清「目前討論的推薦系統的哪一個步驟」

為了提升溝通效率,我分享了一部講解推薦系統流程的影片(觀看影片),並藉此文章記錄影片內容,補充我個人的理解以及公司的實際案例


推薦的核心

在介紹推薦系統流程之前,先介紹一下「推薦」這件事實際上在做什麼。多數推薦系統的應用場景都是:「推薦適合的 itemuser

舉影片提到的小紅書為例,user 是使用者,item 是內容(文章或影片) ;而以我們公司的獵人頭平台為例,推薦的目標是希望幫 Job 找到適合的人選,因此 user 是 JD,item 是人選


召回(Retrieval)

推薦系統的第一步是召回,目的是從龐大的 item pool 中挑選出一群適合的 items。召回的主要目標是大量減少潛在可考慮的 items 數量(後稱 candidates),在這一步精準度不必特別高,因此通常使用簡單的邏輯或演算法進行篩選

例如,影片中提到的「關注的作者內容推薦」,未經機器學習演算法,只依賴用戶特徵進行篩選;我們公司的案例則是透過「JD 與 Resume 的文本相似度」來進行召回

在召回時,縮減 candidates 的數量至關重要,但也需謹慎避免過早篩掉合適的 candidates。實務上常會採用多路召回的方式,結合多種邏輯與演算法,以確保能夠包含更多可能的適合 items


因為有了篩選的步驟,就有可能會在這一階段把適合 user 的 items 濾掉。而我們之所以願意冒這個風險,不是直接幫所有 item 算一個之於 user 的興趣分數,其中的原因在於「運算成本」(包含時間與金錢成本)。

如果 item pool 很大,在每個 user 進來時都要幫所有的 item 計算興趣分數,一來會運算很久,讓產品使用者體驗不好;二來也會造成很大的機器負擔,需要用較高規格的機器才有辦法完成運算,這兩點對於系統來說都是不小的成本,因此需要透過召回的步驟讓我們可以在更短的時間用更少的資源完成運算。


粗排與精排

粗排和精排的主要目的都是對召回的 candidates 進行打分和排序。兩者的差異在於 candidates 的數量:粗排的 candidates 數量較多,因此不會使用過於複雜的演算法;而精排的 candidates 數量較少,則可以使用更複雜但精準度更高的演算法

在我們公司的案例中,粗排使用我們訓練好的機器學習模型快速打分,而在精排階段,則利用大型語言模型(LLM)根據 JD 對粗排後的前十名 candidates 進行重新排序

這樣的架構主要考量了幾個因素:

  1. LLM 的擴展性:可輕鬆實現推薦邏輯的客製化,像是如果想考慮用戶的偏好(e.g. 客戶喜歡有新創背景的 resume),只需要把這個邏輯加到 prompt 就可以,不需要重新訓練模型
  2. 運算成本:由於 LLM 的計算成本較高,因此不適合用於數量級較大的排序,前面還是需要透過機器學習模型進行初步打分。


需要補充的是,雖然粗排和精排都是在排序,但由於場景不同,表現優異的演算法不一定適用於另一個階段


舉例來說:

推薦的目標是推薦讀者有興趣閱讀的書籍,而在粗排的階段,可能會根據讀者過去閱讀的歷史,推薦一批相同類型或相似主題的書籍,如科幻小說類書籍。在精排的階段,會再根據書籍的熱門程度、近期出版的熱度或書籍的讀者評價做進一步排序

在這個情境下,如果直接把精排的邏輯套用在粗排上,可能會推薦出近期熱門但不符合該讀者個人喜好的書籍,忽略了讀者偏好科幻小說這一粗排的關鍵特徵,導致排序結果不佳


重排

推薦系統的最後一個步驟為重排,主要是為了滿足一些在純排序時無法考慮到的商業目標

舉影片中提到的「多樣性抽樣」為例,之所以需要在排序完後再做多樣性抽樣,主要是希望讓使用者可以看到更多不同類型的內容,這件事有助於長期的留存。如果不做這件事,用戶可能會一直看到相同類型的內容推薦,看久了就容易流失。但有了內容推薦的多樣性後,雖然可以會推出一些用戶不喜歡的內容,犧牲一些短期的指標(如點擊率),但有機會讓用戶發掘新的他有興趣的內容,進而提升留存率以及使用時長,有助於滿足平台的商業目標



謝謝你看到這邊,如果你看完文章後有任何想法或建議,都很歡迎在留言區提出分享!或是歡迎加我的 Linkedin 與我交流

留言
avatar-img
留言分享你的想法!
avatar-img
Data Analyst 的學習筆記
2會員
20內容數
多年經驗的數據分析師,透過部落格記錄職場心得以及生活所學 主要會分享以下三類型的主題 1. 職場心得:包含數據分析師的工作經驗以及職場所學 2. 觀影心得:會分享我從電影、影集以及動畫中所學習到的內容 3. 生活雜談:其他不在上述兩類的內容
2025/04/28
因公司裁員而重返求職市場後,我發現好的 Data Analyst 工作不太好找。考量未來發展與職涯彈性,我開始思考轉職軟體工程師的可能性。雖然短期內薪資下降約四分之一,但評估後認為,這是對長期職涯規劃的重要投資。本文分享從裁員到轉職的思考過程,以及如何理性評估降薪與未來機會。
Thumbnail
2025/04/28
因公司裁員而重返求職市場後,我發現好的 Data Analyst 工作不太好找。考量未來發展與職涯彈性,我開始思考轉職軟體工程師的可能性。雖然短期內薪資下降約四分之一,但評估後認為,這是對長期職涯規劃的重要投資。本文分享從裁員到轉職的思考過程,以及如何理性評估降薪與未來機會。
Thumbnail
2025/04/13
在 AI 浪潮下,Data Analyst 的職場競爭更加激烈。身為擁有多元背景的我,卻發現這樣的優勢在求職市場中反而變成了劣勢。直到我從《納瓦爾寶典》中理解到「特定知識」的價值,才明白多元能力如何成為無法被取代的利器。這篇文章將分享我的職涯反思與轉念歷程。
Thumbnail
2025/04/13
在 AI 浪潮下,Data Analyst 的職場競爭更加激烈。身為擁有多元背景的我,卻發現這樣的優勢在求職市場中反而變成了劣勢。直到我從《納瓦爾寶典》中理解到「特定知識」的價值,才明白多元能力如何成為無法被取代的利器。這篇文章將分享我的職涯反思與轉念歷程。
Thumbnail
2025/03/31
最近回顧自己在現職公司的工作歷程,發現過去三年薪水成長了不少,相較於前一份工作甚至翻倍。 當然,運氣成分不可忽略,但回頭看,也有一些關鍵選擇讓這段成長之路更加順利。所以,這篇文章想和大家分享:「三年薪水翻倍,除了運氣以外,我還做對了什麼」
Thumbnail
2025/03/31
最近回顧自己在現職公司的工作歷程,發現過去三年薪水成長了不少,相較於前一份工作甚至翻倍。 當然,運氣成分不可忽略,但回頭看,也有一些關鍵選擇讓這段成長之路更加順利。所以,這篇文章想和大家分享:「三年薪水翻倍,除了運氣以外,我還做對了什麼」
Thumbnail
看更多
你可能也想看
Thumbnail
大家好,我是一名眼科醫師,也是一位孩子的媽 身為眼科醫師的我,我知道視力發展對孩子來說有多關鍵。 每到開學季時,診間便充斥著許多憂心忡忡的家屬。近年來看診中,兒童提早近視、眼睛疲勞的案例明顯增加,除了3C使用過度,最常被忽略的,就是照明品質。 然而作為一位媽媽,孩子能在安全、舒適的環境
Thumbnail
大家好,我是一名眼科醫師,也是一位孩子的媽 身為眼科醫師的我,我知道視力發展對孩子來說有多關鍵。 每到開學季時,診間便充斥著許多憂心忡忡的家屬。近年來看診中,兒童提早近視、眼睛疲勞的案例明顯增加,除了3C使用過度,最常被忽略的,就是照明品質。 然而作為一位媽媽,孩子能在安全、舒適的環境
Thumbnail
我的「媽」呀! 母親節即將到來,vocus 邀請你寫下屬於你的「媽」故事——不管是紀錄爆笑的日常,或是一直想對她表達的感謝,又或者,是你這輩子最想聽她說出的一句話。 也歡迎你曬出合照,分享照片背後的點點滴滴 ♥️ 透過創作,將這份情感表達出來吧!🥹
Thumbnail
我的「媽」呀! 母親節即將到來,vocus 邀請你寫下屬於你的「媽」故事——不管是紀錄爆笑的日常,或是一直想對她表達的感謝,又或者,是你這輩子最想聽她說出的一句話。 也歡迎你曬出合照,分享照片背後的點點滴滴 ♥️ 透過創作,將這份情感表達出來吧!🥹
Thumbnail
產品經理在排序優先級時,不免會被問「這個很急嗎」,有時就會讓不緊急的項目往後排,但這些小優化、小 bug 會越累積越多,讓整個系統到處都有漏洞,某天使用者就會開始抱怨「系統實在不怎麼好用」,那要如何避免呢?可否將小需求逐步安排進團隊開發?這篇想記錄我在產品團隊的工作模式。
Thumbnail
產品經理在排序優先級時,不免會被問「這個很急嗎」,有時就會讓不緊急的項目往後排,但這些小優化、小 bug 會越累積越多,讓整個系統到處都有漏洞,某天使用者就會開始抱怨「系統實在不怎麼好用」,那要如何避免呢?可否將小需求逐步安排進團隊開發?這篇想記錄我在產品團隊的工作模式。
Thumbnail
複雜的訂單管理 文創企業的訂單管理是一項複雜的過程,如果沒有注意好,就有可能無法順利出貨。因此,訂單管理是創意工作者很重要的一環。此外,訂單也直接影響企業的收入,因此訂單管理的重要性更不容小覷。訂單管理需要考慮許多因素,包括產品類型、訂單規模、交貨期、客戶需求等。有效的訂單管理可以幫助文創企業提高
Thumbnail
複雜的訂單管理 文創企業的訂單管理是一項複雜的過程,如果沒有注意好,就有可能無法順利出貨。因此,訂單管理是創意工作者很重要的一環。此外,訂單也直接影響企業的收入,因此訂單管理的重要性更不容小覷。訂單管理需要考慮許多因素,包括產品類型、訂單規模、交貨期、客戶需求等。有效的訂單管理可以幫助文創企業提高
Thumbnail
步驟二:組織層級設定 [組織結構&職級] 為什麼要設定組織層級呢[組織結構&職級]? 因為我們知道某些公文類別的流程是固定的,比如請購單,一定要職員 -> 科級主管 -> 部級主管,在公文內,一定會走的流程,我們把它稱之為[串簽]流程,所以這時候就用運用到組織層級的設定資訊。至於後續的流程是否.
Thumbnail
步驟二:組織層級設定 [組織結構&職級] 為什麼要設定組織層級呢[組織結構&職級]? 因為我們知道某些公文類別的流程是固定的,比如請購單,一定要職員 -> 科級主管 -> 部級主管,在公文內,一定會走的流程,我們把它稱之為[串簽]流程,所以這時候就用運用到組織層級的設定資訊。至於後續的流程是否.
Thumbnail
去年的職涯歷程由「一人行銷」晉階帶領新人,同時也帶領大專院生參與電商大賽並獲獎。這段過程有很多收穫和啟發。原本自己一個人可以從頭到尾,把一件事情完整執行,轉變為必須建立系統方法,才能把已知的事務傳遞給新手,並且協助他們也把事情做好。 這段過程,發現建立順暢的工作流程和文件,相當重要。
Thumbnail
去年的職涯歷程由「一人行銷」晉階帶領新人,同時也帶領大專院生參與電商大賽並獲獎。這段過程有很多收穫和啟發。原本自己一個人可以從頭到尾,把一件事情完整執行,轉變為必須建立系統方法,才能把已知的事務傳遞給新手,並且協助他們也把事情做好。 這段過程,發現建立順暢的工作流程和文件,相當重要。
Thumbnail
1、你是否... 在工作時遇上大大小小專案,你總是依賴自己的感覺或記憶做事嗎? 當新人問你「要企劃一個新營隊要如何做?」時,你在腦中摸索過往的經驗,然後篩選出關鍵步驟並排出順序,最後回覆對方~ 這過程看似還OK,但其實是個超沒效率且容易出錯的方法. 讓我們切換個場景,當我們來到家樂福、全聯等大賣場購
Thumbnail
1、你是否... 在工作時遇上大大小小專案,你總是依賴自己的感覺或記憶做事嗎? 當新人問你「要企劃一個新營隊要如何做?」時,你在腦中摸索過往的經驗,然後篩選出關鍵步驟並排出順序,最後回覆對方~ 這過程看似還OK,但其實是個超沒效率且容易出錯的方法. 讓我們切換個場景,當我們來到家樂福、全聯等大賣場購
Thumbnail
群眾募資其實跟投資有一點像,需要在一群商品/專案中,先篩選出適合做募資的標的,接著調查團隊背景、資源、產品知識,最後才確認是否要簽約讓他募資,這篇想記錄我在群眾募資產業的觀察。
Thumbnail
群眾募資其實跟投資有一點像,需要在一群商品/專案中,先篩選出適合做募資的標的,接著調查團隊背景、資源、產品知識,最後才確認是否要簽約讓他募資,這篇想記錄我在群眾募資產業的觀察。
Thumbnail
上一篇提到《對專案成功的渴望有多高?客戶成功的心態培養》,這篇將陸續整理我在群眾集資平台擔任集資專案顧問時(a.k.a. 客戶成功 Customer Success),從客戶身上學習到的事,分別是 (1) 為什麼我想要模組化?、(2) 模組化仍不夠,再加上客製化。
Thumbnail
上一篇提到《對專案成功的渴望有多高?客戶成功的心態培養》,這篇將陸續整理我在群眾集資平台擔任集資專案顧問時(a.k.a. 客戶成功 Customer Success),從客戶身上學習到的事,分別是 (1) 為什麼我想要模組化?、(2) 模組化仍不夠,再加上客製化。
Thumbnail
在群眾集資平台擔任平台專員(客戶成功專員)時,不斷在優化「專案管理執行效率」、「大量服務客戶的公版流程」,過程中也在思考自身實際的貢獻與職場價值,因此想透過這篇整理我觀察到的專案數據優化、客戶輔導細節。
Thumbnail
在群眾集資平台擔任平台專員(客戶成功專員)時,不斷在優化「專案管理執行效率」、「大量服務客戶的公版流程」,過程中也在思考自身實際的貢獻與職場價值,因此想透過這篇整理我觀察到的專案數據優化、客戶輔導細節。
Thumbnail
《一流工作者都在用的待辦清單》是一本教你打造「適合自己的待辦清單」的書。 我認為這本書的優點是,針對每個系統的缺點提出鉅細靡遺的解決方法。 缺點是10步驟+8要訣的執行非常耗時,不見得適合每個人。 如果你已經有習慣的清單系統,想要再增進現有的效率,比較適合閱讀這本書。
Thumbnail
《一流工作者都在用的待辦清單》是一本教你打造「適合自己的待辦清單」的書。 我認為這本書的優點是,針對每個系統的缺點提出鉅細靡遺的解決方法。 缺點是10步驟+8要訣的執行非常耗時,不見得適合每個人。 如果你已經有習慣的清單系統,想要再增進現有的效率,比較適合閱讀這本書。
Thumbnail
許多的工作流程是從過去堆疊至今的習慣。也可以這麼說...有些工作職掌的作業流程,是可以減去不必要做的。更甚至有些在作業執行時,一併產生的單據,不但沒有管控效果,其目的對於當事者來說,並未有著明確的意思...
Thumbnail
許多的工作流程是從過去堆疊至今的習慣。也可以這麼說...有些工作職掌的作業流程,是可以減去不必要做的。更甚至有些在作業執行時,一併產生的單據,不但沒有管控效果,其目的對於當事者來說,並未有著明確的意思...
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News