推薦系統算法:監督式學習、分群和相似度

更新於 發佈於 閱讀時間約 4 分鐘

在思考推薦名單應該用什麼樣的算法來進行會比較好,因此 survey 了幾個算法,包含監督式學習、分群、相似度,以下針對各算法進行討論。

Photo by Alesia Kaz on Unsplash

Photo by Alesia Kaz on Unsplash


1. 監督式學習

監督式學習需要有明確的輸入(特徵)和輸出(目標變量)的歷史數據。透過這種方法,可以基於過去的數據預測未來的行為或分類。例如,有關於用戶以往購買歷史的數據,可提取特徵(如購買頻率、平均消費金額、購買類別等),並使用這些特徵來預測哪些用戶最有可能對某個產品感興趣。

◾ 優點 直接目標導向,可以針對特定問題(如預測誰會購買某個產品)進行優化。 易於解釋,因為可以明確知道哪些特徵對預測結果有影響。

◾ 缺點 需要大量的歷史數據。 如果數據集中的模式隨時間變化,模型可能需要定期重新訓練。


2. 分群

分群是一種無監督學習方法,它將數據集分成若干個組或“群”,這些群體內的成員比其他群體內的成員更相似。這種方法不需要預先標注的數據,而是根據數據本身的特性進行分組。例如,可以根據用戶的購買行為、瀏覽習慣等特徵將用戶分成不同的群體,然後針對每個群體推薦適合它們的產品或服務。

◾ 優點不需要標注數據,適用於沒有明確目標變量的場景。 可以發現數據中未知的模式或結構,有助於更好地了解用戶群體。

◾ 缺點 結果的解釋性可能不如監督式學習,因為分群是根據數據本身的相似性進行的,而不是針對特定預測目標。群體的定義可能隨時間和數據的變化而變化,需要定期重新評估和調整群體。

3. 相似度

這其實是一種更細化的策略,可以視為一種特殊形式的分群,更加注重個體間的相似性而非將個體分配到廣泛的群組中。

  • 用戶基於相似度的推薦(User-Based Collaborative Filtering):這種方法首先計算用戶間的相似度,然後為一個用戶推薦他相似用戶喜歡的產品。相似度可以通過各種度量來計算,如餘弦相似度、皮爾森相關係數或傑卡德相似度等。
  • 物品基於相似度的推薦(Item-Based Collaborative Filtering):這方法首先計算物品之間的相似度。如果一個用戶喜歡某個產品,系統會推薦與該產品相似的其他產品。

關鍵點在於:

1) 特徵選擇與預處理:為了準確計算相似度,選擇能夠代表用戶或物品特性的特徵。

  • 對於 user 選擇包括他們的購買歷史、瀏覽行為、評分和偏好等。
  • 對於物品,可以是類別、品牌、價格等屬性。

2)相似度度量:選擇合適的相似度度量非常關鍵。餘弦相似度適用於度量基於向量空間的相似性,而傑卡德相似度適用於比較基於集合的相似性。

3)鄰居的選擇:在基於用戶或物品的方法中,你需要決定考慮多少個「鄰居」(即相似的用戶或物品)。選擇太少可能不夠代表性,太多則可能引入噪聲。

4)評估與優化:使用適當的評估指標(如精確度、召回率、F1分數等)來評估推薦系統的性能,並根據反饋進行優化。與廣義的分群方法相比,基於客戶樣貌相似度的推薦更注重於細粒度的個體級相似性,能夠提供更個性化的推薦。這種方法適用於希望深入挖掘用戶偏好和行為模式的場景,可以大大提高推薦的相關性和用戶滿意度。然而,它也要求有足夠的數據支持以計算相似度,以及合適的算法來處理這些數據。


小結

監督式學習提供了針對特定目標導向問題的直接解決方案,但它依賴於大量的標注數據和模型的定期更新以適應數據變化。分群方法作為一種無監督學習技術,能夠揭示數據中的隱含模式和結構,適合於沒有明確目標變量的場景,但其結果的解釋性可能不如監督式學習強。相似度方法,特別是在推薦系統中,通過計算用戶或物品間的相似度來提供個性化推薦,雖然可以提高推薦的準確度和相關性,但同樣需要注意特徵選擇、相似度度量以及鄰居選擇等關鍵因素。

因此,在選擇推薦系統算法時,應考慮算法的適用性、數據的可用性、系統的實現複雜度以及期望達到的推薦效果。透過綜合考慮這些因素,可以選擇最適合當前應用需求的推薦算法。後續將基於這幾個算法進行實驗與成效分析並且驗證!

留言
avatar-img
留言分享你的想法!
avatar-img
Karen的沙龍
35會員
50內容數
歡迎來到《桃花源記》專欄。這裡不僅是一個文字的集合,更是一個探索、夢想和自我發現的空間。在這個專欄中,我們將一同走進那些隱藏在日常生活中的"桃花源"——那些讓我們心動、讓我們反思、讓我們找到內心平靜的時刻和地方
Karen的沙龍的其他內容
2024/11/29
本篇文章探討如何利用電影數據集構建基於相似度的推薦系統。文章主要分為四個步驟:資料預覽、資料預處理、計算餘弦相似度及結果推論。透過這一流程,讀者將瞭解如何量化電影間的關聯性及用戶偏好,並如何生成推薦結果。
Thumbnail
2024/11/29
本篇文章探討如何利用電影數據集構建基於相似度的推薦系統。文章主要分為四個步驟:資料預覽、資料預處理、計算餘弦相似度及結果推論。透過這一流程,讀者將瞭解如何量化電影間的關聯性及用戶偏好,並如何生成推薦結果。
Thumbnail
2024/11/17
在現今的數據驅動世界,推薦系統早已成為許多平台(如電商、串流媒體、社交網路)不可或缺的一部分。然而,傳統的推薦方法如協同過濾(Collaborative Filtering)和基於內容過濾(Content-Based Filtering)各有其局限性,例如無法處理冷啟動問題或缺乏靈活性。最近
Thumbnail
2024/11/17
在現今的數據驅動世界,推薦系統早已成為許多平台(如電商、串流媒體、社交網路)不可或缺的一部分。然而,傳統的推薦方法如協同過濾(Collaborative Filtering)和基於內容過濾(Content-Based Filtering)各有其局限性,例如無法處理冷啟動問題或缺乏靈活性。最近
Thumbnail
2024/11/16
本研究探討如何透過圖形資料庫模型來構建電子商務顧客的360度全景視圖,並使用客戶行為模型圖(CBMG)有效整合和分析客戶數據。研究強調理解顧客的行為模式和需求,並針對三種典型的購物行為類型進行分析,以提升網站設計和用戶體驗。通過Neo4j的應用,提供了可視化客戶行為模式的視角。
Thumbnail
2024/11/16
本研究探討如何透過圖形資料庫模型來構建電子商務顧客的360度全景視圖,並使用客戶行為模型圖(CBMG)有效整合和分析客戶數據。研究強調理解顧客的行為模式和需求,並針對三種典型的購物行為類型進行分析,以提升網站設計和用戶體驗。通過Neo4j的應用,提供了可視化客戶行為模式的視角。
Thumbnail
看更多
你可能也想看
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
高中數學主題練習—配方法
Thumbnail
高中數學主題練習—配方法
Thumbnail
高中數學主題練習—配方法
Thumbnail
高中數學主題練習—配方法
Thumbnail
演算法映射化簡的核心觀念 在面對新題目的時候,除了重頭想一個新的演算法之外; 還有另一個方法,想看看有沒有核心觀念彼此相同的問題與演算法, 如果有,就可以把新的題目映射化簡到已知解法的問題,用已知的演算法去解開。 接著,我們會介紹幾個範例,並且使用映射化簡的技巧來解題,透過化
Thumbnail
演算法映射化簡的核心觀念 在面對新題目的時候,除了重頭想一個新的演算法之外; 還有另一個方法,想看看有沒有核心觀念彼此相同的問題與演算法, 如果有,就可以把新的題目映射化簡到已知解法的問題,用已知的演算法去解開。 接著,我們會介紹幾個範例,並且使用映射化簡的技巧來解題,透過化
Thumbnail
這篇文章,會帶著大家複習以前學過的配對模型與Stack框架, 並且以括弧配對的應用題與概念為核心, 貫穿一些相關聯的題目,透過框架複現來幫助讀者理解這個演算法框架。 首先,Stack本身具有Last-In First-Out 後進先出的特質。 再根據題目所需要的資訊利用Stack去儲存索引
Thumbnail
這篇文章,會帶著大家複習以前學過的配對模型與Stack框架, 並且以括弧配對的應用題與概念為核心, 貫穿一些相關聯的題目,透過框架複現來幫助讀者理解這個演算法框架。 首先,Stack本身具有Last-In First-Out 後進先出的特質。 再根據題目所需要的資訊利用Stack去儲存索引
Thumbnail
最近有新的訂閱者加入, 想趁這個機會再分享一次學習心法與建議給第一次練習的讀者、同學們。 如果你本身已經很熟練演算法,那隨機挑題目練習ok,可以測試觀念是否正確,並且驗證寫code的效率與正確程度。 如果是剛畢業或還在學,以前沒有打過程式競賽。 想開始有系統地增強演算法&資料結構的能力
Thumbnail
最近有新的訂閱者加入, 想趁這個機會再分享一次學習心法與建議給第一次練習的讀者、同學們。 如果你本身已經很熟練演算法,那隨機挑題目練習ok,可以測試觀念是否正確,並且驗證寫code的效率與正確程度。 如果是剛畢業或還在學,以前沒有打過程式競賽。 想開始有系統地增強演算法&資料結構的能力
Thumbnail
推薦《數學之前人人平等》這本書,在這篇文章會講到此書談到「對數學天分的看法」與「建構學習支架的教學方法」,最後分享對我教學上的一些影響。
Thumbnail
推薦《數學之前人人平等》這本書,在這篇文章會講到此書談到「對數學天分的看法」與「建構學習支架的教學方法」,最後分享對我教學上的一些影響。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News