推薦系統算法:監督式學習、分群和相似度

閱讀時間約 4 分鐘

在思考推薦名單應該用什麼樣的算法來進行會比較好,因此 survey 了幾個算法,包含監督式學習、分群、相似度,以下針對各算法進行討論。

Photo by Alesia Kaz on Unsplash

Photo by Alesia Kaz on Unsplash


1. 監督式學習

監督式學習需要有明確的輸入(特徵)和輸出(目標變量)的歷史數據。透過這種方法,可以基於過去的數據預測未來的行為或分類。例如,有關於用戶以往購買歷史的數據,可提取特徵(如購買頻率、平均消費金額、購買類別等),並使用這些特徵來預測哪些用戶最有可能對某個產品感興趣。

◾ 優點 直接目標導向,可以針對特定問題(如預測誰會購買某個產品)進行優化。 易於解釋,因為可以明確知道哪些特徵對預測結果有影響。

◾ 缺點 需要大量的歷史數據。 如果數據集中的模式隨時間變化,模型可能需要定期重新訓練。


2. 分群

分群是一種無監督學習方法,它將數據集分成若干個組或“群”,這些群體內的成員比其他群體內的成員更相似。這種方法不需要預先標注的數據,而是根據數據本身的特性進行分組。例如,可以根據用戶的購買行為、瀏覽習慣等特徵將用戶分成不同的群體,然後針對每個群體推薦適合它們的產品或服務。

◾ 優點不需要標注數據,適用於沒有明確目標變量的場景。 可以發現數據中未知的模式或結構,有助於更好地了解用戶群體。

◾ 缺點 結果的解釋性可能不如監督式學習,因為分群是根據數據本身的相似性進行的,而不是針對特定預測目標。群體的定義可能隨時間和數據的變化而變化,需要定期重新評估和調整群體。

3. 相似度

這其實是一種更細化的策略,可以視為一種特殊形式的分群,更加注重個體間的相似性而非將個體分配到廣泛的群組中。

  • 用戶基於相似度的推薦(User-Based Collaborative Filtering):這種方法首先計算用戶間的相似度,然後為一個用戶推薦他相似用戶喜歡的產品。相似度可以通過各種度量來計算,如餘弦相似度、皮爾森相關係數或傑卡德相似度等。
  • 物品基於相似度的推薦(Item-Based Collaborative Filtering):這方法首先計算物品之間的相似度。如果一個用戶喜歡某個產品,系統會推薦與該產品相似的其他產品。

關鍵點在於:

1) 特徵選擇與預處理:為了準確計算相似度,選擇能夠代表用戶或物品特性的特徵。

  • 對於 user 選擇包括他們的購買歷史、瀏覽行為、評分和偏好等。
  • 對於物品,可以是類別、品牌、價格等屬性。

2)相似度度量:選擇合適的相似度度量非常關鍵。餘弦相似度適用於度量基於向量空間的相似性,而傑卡德相似度適用於比較基於集合的相似性。

3)鄰居的選擇:在基於用戶或物品的方法中,你需要決定考慮多少個「鄰居」(即相似的用戶或物品)。選擇太少可能不夠代表性,太多則可能引入噪聲。

4)評估與優化:使用適當的評估指標(如精確度、召回率、F1分數等)來評估推薦系統的性能,並根據反饋進行優化。與廣義的分群方法相比,基於客戶樣貌相似度的推薦更注重於細粒度的個體級相似性,能夠提供更個性化的推薦。這種方法適用於希望深入挖掘用戶偏好和行為模式的場景,可以大大提高推薦的相關性和用戶滿意度。然而,它也要求有足夠的數據支持以計算相似度,以及合適的算法來處理這些數據。


小結

監督式學習提供了針對特定目標導向問題的直接解決方案,但它依賴於大量的標注數據和模型的定期更新以適應數據變化。分群方法作為一種無監督學習技術,能夠揭示數據中的隱含模式和結構,適合於沒有明確目標變量的場景,但其結果的解釋性可能不如監督式學習強。相似度方法,特別是在推薦系統中,通過計算用戶或物品間的相似度來提供個性化推薦,雖然可以提高推薦的準確度和相關性,但同樣需要注意特徵選擇、相似度度量以及鄰居選擇等關鍵因素。

因此,在選擇推薦系統算法時,應考慮算法的適用性、數據的可用性、系統的實現複雜度以及期望達到的推薦效果。透過綜合考慮這些因素,可以選擇最適合當前應用需求的推薦算法。後續將基於這幾個算法進行實驗與成效分析並且驗證!

32會員
37內容數
歡迎來到《桃花源記》專欄。這裡不僅是一個文字的集合,更是一個探索、夢想和自我發現的空間。在這個專欄中,我們將一同走進那些隱藏在日常生活中的"桃花源"——那些讓我們心動、讓我們反思、讓我們找到內心平靜的時刻和地方
留言0
查看全部
發表第一個留言支持創作者!
Karen的沙龍 的其他內容
Kafka是一個先進的分佈式流處理平臺,具有高吞吐量、可擴展性、容錯性和低延遲特性,提供瞭解耦、非同步和削峰特點。本文介紹了Kafka的通訊模式、適合的應用場景和未來發展趨勢,旨在幫助使用者更好地理解和應用Kafka。
本文探討了在使用 pandas 處理資料時應注意的幾個關鍵點,以及如何減少因資料型態問題而產生的錯誤,確保資料的原始意義得以保留。主要包括Pandas 資料處理深入解析,尋找CSV之外的數據儲存方案,以及優化資料處理策略。
上篇進一步認識基本的圖形架構與三大 Graph 算法,那首先從 shortest path 開始,我們會陸續去理解這些算法,以及可能的應用,如果還沒有看過上一篇的,可以點以下連結~那我們就開始吧! 【圖論Graph】Part1:初探圖形與圖形演算法之應用
本篇文章深入介紹了圖形的基本概念、組成和應用。從圖形的基本組成,到圖的類型與種類,再到圖形演算法的三大類型,本文將接續圖形領域的深入學習,並分享了對圖形的初步認識和學習方向的小心得。希望對正在學習圖形的人有所幫助。
0/5Graph
圖形演算法在資料處理上扮演重要角色。本文介紹圖形的歷史、定義、技術用途,以及為什麼我們要關心圖形演算法。文末還提及圖形演算法在機器學習領域的應用。下次將介紹更詳細的圖形演算法內容。
參加Leetcode的30 Days of Pandas挑戰,除了是學習的機會,更是練習熟悉pandas功能的機會。文章分享了挑戰簡介、題目描述、關鍵技術以及參加挑戰的心得。適合新手學習pandas,也可提升熟練度。
Kafka是一個先進的分佈式流處理平臺,具有高吞吐量、可擴展性、容錯性和低延遲特性,提供瞭解耦、非同步和削峰特點。本文介紹了Kafka的通訊模式、適合的應用場景和未來發展趨勢,旨在幫助使用者更好地理解和應用Kafka。
本文探討了在使用 pandas 處理資料時應注意的幾個關鍵點,以及如何減少因資料型態問題而產生的錯誤,確保資料的原始意義得以保留。主要包括Pandas 資料處理深入解析,尋找CSV之外的數據儲存方案,以及優化資料處理策略。
上篇進一步認識基本的圖形架構與三大 Graph 算法,那首先從 shortest path 開始,我們會陸續去理解這些算法,以及可能的應用,如果還沒有看過上一篇的,可以點以下連結~那我們就開始吧! 【圖論Graph】Part1:初探圖形與圖形演算法之應用
本篇文章深入介紹了圖形的基本概念、組成和應用。從圖形的基本組成,到圖的類型與種類,再到圖形演算法的三大類型,本文將接續圖形領域的深入學習,並分享了對圖形的初步認識和學習方向的小心得。希望對正在學習圖形的人有所幫助。
0/5Graph
圖形演算法在資料處理上扮演重要角色。本文介紹圖形的歷史、定義、技術用途,以及為什麼我們要關心圖形演算法。文末還提及圖形演算法在機器學習領域的應用。下次將介紹更詳細的圖形演算法內容。
參加Leetcode的30 Days of Pandas挑戰,除了是學習的機會,更是練習熟悉pandas功能的機會。文章分享了挑戰簡介、題目描述、關鍵技術以及參加挑戰的心得。適合新手學習pandas,也可提升熟練度。
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
臺南婚房開箱!妹妹的新家裝潢分享,看看如何運用小空間的系統傢俱,有效地增加收納空間,又維持居家整潔乾淨。專業設計不僅為小空間增添層次,更注重實用性和舒適感,讓你在不大的空間內也能享受高級感。另外還介紹了傢俱購物和裝飾,搬家過後也要留意油煙和衛浴空間的規劃。有需要也可來電洽詢高森系統空間設計。
Thumbnail
Offision 是2024年最值得推薦的智慧辦公室預約系統,提供預約功能、訪客管理和人工智慧辦公室數據分析等功能。Offision 提供全面的辦公室管理支持,簡單易用且與眾多平臺完全整合,滿足各種辦公室管理需求。 體驗 Offision ,讓您的辦公室管理更加智慧、高效!
Thumbnail
智慧家居 smart home 已經醞釀許久。卻遲遲看不見其身影。智慧家居的概念是什麼,其實個說紛紜。但共同點有幾個。首先,需要有AI來提升居家的舒適度、便利性、安全性⋯等。先不論這些性質之間是否有矛盾。總之就是人的生活變好。各種說法間,如何讓人生活怎樣變好卻沒有共識。第二點,是需要能夠紀錄人的生活
Thumbnail
這集特別邀請破繭Cocoon的創辦人黃韶華,她細心觀察到了這塊市場,因為知道有人有這樣的需求,因此才成立內衣科技量身公司,希望能夠為亞洲女性設計出每一個人客製化尺寸的內衣,來幫助亞洲女性了解自己獨特的身形,穿上適合舒服的內衣。接下來我們就來聽聽看黃韶華的創業故事。
Thumbnail
智慧局於110年7月實施之電腦軟體相關發明審查基準為依據,撰寫包括人工智慧、大數據、區塊鏈、物聯網及雲端應用等5大資訊科技應用領域相關案例。本文以藥妝店商品推薦方法及系統、線上面試系統為例。
Thumbnail
電商百問第68集,告訴你會員系統推薦必備功能,讓你日進斗金、賺錢如有神助。我們在之前的篇章提到了擁有會員系統的優點,事實上,會員系統除了可以幫你收集會員名單外,還可以幫你分析會員資料,讓你除了那一筆筆的冰冷訂單外,還可以多出更多的洞察,也更容易讓幫你及時的調整行銷策略和賺更多錢。 會員系統推薦功能
Thumbnail
電商百問第34集,告訴你雲端POS跟傳統POS哪個適合你,讓你日進斗金、賺錢如有神助。經常會有人問,傳統POS結帳機與雲端POS系統到底該怎麼選,雲端POS看起來功能比較強,但是很多店家都還是用傳統POS系統呀,如果傳統POS系統不好用,為何這些店家都不願意換掉?看完本篇文章,你會有答案。 POS
Thumbnail
隨著網路以及數位化的興起,資料比以往更加的容易傳播以及儲存,過去使用者總是需要主動式的去獲取重要的資訊,然而,現在每天數以萬計的海量資料,我們是否已經漸漸變成被動式的接收各種重要或不重要的資訊了呢?
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
美國總統大選只剩下三天, 我們觀察一整週民調與金融市場的變化(包含賭局), 到本週五下午3:00前為止, 誰是美國總統幾乎大概可以猜到60-70%的機率, 本篇文章就是以大選結局為主軸來討論近期甚至到未來四年美股可能的改變
Thumbnail
Faker昨天真的太扯了,中國主播王多多點評的話更是精妙,分享給各位 王多多的點評 「Faker是我們的處境,他是LPL永遠繞不開的一個人和話題,所以我們特別渴望在決賽跟他相遇,去直面我們的處境。 我們曾經稱他為最高的山,最長的河,以為山海就是盡頭,可是Faker用他28歲的年齡...
Thumbnail
臺南婚房開箱!妹妹的新家裝潢分享,看看如何運用小空間的系統傢俱,有效地增加收納空間,又維持居家整潔乾淨。專業設計不僅為小空間增添層次,更注重實用性和舒適感,讓你在不大的空間內也能享受高級感。另外還介紹了傢俱購物和裝飾,搬家過後也要留意油煙和衛浴空間的規劃。有需要也可來電洽詢高森系統空間設計。
Thumbnail
Offision 是2024年最值得推薦的智慧辦公室預約系統,提供預約功能、訪客管理和人工智慧辦公室數據分析等功能。Offision 提供全面的辦公室管理支持,簡單易用且與眾多平臺完全整合,滿足各種辦公室管理需求。 體驗 Offision ,讓您的辦公室管理更加智慧、高效!
Thumbnail
智慧家居 smart home 已經醞釀許久。卻遲遲看不見其身影。智慧家居的概念是什麼,其實個說紛紜。但共同點有幾個。首先,需要有AI來提升居家的舒適度、便利性、安全性⋯等。先不論這些性質之間是否有矛盾。總之就是人的生活變好。各種說法間,如何讓人生活怎樣變好卻沒有共識。第二點,是需要能夠紀錄人的生活
Thumbnail
這集特別邀請破繭Cocoon的創辦人黃韶華,她細心觀察到了這塊市場,因為知道有人有這樣的需求,因此才成立內衣科技量身公司,希望能夠為亞洲女性設計出每一個人客製化尺寸的內衣,來幫助亞洲女性了解自己獨特的身形,穿上適合舒服的內衣。接下來我們就來聽聽看黃韶華的創業故事。
Thumbnail
智慧局於110年7月實施之電腦軟體相關發明審查基準為依據,撰寫包括人工智慧、大數據、區塊鏈、物聯網及雲端應用等5大資訊科技應用領域相關案例。本文以藥妝店商品推薦方法及系統、線上面試系統為例。
Thumbnail
電商百問第68集,告訴你會員系統推薦必備功能,讓你日進斗金、賺錢如有神助。我們在之前的篇章提到了擁有會員系統的優點,事實上,會員系統除了可以幫你收集會員名單外,還可以幫你分析會員資料,讓你除了那一筆筆的冰冷訂單外,還可以多出更多的洞察,也更容易讓幫你及時的調整行銷策略和賺更多錢。 會員系統推薦功能
Thumbnail
電商百問第34集,告訴你雲端POS跟傳統POS哪個適合你,讓你日進斗金、賺錢如有神助。經常會有人問,傳統POS結帳機與雲端POS系統到底該怎麼選,雲端POS看起來功能比較強,但是很多店家都還是用傳統POS系統呀,如果傳統POS系統不好用,為何這些店家都不願意換掉?看完本篇文章,你會有答案。 POS
Thumbnail
隨著網路以及數位化的興起,資料比以往更加的容易傳播以及儲存,過去使用者總是需要主動式的去獲取重要的資訊,然而,現在每天數以萬計的海量資料,我們是否已經漸漸變成被動式的接收各種重要或不重要的資訊了呢?