45/100 奇異值分解（SVD） 🎭 用於推薦系統與文本分析，擅長處理稀疏數據！

Hansen W

發佈於AI科技機器學習修煉坊

2025/05/28 更新2025/05/28 發佈閱讀 7 分鐘

AI時代系列(3) 機器學習三部曲: 🔹 第一部：《機器學習 —— AI 智慧的啟航》

45/100 第五週：非監督學習

45. 奇異值分解（SVD） 🎭 用於推薦系統與文本分析，擅長處理稀疏數據！

🎭 奇異值分解（SVD）

用於推薦系統與文本分析，擅長處理稀疏數據！

________________________________________

🔎 一、什麼是 SVD（Singular Value Decomposition）？

• SVD 是一種矩陣分解技術

• 能將任意大小的矩陣拆解為三個矩陣的乘積：

A=UΣ Vᵗ

✅ U（左奇異矩陣）：代表原數據的特徵向量（行空間）

✅ Σ（奇異值對角矩陣）：代表每個主成分的重要程度

✅ Vᵗ（右奇異矩陣）：代表特徵向量（列空間）

________________________________________

🌟 二、SVD 的核心價值與用途

1. 降維保留最重要的奇異值，達到資料壓縮效果

2. 特徵提取抽取數據中最具代表性的資訊

3. 處理稀疏數據對推薦系統中缺失值（0值）極為友善

4. 雜訊過濾小奇異值常被視為雜訊，可過濾掉

5. 隱含結構挖掘發現數據中潛在的隱含規律與關聯

________________________________________

📚 三、SVD 經典應用場景

✅ 推薦系統（Collaborative Filtering）

👉 例：Netflix、YouTube、Spotify 影片與歌曲推薦

✅ 文本與語意分析（LSA）

👉 潛在語意分析（Latent Semantic Analysis, LSA）發掘文本潛藏的主題

✅ 圖片壓縮

👉 用少量奇異值重建圖片，達到壓縮效果

✅ 降維與資料清理

________________________________________

📈 四、推薦系統中的應用範例（矩陣填空）

原始評分矩陣（User-Item Matrix）

使用者/物品電影A 電影B 電影C 電影D

User1 5 3 0 1

User2 4 0 0 1

User3 1 1 0 5

User4 0 0 5 4

User5 0 1 5 4

✅ 利用 SVD 分解後填補 0 值，預測使用者可能喜歡的電影

________________________________________

🛠 五、Python 例子（scipy or numpy）

python

import numpy as np

from scipy.sparse.linalg import svds

# 假設評分矩陣

R = np.array([

[5, 3, 0, 1],

[4, 0, 0, 1],

[1, 1, 0, 5],

[0, 0, 5, 4],

[0, 1, 5, 4]

], dtype=float)

# SVD 分解

U, sigma, VT = svds(R, k=2)

sigma = np.diag(sigma)

# 預測填補缺失值

R_pred = np.dot(np.dot(U, sigma), VT)

print(np.round(R_pred, 2))

這段程式碼透過奇異值分解（SVD）將使用者對物品的評分矩陣降維，並重建出一個近似矩陣，以預測原本缺失（0）的評分值，是協同過濾式推薦系統的常用方法。它先對原始評分資料進行秩為2的稀疏SVD分解，取得使用者與物品的潛在特徵向量，再透過矩陣乘積重構預測評分矩陣，進而達到填補遺漏資料並實現個人化推薦的目的，廣泛應用於如 Netflix、Spotify 等平台的推薦系統中。

✅ 結果：預測出原本 0 的位置可能的評分值，提升推薦系統效果！

________________________________________

📊 六、SVD 與 PCA 的關聯

PCA SVD

基於共變異矩陣直接分解原始矩陣

適合連續數值型數據適合稀疏或缺失數據

強調數據最大變異方向強調數據矩陣潛在結構

常用於可視化更廣泛用於推薦與文本

👉 數學上，PCA 其實就是 SVD 的一種特殊應用！

________________________________________

📉 七、SVD 優缺點

優點缺點

✅ 強大降維能力 ❌ 計算量大（大型矩陣耗資源）

✅ 能處理稀疏數據 ❌ 對異常值敏感

✅ 適合推薦系統與文本 ❌ 實務上常需截斷（Truncated SVD）以減少運算

________________________________________

🎯 八、總結與亮點

✔ SVD 是機器學習與數據科學中最重要的矩陣運算之一

✔ 能發掘潛在結構，讓「隱藏資訊」浮出水面

✔ 廣泛應用於推薦系統、自然語言處理、圖像處理與降維領域

________________________________________

📌 一句話精華

🎭 SVD = 用數學魔法解開稀疏數據背後的秘密，讓推薦更準、文本更懂你！

________________________________________

Hansen W的沙龍AI科技機器學習修煉坊

留言

留言分享你的想法！

Hansen W的沙龍

13會員

307內容數

AIHANS沙龍是一個結合AI技術實戰、產業策略與自我成長的知識平台，主題涵蓋機器學習、生成式AI、創業經驗、財務規劃及哲學思辨。這裡不只提供系統化學習資源與實作案例，更強調理性思維與行動力的結合。無論你是AI初學者、創業者，還是追求人生升維的行者，都能在這裡找到前進的方向與志同道合的夥伴。

Hansen W的沙龍的其他內容

2025/05/28

44/100 PCA 降維 📉 主成分分析，讓高維度數據變得可視化！

PCA透過尋找資料最大變異方向，把多維特徵壓縮成少數互不相關的主成分，既保留關鍵資訊，又去除雜訊與冗餘。它大幅降低維度詛咒帶來的計算負擔，並將高維數據轉換成易於解釋的 2D/3D 視覺，協助後續聚類、分類或特徵選取。若先做標準化並利用解釋變異量挑選主成分，可在效率與資訊量之間取得最佳平衡。

2025/05/28

44/100 PCA 降維 📉 主成分分析，讓高維度數據變得可視化！

2025/05/28

43/100 DBSCAN 🔍 密度聚類演算法，能找出不同密度的數據群！

DBSCAN 透過 ε 半徑與 MinPts 判斷密度，無須事先設定群數，可自動偵測任意形狀群集並標記離群點，對含雜訊或非線性分布的地理、天文、社群資料特別實用；但 ε、MinPts 需細調，且在高維度時距離計算衰減，效果有限。

2025/05/28

43/100 DBSCAN 🔍 密度聚類演算法，能找出不同密度的數據群！

2025/05/28

42/100 階層式聚類 🏗 像家族樹一樣逐層分組，適合分析層級關係！

階層式聚類以計算樣本距離，從「一點一群」逐步合併成樹狀結構；免先設定 K 值、能直觀呈現親疏遠近，適用基因分析、客戶分層與社群關係探索，但耗時、對離群值敏感且無法回溯合併。

2025/05/28

42/100 階層式聚類 🏗 像家族樹一樣逐層分組，適合分析層級關係！

#Netflix 的其他內容

《今際之國的闖關者》第三季：觀眾們成為最大 Joker🃏

阿揪西茶房

Netflix《殺手螳螂》無雷影評｜雖然老梗但有用

躲在電影裡的詩人：航電影的海

【劇評】《犬系戀人》第十集：純愛之間的仇恨。

你可能也想看

夢夢 🍰 甜點魔法

全家限定！療癒系馬來貘雪糕，創意吃法大公開｜豆漿燕麥碗、藍莓果昔

還在煩惱平凡日常該如何增添一點小驚喜嗎？全家便利商店這次聯手超萌的馬來貘，推出黑白配色的馬來貘雪糕，不僅外觀吸睛，層次豐富的雙層口味更是讓人一口接一口！本文將帶你探索馬來貘雪糕的多種創意吃法，從簡單的豆漿燕麥碗、藍莓果昔，到大人系的奇亞籽布丁下午茶，讓可愛的馬來貘陪你度過每一餐，增添生活中的小確幸！

#懶人料理#食譜#健康甜點

2025/10/15