【資料科學的數學基礎課|第8課】特徵分解降維是什麼?PCA 背後的數學魔法!

更新於 發佈於 閱讀時間約 2 分鐘

前一篇我們聊過:PCA 是一種把「高維資料」簡化成「低維資料」的方法,但又不會丟掉太多資訊。這一篇,我們來看看這件事背後的數學魔法叫什麼名字 👉 特徵分解


📌 什麼是特徵分解?

假設你有一個「協方差矩陣」A(別緊張!其實就是分析資料關係的工具),

透過特徵分解,我們可以把它拆成這樣的樣子:

raw-image

👀 看不懂沒關係,來逐個拆解:

  • A:原本的資料關係(協方差矩陣)
  • Q:特徵向量組成的矩陣(這些是主成分的方向)
  • Λ(Lambda):對角線上是特徵值(代表每個方向上的「資訊量」)
  • Qᵀ:Q 的轉置(只是數學上讓拆解完整)

🌟 重點是什麼?

PCA 就是從這堆特徵中,挑出「資訊量最大的前幾個方向」來看資料。

比如:

  • 原本資料是 100 維的
  • 我們只取前 k = 2 個最大特徵值對應的方向(特徵向量)

這樣就能把資料變成 2 維版本!而且保留了最多的資訊。


✨ 一句話總結:

特徵分解讓我們找到資料裡「最重要的方向」,只要看這些方向,就能大致理解整份資料!


🧠 小試身手

給你下面這個協方差矩陣:

raw-image

它有兩個特徵值:λ₁ = 6, λ₂ = 2

請問:

如果你只想降成 1 維資料,應該選哪個特徵值對應的方向?

A. λ₁ = 6

B. λ₂ = 2

👉 答案是 A!因為它表示的方向擁有最多的變異資訊
陪你一路練到資料科學高手!

✨ 如果這篇文章對你有幫助,別忘了:

  1. 按下「收藏」或「愛心」——下次複習更方便!
  2. 在留言區告訴我
    • 你最想用 PCA 做什麼有趣的專案?
    • 或者哪一段還想看更詳細的圖解?
  3. 追蹤本專欄——每週一篇「數學 × 資料科學」小任務,帶你從 0 ➜ 1 打好底子。

一起把繁雜的數字世界,變成有條理又好玩的工具箱!🙌

留言
avatar-img
留言分享你的想法!
avatar-img
溫蒂的夢幻島航海日誌
1會員
13內容數
我是 Wendy,一位相信知識可以讓世界更美好的學習者。 白天是品保工程師,晚上是資料筆記的整理者。 正在深入統計與品質管理,也持續探索資料科學與商業邏輯的連結。 偶爾也會記錄家庭經營、親子對話與自由工作者的嘗試。 每一篇文章,都是給自己的備忘錄,也希望成為你前行路上的地圖。
2025/08/04
本篇文章以淺顯易懂的方式介紹主成分分析(PCA),說明其原理、步驟及應用,並透過生活化的例子(打包行李)幫助讀者理解,最後設計小測驗加深印象。
Thumbnail
2025/08/04
本篇文章以淺顯易懂的方式介紹主成分分析(PCA),說明其原理、步驟及應用,並透過生活化的例子(打包行李)幫助讀者理解,最後設計小測驗加深印象。
Thumbnail
2025/08/04
✍️ 文/未來的資料科學家練習生 你有沒有發現一件事? 拍照時,角度對了,臉就小一圈 整理資料時,有些數據方向「特別有代表性」 做模型時,我們常想抓出「真正重要的變化方向」 這些,其實都跟今天要介紹的主角有關── 👉 特徵值(Eigenvalue)與特徵向量(Eigenvector)
Thumbnail
2025/08/04
✍️ 文/未來的資料科學家練習生 你有沒有發現一件事? 拍照時,角度對了,臉就小一圈 整理資料時,有些數據方向「特別有代表性」 做模型時,我們常想抓出「真正重要的變化方向」 這些,其實都跟今天要介紹的主角有關── 👉 特徵值(Eigenvalue)與特徵向量(Eigenvector)
Thumbnail
2025/08/04
這篇文章介紹了線性代數中幾種重要的向量:單位向量、正交向量、正交矩陣和正交單位向量,並解釋了它們在資料科學和機器學習中的應用,例如資料標準化、維度獨立性保證、資料轉換和模型優化。
Thumbnail
2025/08/04
這篇文章介紹了線性代數中幾種重要的向量:單位向量、正交向量、正交矩陣和正交單位向量,並解釋了它們在資料科學和機器學習中的應用,例如資料標準化、維度獨立性保證、資料轉換和模型優化。
Thumbnail
看更多
你可能也想看
Thumbnail
特徵工程是機器學習中的核心技術,通過將原始數據轉換為有意義的特徵,以提升模型的準確性和穩定性。常見的特徵工程方法包括異常值檢測、特徵轉換、特徵縮放、特徵表示、特徵選擇和特徵提取。本文將深入探討這些方法的適用情況及具體實施流程,以幫助讀者有效利用特徵工程來優化機器學習模型表現。
Thumbnail
特徵工程是機器學習中的核心技術,通過將原始數據轉換為有意義的特徵,以提升模型的準確性和穩定性。常見的特徵工程方法包括異常值檢測、特徵轉換、特徵縮放、特徵表示、特徵選擇和特徵提取。本文將深入探討這些方法的適用情況及具體實施流程,以幫助讀者有效利用特徵工程來優化機器學習模型表現。
Thumbnail
商業簡報不僅僅是呈現數據,更需要深入瞭解數據分析及有效的工具運用。本文探討於Excel中使用不同函數來改善數據處理效率,包括IF、IFS、VLOOKUP、XLOOKUP及INDEX與MATCH的結合,幫助商業人士更好地從數據中提取洞見,助力業務增值,學習優化數據分析過程,讓您的商業簡報更具影響力。
Thumbnail
商業簡報不僅僅是呈現數據,更需要深入瞭解數據分析及有效的工具運用。本文探討於Excel中使用不同函數來改善數據處理效率,包括IF、IFS、VLOOKUP、XLOOKUP及INDEX與MATCH的結合,幫助商業人士更好地從數據中提取洞見,助力業務增值,學習優化數據分析過程,讓您的商業簡報更具影響力。
Thumbnail
在資料分析過程中,透過衡量變數之間的線性或非線性關係,能有效探索數據集,篩選出重要特徵,並進行預測建模。本文介紹瞭如何理解數據、使用相關矩陣找出變數關聯性,以及利用互資訊評估變數之間的依賴程度,幫助資料科學家在建模過程中選擇適當的變數,提升模型效果。
Thumbnail
在資料分析過程中,透過衡量變數之間的線性或非線性關係,能有效探索數據集,篩選出重要特徵,並進行預測建模。本文介紹瞭如何理解數據、使用相關矩陣找出變數關聯性,以及利用互資訊評估變數之間的依賴程度,幫助資料科學家在建模過程中選擇適當的變數,提升模型效果。
Thumbnail
Python資料視覺化在數據分析中扮演關鍵角色,透過視覺化捕捉數據模式、趨勢和異常,透過Matplotlib等工具創建專業圖表變相對簡單和高效。
Thumbnail
Python資料視覺化在數據分析中扮演關鍵角色,透過視覺化捕捉數據模式、趨勢和異常,透過Matplotlib等工具創建專業圖表變相對簡單和高效。
Thumbnail
本文介紹了在進行資料分析時,將類別欄位轉換為數值欄位的方法,包括Label Encoding、One-Hot Encoding、Binary Encoding、Target Encoding和Frequency Encoding。每種方法的應用範例、優缺點和適用場景都有詳細說明。
Thumbnail
本文介紹了在進行資料分析時,將類別欄位轉換為數值欄位的方法,包括Label Encoding、One-Hot Encoding、Binary Encoding、Target Encoding和Frequency Encoding。每種方法的應用範例、優缺點和適用場景都有詳細說明。
Thumbnail
資料前處理(Data Preprocessing)中的重要角色-缺失值處理。從檢查、刪除到填充缺失值,以及插值法和機器學習算法的應用方法。Pandas 缺失值處理基礎方法、進階填充缺失值、鐵達尼號存活預測資料集的示例和機器學習算法填補缺失值方法的介紹與使用。
Thumbnail
資料前處理(Data Preprocessing)中的重要角色-缺失值處理。從檢查、刪除到填充缺失值,以及插值法和機器學習算法的應用方法。Pandas 缺失值處理基礎方法、進階填充缺失值、鐵達尼號存活預測資料集的示例和機器學習算法填補缺失值方法的介紹與使用。
Thumbnail
數據分析與解讀 隨著數據的爆炸式增長,能夠分析、解讀和應用數據的能力變得至關重要。這包括熟悉數據分析工具和技術,如統計學、數據挖掘、機器學習等。然而,僅靠短時間的數據分析並不足以提供深入見解。 要熟悉數據分析工具和技術,如統計學、數據挖掘和機器學習,可以從以下幾個方面入手: 基礎知識的學習
Thumbnail
數據分析與解讀 隨著數據的爆炸式增長,能夠分析、解讀和應用數據的能力變得至關重要。這包括熟悉數據分析工具和技術,如統計學、數據挖掘、機器學習等。然而,僅靠短時間的數據分析並不足以提供深入見解。 要熟悉數據分析工具和技術,如統計學、數據挖掘和機器學習,可以從以下幾個方面入手: 基礎知識的學習
Thumbnail
這篇文章介紹如何使用Python整理資料成百分比資料以及繪製百分比堆疊直條圖。
Thumbnail
這篇文章介紹如何使用Python整理資料成百分比資料以及繪製百分比堆疊直條圖。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News