線性判別分析(LDA,Linear Discriminant Analysis)

更新 發佈閱讀 2 分鐘

線性判別分析(LDA,Linear Discriminant Analysis)是一種監督式學習方法,主要用於分類問題及降維。LDA旨在通過線性組合特徵,使同一類別的樣本投影點盡可能接近,而不同類別的樣本投影點之間盡可能分開。

LDA的基本原理:

計算類內散布矩陣(衡量同類數據的變異程度)與類間散布矩陣(衡量不同類均值間的距離)。

尋找一組最佳線性投影,使得類間散度最大化,類內散度最小化。

根據該投影線(或超平面)對新數據進行分類。

LDA實現過程:

1. 對數據按類別計算均值向量和散佈矩陣。

2. 計算類內散布矩陣 和類間散布矩陣 。

3. 求解廣義特徵值問題 ,特徵向量即為投影方向。

4. 將數據投影到特徵向量空間,完成降維與分類。

LDA的特點與應用:

適用於多類別分類問題。

需要假設各類數據服從高斯分布且具有相同協方差矩陣。

可用於降維,保留分類資訊,提升後續分類器性能。

常用於人臉識別、文字識別、金融風險評估等領域。

與PCA的比較:

PCA是無監督方法,目標是最大化投影後的數據變異性,與類別無關。

LDA是監督方法,關注類別分離,最大化類間方差且最小化類內方差。

簡單比喻:

LDA就像把不同顏色的球投影到一條線上,讓同色球聚在一起,不同顏色的球分開,方便分辨。

總結:

LDA透過最大化類間差異與最小化類內差異的線性投影,用於多類別分類和降維,是統計與機器學習中重要的監督式方法。

留言
avatar-img
郝信華 iPAS AI應用規劃師 學習筆記
46會員
572內容數
現職 : 富邦建設資訊副理 證照:經濟部 iPAS AI應用規劃師 初級+中級(數據分析) AWS AIF-C01 AWS CLF-C02 Microsoft AI-900 其他:富邦美術館志工
2025/09/03
主成分分析(PCA,Principal Component Analysis)是一種常用的線性降維技術,透過尋找數據中主要變異方向(主成分),將高維資料投影到較低維度的新空間中,以保留資料中最重要的資訊。 PCA的原理: 1. 數據中心化:先對數據做零均值化(每個特徵減去其均值)。 2.
2025/09/03
主成分分析(PCA,Principal Component Analysis)是一種常用的線性降維技術,透過尋找數據中主要變異方向(主成分),將高維資料投影到較低維度的新空間中,以保留資料中最重要的資訊。 PCA的原理: 1. 數據中心化:先對數據做零均值化(每個特徵減去其均值)。 2.
2025/09/02
特徵縮放的常用方法主要有以下幾種: 最小最大縮放(Min-Max Scaling) 將特徵值縮放到固定範圍(通常是0到1之間),計算公式是 。這種方法適合數據分佈較均勻或需要映射到特定範圍的場合,但對極端值敏感。 標準化(Standardization) 將特徵值的平均數轉為0,標準差轉為
Thumbnail
2025/09/02
特徵縮放的常用方法主要有以下幾種: 最小最大縮放(Min-Max Scaling) 將特徵值縮放到固定範圍(通常是0到1之間),計算公式是 。這種方法適合數據分佈較均勻或需要映射到特定範圍的場合,但對極端值敏感。 標準化(Standardization) 將特徵值的平均數轉為0,標準差轉為
Thumbnail
2025/09/02
處理類別不平衡(Class Imbalance)是機器學習中常見且重要的問題,尤其在少數類樣本數量遠小於多數類時,模型容易偏向多數類,導致少數類識別效果差。常用的處理方法包括資料層面和算法層面技術。 常用處理類別不平衡方法: 1. 資料層面方法 • 過採樣(Oversampling)少數類

2025/09/02
處理類別不平衡(Class Imbalance)是機器學習中常見且重要的問題,尤其在少數類樣本數量遠小於多數類時,模型容易偏向多數類,導致少數類識別效果差。常用的處理方法包括資料層面和算法層面技術。 常用處理類別不平衡方法: 1. 資料層面方法 • 過採樣(Oversampling)少數類

看更多
你可能也想看
Thumbnail
數據分析與解讀 隨著數據的爆炸式增長,能夠分析、解讀和應用數據的能力變得至關重要。這包括熟悉數據分析工具和技術,如統計學、數據挖掘、機器學習等。然而,僅靠短時間的數據分析並不足以提供深入見解。 要熟悉數據分析工具和技術,如統計學、數據挖掘和機器學習,可以從以下幾個方面入手: 基礎知識的學習
Thumbnail
數據分析與解讀 隨著數據的爆炸式增長,能夠分析、解讀和應用數據的能力變得至關重要。這包括熟悉數據分析工具和技術,如統計學、數據挖掘、機器學習等。然而,僅靠短時間的數據分析並不足以提供深入見解。 要熟悉數據分析工具和技術,如統計學、數據挖掘和機器學習,可以從以下幾個方面入手: 基礎知識的學習
Thumbnail
在上一篇中,我們在模型探討隨機截距交叉延宕在Extension 2中,可以使用的分類變量進行Multiple group分析。接下來,擴展 RI-CLPM 的另一種方法是為每個使用多個指標測量,本文將簡介兩種Multiple indicators模型。
Thumbnail
在上一篇中,我們在模型探討隨機截距交叉延宕在Extension 2中,可以使用的分類變量進行Multiple group分析。接下來,擴展 RI-CLPM 的另一種方法是為每個使用多個指標測量,本文將簡介兩種Multiple indicators模型。
Thumbnail
在資料分析過程中,透過衡量變數之間的線性或非線性關係,能有效探索數據集,篩選出重要特徵,並進行預測建模。本文介紹瞭如何理解數據、使用相關矩陣找出變數關聯性,以及利用互資訊評估變數之間的依賴程度,幫助資料科學家在建模過程中選擇適當的變數,提升模型效果。
Thumbnail
在資料分析過程中,透過衡量變數之間的線性或非線性關係,能有效探索數據集,篩選出重要特徵,並進行預測建模。本文介紹瞭如何理解數據、使用相關矩陣找出變數關聯性,以及利用互資訊評估變數之間的依賴程度,幫助資料科學家在建模過程中選擇適當的變數,提升模型效果。
Thumbnail
在進行多層次線性模型(MLM)當中,有時候我們不只會加入層次1的預測變項。我們也會想加入層次2預測變項。本文將介紹加入層次2預測變項的各種模型,並解釋其公式和R語言操作方法。因為內容比較多,所以篇幅比較長。 多層次線性模型(MLM),截距是表示所有學校的平均值。斜率是指模型中自變量的係數,表
Thumbnail
在進行多層次線性模型(MLM)當中,有時候我們不只會加入層次1的預測變項。我們也會想加入層次2預測變項。本文將介紹加入層次2預測變項的各種模型,並解釋其公式和R語言操作方法。因為內容比較多,所以篇幅比較長。 多層次線性模型(MLM),截距是表示所有學校的平均值。斜率是指模型中自變量的係數,表
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
Python資料視覺化在數據分析中扮演關鍵角色,透過視覺化捕捉數據模式、趨勢和異常,透過Matplotlib等工具創建專業圖表變相對簡單和高效。
Thumbnail
Python資料視覺化在數據分析中扮演關鍵角色,透過視覺化捕捉數據模式、趨勢和異常,透過Matplotlib等工具創建專業圖表變相對簡單和高效。
Thumbnail
本文介紹了在進行資料分析時,將類別欄位轉換為數值欄位的方法,包括Label Encoding、One-Hot Encoding、Binary Encoding、Target Encoding和Frequency Encoding。每種方法的應用範例、優缺點和適用場景都有詳細說明。
Thumbnail
本文介紹了在進行資料分析時,將類別欄位轉換為數值欄位的方法,包括Label Encoding、One-Hot Encoding、Binary Encoding、Target Encoding和Frequency Encoding。每種方法的應用範例、優缺點和適用場景都有詳細說明。
Thumbnail
特徵工程是機器學習中的核心技術,通過將原始數據轉換為有意義的特徵,以提升模型的準確性和穩定性。常見的特徵工程方法包括異常值檢測、特徵轉換、特徵縮放、特徵表示、特徵選擇和特徵提取。本文將深入探討這些方法的適用情況及具體實施流程,以幫助讀者有效利用特徵工程來優化機器學習模型表現。
Thumbnail
特徵工程是機器學習中的核心技術,通過將原始數據轉換為有意義的特徵,以提升模型的準確性和穩定性。常見的特徵工程方法包括異常值檢測、特徵轉換、特徵縮放、特徵表示、特徵選擇和特徵提取。本文將深入探討這些方法的適用情況及具體實施流程,以幫助讀者有效利用特徵工程來優化機器學習模型表現。
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
本文將展示使用不同激活函數(ReLU 和 Sigmoid)的效果。 一個簡單的多層感知器(MLP)模型來對 Fashion-MNIST 資料集進行分類。 函數定義 Sigmoid 函數 Sigmoid 函數將輸入壓縮到 0到 1 之間: 特性: 輸出範圍是 (0,1)(0, 1)(0,1
Thumbnail
本文將展示使用不同激活函數(ReLU 和 Sigmoid)的效果。 一個簡單的多層感知器(MLP)模型來對 Fashion-MNIST 資料集進行分類。 函數定義 Sigmoid 函數 Sigmoid 函數將輸入壓縮到 0到 1 之間: 特性: 輸出範圍是 (0,1)(0, 1)(0,1
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News