郝信華 iPAS AI應用規劃師學習筆記

線性判別分析（LDA，Linear Discriminant Analysis）

iPAS AI應用規劃師學習筆記

發佈於數據準備與模型選擇

2025/09/03 更新2025/09/03 發佈閱讀 2 分鐘

線性判別分析（LDA，Linear Discriminant Analysis）是一種監督式學習方法，主要用於分類問題及降維。LDA旨在通過線性組合特徵，使同一類別的樣本投影點盡可能接近，而不同類別的樣本投影點之間盡可能分開。

LDA的基本原理：

• 計算類內散布矩陣（衡量同類數據的變異程度）與類間散布矩陣（衡量不同類均值間的距離）。

• 尋找一組最佳線性投影，使得類間散度最大化，類內散度最小化。

• 根據該投影線（或超平面）對新數據進行分類。

LDA實現過程：

1. 對數據按類別計算均值向量和散佈矩陣。

2. 計算類內散布矩陣和類間散布矩陣。

3. 求解廣義特徵值問題，特徵向量即為投影方向。

4. 將數據投影到特徵向量空間，完成降維與分類。

LDA的特點與應用：

• 適用於多類別分類問題。

• 需要假設各類數據服從高斯分布且具有相同協方差矩陣。

• 可用於降維，保留分類資訊，提升後續分類器性能。

• 常用於人臉識別、文字識別、金融風險評估等領域。

與PCA的比較：

• PCA是無監督方法，目標是最大化投影後的數據變異性，與類別無關。

• LDA是監督方法，關注類別分離，最大化類間方差且最小化類內方差。

簡單比喻：

LDA就像把不同顏色的球投影到一條線上，讓同色球聚在一起，不同顏色的球分開，方便分辨。

總結：

LDA透過最大化類間差異與最小化類內差異的線性投影，用於多類別分類和降維，是統計與機器學習中重要的監督式方法。

含 AI 應用內容

#數據準備與模型選擇

郝信華 iPAS AI應用規劃師學習筆記數據準備與模型選擇

留言

留言分享你的想法！

郝信華 iPAS AI應用規劃師學習筆記

22會員

495內容數

現職 : 富邦建設資訊副理證照：經濟部 iPAS AI應用規劃師 AWS Certified AI Practitioner (AIF-C01)

郝信華 iPAS AI應用規劃師學習筆記的其他內容

2025/09/03

主成分分析（PCA，Principal Component Analysis）

主成分分析（PCA，Principal Component Analysis）是一種常用的線性降維技術，透過尋找數據中主要變異方向（主成分），將高維資料投影到較低維度的新空間中，以保留資料中最重要的資訊。 PCA的原理： 1. 數據中心化：先對數據做零均值化（每個特徵減去其均值）。 2.

2025/09/03

主成分分析（PCA，Principal Component Analysis）

主成分分析（PCA，Principal Component Analysis）是一種常用的線性降維技術，透過尋找數據中主要變異方向（主成分），將高維資料投影到較低維度的新空間中，以保留資料中最重要的資訊。 PCA的原理： 1. 數據中心化：先對數據做零均值化（每個特徵減去其均值）。 2.

2025/09/02

特徵縮放(Feature Scaling)常用方法

特徵縮放的常用方法主要有以下幾種：最小最大縮放（Min-Max Scaling）將特徵值縮放到固定範圍（通常是0到1之間），計算公式是。這種方法適合數據分佈較均勻或需要映射到特定範圍的場合，但對極端值敏感。標準化（Standardization）將特徵值的平均數轉為0，標準差轉為

2025/09/02

特徵縮放(Feature Scaling)常用方法

特徵縮放的常用方法主要有以下幾種：最小最大縮放（Min-Max Scaling）將特徵值縮放到固定範圍（通常是0到1之間），計算公式是。這種方法適合數據分佈較均勻或需要映射到特定範圍的場合，但對極端值敏感。標準化（Standardization）將特徵值的平均數轉為0，標準差轉為

2025/09/02

類別不平衡（Class Imbalance）常用方法

處理類別不平衡（Class Imbalance）是機器學習中常見且重要的問題，尤其在少數類樣本數量遠小於多數類時，模型容易偏向多數類，導致少數類識別效果差。常用的處理方法包括資料層面和算法層面技術。常用處理類別不平衡方法： 1. 資料層面方法 • 過採樣（Oversampling）少數類 

2025/09/02

類別不平衡（Class Imbalance）常用方法

處理類別不平衡（Class Imbalance）是機器學習中常見且重要的問題，尤其在少數類樣本數量遠小於多數類時，模型容易偏向多數類，導致少數類識別效果差。常用的處理方法包括資料層面和算法層面技術。常用處理類別不平衡方法： 1. 資料層面方法 • 過採樣（Oversampling）少數類 

你可能也想看

夢夢 🍰 甜點魔法

全家限定！療癒系馬來貘雪糕，創意吃法大公開｜豆漿燕麥碗、藍莓果昔

還在煩惱平凡日常該如何增添一點小驚喜嗎？全家便利商店這次聯手超萌的馬來貘，推出黑白配色的馬來貘雪糕，不僅外觀吸睛，層次豐富的雙層口味更是讓人一口接一口！本文將帶你探索馬來貘雪糕的多種創意吃法，從簡單的豆漿燕麥碗、藍莓果昔，到大人系的奇亞籽布丁下午茶，讓可愛的馬來貘陪你度過每一餐，增添生活中的小確幸！

#懶人料理#食譜#健康甜點

2025/10/15

夢夢 🍰 甜點魔法

全家限定！療癒系馬來貘雪糕，創意吃法大公開｜豆漿燕麥碗、藍莓果昔

還在煩惱平凡日常該如何增添一點小驚喜嗎？全家便利商店這次聯手超萌的馬來貘，推出黑白配色的馬來貘雪糕，不僅外觀吸睛，層次豐富的雙層口味更是讓人一口接一口！本文將帶你探索馬來貘雪糕的多種創意吃法，從簡單的豆漿燕麥碗、藍莓果昔，到大人系的奇亞籽布丁下午茶，讓可愛的馬來貘陪你度過每一餐，增添生活中的小確幸！

#懶人料理#食譜#健康甜點

2025/10/15

JayRay 的沙龍

【資料分析】python資料處理-特徵工程的使用時機與基礎操作語法彙整

特徵工程是機器學習中的核心技術，通過將原始數據轉換為有意義的特徵，以提升模型的準確性和穩定性。常見的特徵工程方法包括異常值檢測、特徵轉換、特徵縮放、特徵表示、特徵選擇和特徵提取。本文將深入探討這些方法的適用情況及具體實施流程，以幫助讀者有效利用特徵工程來優化機器學習模型表現。

#數據#模型#異常

2024/08/14

JayRay 的沙龍

【資料分析】python資料處理-特徵工程的使用時機與基礎操作語法彙整

特徵工程是機器學習中的核心技術，通過將原始數據轉換為有意義的特徵，以提升模型的準確性和穩定性。常見的特徵工程方法包括異常值檢測、特徵轉換、特徵縮放、特徵表示、特徵選擇和特徵提取。本文將深入探討這些方法的適用情況及具體實施流程，以幫助讀者有效利用特徵工程來優化機器學習模型表現。

#數據#模型#異常

2024/08/14

JayRay 的沙龍

【資料分析】資料分析起手式，理解數據並使用python找到資料間的關聯

在資料分析過程中，透過衡量變數之間的線性或非線性關係，能有效探索數據集，篩選出重要特徵，並進行預測建模。本文介紹瞭如何理解數據、使用相關矩陣找出變數關聯性，以及利用互資訊評估變數之間的依賴程度，幫助資料科學家在建模過程中選擇適當的變數，提升模型效果。

#數據#資訊#模型

2024/08/07

JayRay 的沙龍

【資料分析】資料分析起手式，理解數據並使用python找到資料間的關聯

在資料分析過程中，透過衡量變數之間的線性或非線性關係，能有效探索數據集，篩選出重要特徵，並進行預測建模。本文介紹瞭如何理解數據、使用相關矩陣找出變數關聯性，以及利用互資訊評估變數之間的依賴程度，幫助資料科學家在建模過程中選擇適當的變數，提升模型效果。

#數據#資訊#模型

2024/08/07

JayRay 的沙龍

【資料分析】python資料視覺化基礎操作語法彙整

Python資料視覺化在數據分析中扮演關鍵角色，透過視覺化捕捉數據模式、趨勢和異常，透過Matplotlib等工具創建專業圖表變相對簡單和高效。

#python#Matplotlib#資料分析

2024/08/03

JayRay 的沙龍

【資料分析】python資料視覺化基礎操作語法彙整

Python資料視覺化在數據分析中扮演關鍵角色，透過視覺化捕捉數據模式、趨勢和異常，透過Matplotlib等工具創建專業圖表變相對簡單和高效。

#python#Matplotlib#資料分析

2024/08/03

JayRay 的沙龍

【資料分析】python資料處理-類別欄位轉換基礎操作語法彙整

本文介紹了在進行資料分析時，將類別欄位轉換為數值欄位的方法，包括Label Encoding、One-Hot Encoding、Binary Encoding、Target Encoding和Frequency Encoding。每種方法的應用範例、優缺點和適用場景都有詳細說明。

#數據#順序#模型

2024/08/01

JayRay 的沙龍

【資料分析】python資料處理-類別欄位轉換基礎操作語法彙整

本文介紹了在進行資料分析時，將類別欄位轉換為數值欄位的方法，包括Label Encoding、One-Hot Encoding、Binary Encoding、Target Encoding和Frequency Encoding。每種方法的應用範例、優缺點和適用場景都有詳細說明。

#數據#順序#模型

2024/08/01

教育心理博士的筆記本

使用R語言跑多層次模型:加入層次2預測變項

在進行多層次線性模型（MLM）當中，有時候我們不只會加入層次1的預測變項。我們也會想加入層次2預測變項。本文將介紹加入層次2預測變項的各種模型，並解釋其公式和R語言操作方法。因為內容比較多，所以篇幅比較長。多層次線性模型（MLM），截距是表示所有學校的平均值。斜率是指模型中自變量的係數，表

#R語言#隨機#成績

2024/07/30

教育心理博士的筆記本

使用R語言跑多層次模型:加入層次2預測變項

在進行多層次線性模型（MLM）當中，有時候我們不只會加入層次1的預測變項。我們也會想加入層次2預測變項。本文將介紹加入層次2預測變項的各種模型，並解釋其公式和R語言操作方法。因為內容比較多，所以篇幅比較長。多層次線性模型（MLM），截距是表示所有學校的平均值。斜率是指模型中自變量的係數，表

#R語言#隨機#成績

2024/07/30

【文創漫談】數據分析與解讀 | 如何利用AI | 增強能力

數據分析與解讀隨著數據的爆炸式增長，能夠分析、解讀和應用數據的能力變得至關重要。這包括熟悉數據分析工具和技術，如統計學、數據挖掘、機器學習等。然而，僅靠短時間的數據分析並不足以提供深入見解。要熟悉數據分析工具和技術，如統計學、數據挖掘和機器學習，可以從以下幾個方面入手：基礎知識的學習

#文創漫談#數據分析與解讀#如何利用AI增強能力

2024/07/28

【文創漫談】數據分析與解讀 | 如何利用AI | 增強能力

數據分析與解讀隨著數據的爆炸式增長，能夠分析、解讀和應用數據的能力變得至關重要。這包括熟悉數據分析工具和技術，如統計學、數據挖掘、機器學習等。然而，僅靠短時間的數據分析並不足以提供深入見解。要熟悉數據分析工具和技術，如統計學、數據挖掘和機器學習，可以從以下幾個方面入手：基礎知識的學習

#文創漫談#數據分析與解讀#如何利用AI增強能力

2024/07/28

螃蟹_crab的沙龍

[深度學習][Python]多層感知器（MLP）模型使用不同激活函數（ReLU 和 Sigmoid）的效果

本文將展示使用不同激活函數（ReLU 和 Sigmoid）的效果。一個簡單的多層感知器（MLP）模型來對 Fashion-MNIST 資料集進行分類。函數定義 Sigmoid 函數 Sigmoid 函數將輸入壓縮到 0到 1 之間：特性：輸出範圍是 (0,1)(0, 1)(0,1

#ReLU和Sigmoid#多層感知器#MLP

2024/05/26

螃蟹_crab的沙龍

[深度學習][Python]多層感知器（MLP）模型使用不同激活函數（ReLU 和 Sigmoid）的效果

本文將展示使用不同激活函數（ReLU 和 Sigmoid）的效果。一個簡單的多層感知器（MLP）模型來對 Fashion-MNIST 資料集進行分類。函數定義 Sigmoid 函數 Sigmoid 函數將輸入壓縮到 0到 1 之間：特性：輸出範圍是 (0,1)(0, 1)(0,1

#ReLU和Sigmoid#多層感知器#MLP

2024/05/26

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News