線性支持向量機(Linear Support Vector Machine, Linear SVM)

更新於 發佈於 閱讀時間約 2 分鐘

Linear Support Vector Machine (Linear SVM) 是一種監督式機器學習演算法,用於二元分類問題,目標是找到一條或一個超平面(hyperplane)以線性方式將兩個類別的數據點分開。這個超平面會最大化兩個類別中最接近該超平面的資料點(稱為支持向量,support vectors)之間的「邊界距離」(margin),以達到最佳分離效果。

Linear SVM的核心特點包括:

  • 使用線性決策邊界,適合資料在特徵空間中線性可分的情況。 最大化邊界距離,提高模型對新資料的泛化能力。 可採用硬邊界(perfectly separable)或軟邊界(允許部分誤分類)策略,以兼顧分類精度和容錯性。 通過優化目標函數(包含邊界最大化與懲罰錯誤分類的項),求解最佳超平面。 適用於特徵維度較高的數據,且對於異常值和噪聲具有一定的魯棒性。

數學上,Linear SVM的決策邊界可表示為:

w*x+b=0

其中,www 是權重向量,bbb 是偏差項,xxx 是輸入特徵向量。分類決策根據該式正負號判斷屬於哪一類。

若資料非線性可分,可借助核函數(kernel)將資料映射至高維空間,變成線性可分,再使用Linear SVM尋找超平面。

Linear SVM廣泛用於文本分類、圖像識別等領域,因其理論基礎堅實且效果穩定,且在許多情況下比其他線性模型(如邏輯回歸)有更好的泛化能力。

留言
avatar-img
留言分享你的想法!
avatar-img
郝信華 iPAS AI應用規劃師 學習筆記
18會員
480內容數
現職 : 富邦建設資訊副理 證照:經濟部 iPAS AI應用規劃師 AWS Certified AI Practitioner (AIF-C01)
2025/09/04
Frequency Encoding(頻率編碼)是將類別變數中的每個類別,依其在資料集中出現的頻率(次數比例)轉換成數值的一種方法。這種方法的核心做法是計算每個類別在樣本中出現的頻率,然後用該頻率值替代原本的類別標籤。 Frequency Encoding的特點包括: 將類別資料轉換為頻率數值,
2025/09/04
Frequency Encoding(頻率編碼)是將類別變數中的每個類別,依其在資料集中出現的頻率(次數比例)轉換成數值的一種方法。這種方法的核心做法是計算每個類別在樣本中出現的頻率,然後用該頻率值替代原本的類別標籤。 Frequency Encoding的特點包括: 將類別資料轉換為頻率數值,
2025/09/04
Binary Encoding是一種用於機器學習中分類變數編碼的技術,它先將每個類別標籤轉換為整數,然後將這些整數轉換成二進位(binary)數字,最後將二進位的每一位拆分成獨立的欄位。例如,有8個類別時,普通的One-Hot Encoding需要8欄位,而Binary Encoding只需3欄,因
2025/09/04
Binary Encoding是一種用於機器學習中分類變數編碼的技術,它先將每個類別標籤轉換為整數,然後將這些整數轉換成二進位(binary)數字,最後將二進位的每一位拆分成獨立的欄位。例如,有8個類別時,普通的One-Hot Encoding需要8欄位,而Binary Encoding只需3欄,因
2025/09/04
Label Encoding是機器學習中用來將非數值型的類別資料(categorical data)轉換成數值型資料的一種基本技術。它的原理是將每個類別標籤映射成一個獨特的整數值,使得機器學習算法能夠處理這些資料。例如,顏色"red"、"blue"、"green"可分別映射成0、1、2。 Labe
2025/09/04
Label Encoding是機器學習中用來將非數值型的類別資料(categorical data)轉換成數值型資料的一種基本技術。它的原理是將每個類別標籤映射成一個獨特的整數值,使得機器學習算法能夠處理這些資料。例如,顏色"red"、"blue"、"green"可分別映射成0、1、2。 Labe
看更多
你可能也想看
Thumbnail
常常被朋友問「哪裡買的?」嗎?透過蝦皮分潤計畫,把日常購物的分享多加一個步驟,就能轉換成現金回饋。門檻低、申請簡單,特別適合學生與上班族,讓零碎時間也能創造小確幸。
Thumbnail
常常被朋友問「哪裡買的?」嗎?透過蝦皮分潤計畫,把日常購物的分享多加一個步驟,就能轉換成現金回饋。門檻低、申請簡單,特別適合學生與上班族,讓零碎時間也能創造小確幸。
Thumbnail
特徵工程是機器學習中的核心技術,通過將原始數據轉換為有意義的特徵,以提升模型的準確性和穩定性。常見的特徵工程方法包括異常值檢測、特徵轉換、特徵縮放、特徵表示、特徵選擇和特徵提取。本文將深入探討這些方法的適用情況及具體實施流程,以幫助讀者有效利用特徵工程來優化機器學習模型表現。
Thumbnail
特徵工程是機器學習中的核心技術,通過將原始數據轉換為有意義的特徵,以提升模型的準確性和穩定性。常見的特徵工程方法包括異常值檢測、特徵轉換、特徵縮放、特徵表示、特徵選擇和特徵提取。本文將深入探討這些方法的適用情況及具體實施流程,以幫助讀者有效利用特徵工程來優化機器學習模型表現。
Thumbnail
在進行多層次線性模型(MLM)當中,有時候我們不只會加入層次1的預測變項。我們也會想加入層次2預測變項。本文將介紹加入層次2預測變項的各種模型,並解釋其公式和R語言操作方法。因為內容比較多,所以篇幅比較長。 多層次線性模型(MLM),截距是表示所有學校的平均值。斜率是指模型中自變量的係數,表
Thumbnail
在進行多層次線性模型(MLM)當中,有時候我們不只會加入層次1的預測變項。我們也會想加入層次2預測變項。本文將介紹加入層次2預測變項的各種模型,並解釋其公式和R語言操作方法。因為內容比較多,所以篇幅比較長。 多層次線性模型(MLM),截距是表示所有學校的平均值。斜率是指模型中自變量的係數,表
Thumbnail
數據分析與解讀 隨著數據的爆炸式增長,能夠分析、解讀和應用數據的能力變得至關重要。這包括熟悉數據分析工具和技術,如統計學、數據挖掘、機器學習等。然而,僅靠短時間的數據分析並不足以提供深入見解。 要熟悉數據分析工具和技術,如統計學、數據挖掘和機器學習,可以從以下幾個方面入手: 基礎知識的學習
Thumbnail
數據分析與解讀 隨著數據的爆炸式增長,能夠分析、解讀和應用數據的能力變得至關重要。這包括熟悉數據分析工具和技術,如統計學、數據挖掘、機器學習等。然而,僅靠短時間的數據分析並不足以提供深入見解。 要熟悉數據分析工具和技術,如統計學、數據挖掘和機器學習,可以從以下幾個方面入手: 基礎知識的學習
Thumbnail
本文將延續上一篇文章,經由訓練好的VAE模型其中的解碼器,來生成圖片。 [深度學習]訓練VAE模型用於生成圖片_訓練篇 輸入產生的隨機雜訊,輸入VAE的解碼器後,生成的圖片
Thumbnail
本文將延續上一篇文章,經由訓練好的VAE模型其中的解碼器,來生成圖片。 [深度學習]訓練VAE模型用於生成圖片_訓練篇 輸入產生的隨機雜訊,輸入VAE的解碼器後,生成的圖片
Thumbnail
本文主要介紹,如何利用VAE變分自編碼器來訓練生成圖片。 訓練集資料將採用TF影像資料庫中的fashion_mnist VAE變分自編碼器簡單介紹 •VAE(Variational Auto-Encoder)中文名稱變分自編碼器,主要是一種將原始資料編碼到潛在向量空間,再編碼回來的神經網路。
Thumbnail
本文主要介紹,如何利用VAE變分自編碼器來訓練生成圖片。 訓練集資料將採用TF影像資料庫中的fashion_mnist VAE變分自編碼器簡單介紹 •VAE(Variational Auto-Encoder)中文名稱變分自編碼器,主要是一種將原始資料編碼到潛在向量空間,再編碼回來的神經網路。
Thumbnail
GNN發展背景 傳統的深度學習模型如在計算機視覺(CV)和自然語言處理(NLP)領域中極為成功,主要是處理結構化數據如影像和文本。這些數據類型通常具有固定且規律的結構,例如影像是由有序的像素點組成。然而,在真實世界中,許多數據是非結構化的,如化合物結構(原子和分子)。這些數據雖然具有一定的規則性,
Thumbnail
GNN發展背景 傳統的深度學習模型如在計算機視覺(CV)和自然語言處理(NLP)領域中極為成功,主要是處理結構化數據如影像和文本。這些數據類型通常具有固定且規律的結構,例如影像是由有序的像素點組成。然而,在真實世界中,許多數據是非結構化的,如化合物結構(原子和分子)。這些數據雖然具有一定的規則性,
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News