Linear Support Vector Machine (Linear SVM) 是一種監督式機器學習演算法,用於二元分類問題,目標是找到一條或一個超平面(hyperplane)以線性方式將兩個類別的數據點分開。這個超平面會最大化兩個類別中最接近該超平面的資料點(稱為支持向量,support vectors)之間的「邊界距離」(margin),以達到最佳分離效果。
Linear SVM的核心特點包括:
- 使用線性決策邊界,適合資料在特徵空間中線性可分的情況。 最大化邊界距離,提高模型對新資料的泛化能力。 可採用硬邊界(perfectly separable)或軟邊界(允許部分誤分類)策略,以兼顧分類精度和容錯性。 通過優化目標函數(包含邊界最大化與懲罰錯誤分類的項),求解最佳超平面。 適用於特徵維度較高的數據,且對於異常值和噪聲具有一定的魯棒性。
w*x+b=0
其中,www 是權重向量,bbb 是偏差項,xxx 是輸入特徵向量。分類決策根據該式正負號判斷屬於哪一類。
若資料非線性可分,可借助核函數(kernel)將資料映射至高維空間,變成線性可分,再使用Linear SVM尋找超平面。
Linear SVM廣泛用於文本分類、圖像識別等領域,因其理論基礎堅實且效果穩定,且在許多情況下比其他線性模型(如邏輯回歸)有更好的泛化能力。