Logistic Regression(邏輯迴歸)是一種監督式機器學習演算法,主要用於二元分類問題。它與線性迴歸不同,目的是預測事件發生的機率(概率值介於0到1之間),並根據概率將輸入資料分類到兩個類別之一。Logistic Regression利用sigmoid函數(邏輯斯函數)將線性組合的輸入特徵轉換為介於0和1之間的概率。
數學模型定義為:

其中,p 是事件發生的概率,w 為權重向量,x 是輸入特徵,b 是偏差項。模型輸出概率值後,通常以0.5做為閾值將結果分類為0或1。
Logistic Regression的主要特點包括:
- 專門解決分類問題,尤其是二分類問題。 假設自變量與log-odds(勝算比的對數)呈線性關係。 模型參數可用於解釋特徵與結果的關聯性。 算法簡單、計算效率高,且結果容易理解和解釋。 可擴展至多分類(多項式)和有序分類問題。
實際應用層面,Logistic Regression廣泛用於醫療診斷、金融信用評估、市場營銷、社會科學等領域,幫助預測是否發生某事件(例如,客戶是否流失、病人是否患病)。