鑑別式 AI(Discriminative AI)的核心方法與應用機器學習:
1.邏輯迴歸(Logistic Regression)
- 概念:邏輯迴歸是一種線性分類模型,其核心是Sigmoid 函數,主要用於二元分類問題,對於非線性資料效果不佳,容易受異常值影響。
- 應用:
- 醫療診斷(如預測病人是否患病)
- 金融風險評估(如信用卡欺詐檢測)
- 垃圾郵件分類
2.支持向量機(SVM, Support Vector Machine)
- 概念:是一種監督式學習(Supervised Learning)算法,適用於二元分類和多分類問題。核心概念是尋找最佳的決策邊界(超平面),以最大化類別之間的間隔(Margin),適用於高維數據,即使特徵很多也能有效分類,同時也適用非線性分類,但計算成本高。
- 應用:
- 圖像分類(如手寫數字辨識)
- 基因數據分類(生物訊息)
3.K近鄰演算法(KNN, K-Nearest Neighbors)
- 概念:基於距離(通常使用歐幾里得距離)尋找K個最接近的鄰居來分類,當有新數據點時,它會找出K個最接近的數據點,並採取多數決進行分類,適用非線性分類。
- 應用:
4.決策樹(Decision Tree)
- 概念:透過條件判斷來建立樹狀結構的分類模型,類似於人類做決策的方式,進行分類或回歸,其核心是選擇最佳特徵來分割數據,但容易過擬合(overfitting)。
- 應用:
5.隨機森林(Random Forest)
概念:多棵決策樹組成的集成學習(Ensemble Learning)方法,透過隨機抽樣來生成多棵決策樹,提高分類的準確性並減少過擬合。
深度學習:
1.人工神經網路(ANN, Artificial Neural Network)
- 概念:人工神經網路(ANN)是模仿人腦神經元設計的模型,由輸入層(Input Layer)、隱藏層(Hidden Layer)、輸出層(Output Layer) 組成,每層之間透過權重(Weights)與啟動函數(Activation Function) 進行計算,適用於一般分類與回歸問題,但對時序數據效果不佳(無記憶能力)。
- 應用:
2.卷積神經網路(CNN, Convolutional Neural Network)
- 概念:CNN 是針對圖像與空間數據設計的神經網路,卷積層(Convolutional Layer) 透過濾波器(Filters, Kernels) 來提取特徵,池化層(Pooling Layer)透過最大池化(Max Pooling) 或平均池化(Average Pooling) 降低計算量,全連接層(Fully Connected Layer, FC)將 CNN 提取的特徵輸入 ANN 進行分類,相比 ANN 更適合處理圖像數據。
- 應用:
3.循環神經網路(RNN, Recurrent Neural Network)
- 概念:RNN 專門設計用來處理序列數據(Sequential Data),如語音、文字、時間序列,核心特點是使用隱藏狀態(Hidden State)的設計,能夠記住過去的訊息並影響當前輸出。
- 應用:
- 語音識別(如 Siri、Google Assistant)
- 股市預測(如時間序列分析)
- 缺點:
- 長序列時梯度消失(Vanishing Gradient):RNN 在長序列中會因為梯度更新變小,導致模型難以記住很久之前的訊息。
- 學習長期依賴關係困難
- 改進模型:
- 長短期記憶網路(LSTM, Long Short-Term Memory),增加「遺忘門(Forget Gate)」來解決梯度消失問題。
- 門控循環單元(GRU, Gated Recurrent Unit),比 LSTM 計算更快,但仍保留記憶能力。
4.Transformer
- 概念:Transformer 是目前 NLP 領域最強大的模型,與 RNN 不同,它不依賴序列計算,而是透過自注意力機制(Self-Attention) 計算每個詞與其他詞的關聯性、多頭注意力(Multi-Head Attention)學習不同特徵,來捕捉長距離依賴關係。
- 應用:
以上資料均來自網路公開資料參考及個人想法綜合整理,因科技發展迅速,資訊不一定絕對正確,請讀者以自己的想法為主,也歡迎留言討論喔!
我是TN科技筆記,如果喜歡這篇文章,歡迎留言、點選愛心、轉發給我支持鼓勵~
也歡迎每個月請我喝杯咖啡,鼓勵我撰寫更多科技文章,一起跟著科技浪潮前進!!
>>>請我喝一杯咖啡