
簡介

深度學習(Deep Learning)是一種模仿人類大腦運作方式的機器學習方法。它透過建立人工神經網路(Artificial Neural Network, ANN),以數學函式模擬生物神經元的活動。當神經網路包含多達數十、數百層隱藏層時,能夠學習更複雜的特徵與模式,因此稱為「深度」學習,如深度神經網路 (Deep neural networks, DNN)。
(本文內容,較少納入AI-900考題範圍,但能花點時間琢磨參透到底在"Deep"什麼,也是值得)人工神經網路由多層神經元(multiple layers of neurons)組成:
- 每個神經元可看成一個函數(function),接受輸入值(input value)(x) 和權重(weight ) (w),計算後產生輸出。
- 輸出會經過啟用函數(activation function) 中,用來決定是否讓這個輸出「被傳遞到下一層神經元」。(就像生物的神經細胞,收到一定量以上的刺激,才會往下傳遞訊號)
和之前介紹的模型訓練相同,深度學習的核心也是將訓練資料擬合到一個函數 f(x),用來根據一個或多個特徵值 x 來預測標籤 y。這個 f(x)是包含多層的函數(nested function)的最外層(outer layer),裡面每一層都包含輸入[x,w]的函數。迴歸、分類、自然語言處理、電腦視覺等,都可用DNN的架構來訓練。訓練資料通常是批次處理成矩陣,用線性代數處理,因此DNN最適合在有GPU電腦上運算。
模型訓練過程

以企鵝分類為例:
- 蒐集個別企鵝的特徵:喙長度、喙深度、鰭長度、體重,並將資料集分為訓練資料和驗證資料。
- x是四個特徵(feature)的向量,x=[x1,x2,x3,x4],
- y是企鵝的物種,分為3類(以0、1、2表示)。是模型要輸出的結果,稱為標籤(label)。
- 模型將分別輸出該企鵝是該物種的機率值向量 [P(y=0|x), P(y=1|x), P(y=2|x)]。
註:P(y=0|x) 指的是,以輸入這組x數值來判斷,企鵝(y)是0號物種的機率。
反覆迭代以下過程,稱為 Epochs


AI-900系列文章目錄:
《AI-900》證照考試準備心得與筆記分享 - 系列文章