所謂的機器學習是如何做到自我學習?
機器學習裡有一種最基本的演算法叫做回歸(Regression)。我們可以使用回歸分析法找出變數之間的關聯,進而推測未知的資料。
假如我們有一群台灣黑熊身高體重的資料,並且假設台灣黑熊身高是X,體重是Y。當出現新的台灣黑熊,而我們只知道它的身高時,我們要如何推測它的體重?
我們可以先把已知的數據化成座標平面圖,並定義一個Y=f(X)的公式。將X代入求得Y值,此時多個點會形成一種規則。而我們藉由觀察將公式定義為Y=a*X+c,也就是一個線性公式。定義完公式之後。我們一開始需要先猜測a的值與c的值。使這條線能夠與各個點的距離最短。一開始大概率不是最短距離,所以機器就需要一直重複計算到達最佳的線性公式。
得到最佳的公式,我們就可以推測這隻台灣黑熊的體重了。
在實際人工智慧的案例中,當然會有更複雜的圖形,都需要先由專家定義演算法再交由機器來運算。
總結來說,我們首先需要有一群資料,然後藉由人為來定義公式或演算法的框架,經過機器代入參數不斷地計算,得到最佳的答案,這就是機器學習的過程。