機器學習的梯度下降迴歸法— SGDRegressor( )

閱讀時間約 6 分鐘

在機器學習中,我們的目標是找到一種能夠最好地描述數據的模型。例如,在迴歸問題中,我們希望找到一種函數,該函數能以一種對我們的目標變數(例如:銷售量、股票價格等) 的最佳估計的方式,描述輸入特徵(例如:廣告支出、市場狀況等)。

為了找到這樣的函數,我們需要定義一種衡量模型好壞的方式,這就是所謂的損失函數(或稱成本函數),或是讀者可以想成這是誤差函數,目標就是找出誤差最小的函數時的參數。對於迴歸問題,一種常見的損失函數是平方誤差損失,它計算的是模型預測和真實值之間的平方差的平均值。我們的目標是找到一組模型參數,使得損失函數的值最小。

梯度下降是一種用來找到這樣一組參數的優化算法。它從一個隨機選擇的起始點開始,然後反覆地計算損失函數在當前點的梯度(即方向和速度),並沿著梯度的反方向(就是說,沿著使損失函數值下降最快的方向) 更新模型的參數。這個過程一直持續到損失函數的值不再顯著下降(或者達到預定的迭代次數) 為止。

raw-image

若是以上述誤差函數圖而言,斜率最低點就是在底部位置。讀者可以想像你現在站在一座大山的頂部,你的目標是找到一條路徑,讓你可以順利下山到達最低點,但是你被蒙上了眼睛,所以只能憑藉著腳下感覺去尋找路徑。

現在你開始嘗試一步一步地移動,你會嘗試各種方向的步伐,找到一種方式讓你感覺到下一步會讓你下降的最多,這就是你選擇前進的方向。你會重複這個過程,一直到你感覺不再下降,也就是你可能已經到達山谷的最底部。

這就是梯度下降法的基本概念。在這個比喻中,山頂是你一開始的猜測或者初始值,山谷的最底部就像是你想要找的答案,也就是使得誤差最小的那組參數值。你一步步往下走,就像是一次又一次的調整參數,試圖找到最佳解。而你嘗試找到讓你下降最多的方向,這就像是計算誤差函數的梯度,並依此更新你的參數。

機器學習模型的訓練過程其實就像這樣的一種嘗試過程,我們希望找到最佳的模型參數,讓預測的誤差最小。

SGDRegressor 就是一種利用梯度下降進行訓練的機器學習模型。SGD 英文全名是Stochastic Gradient Descent,意思是「隨機梯度下降」。它的「隨機」一詞源於每一步中用於計算梯度的樣本是隨機選取的,而不是用整個數據集。這種做法有兩個主要優點:一是計算效率高,因為每一步只需要一個(或一小批) 樣本;二是能夠避免陷入局部最小值,因為隨機性引入了一些噪聲,有助於算法跳出局部最優並找到全局最優。所以,簡單地說,SGDRegressor 是一種使用梯度下降算法進行訓練的線性模型。其語法和主要參數如下:

from sklearn.linear_model import SGDRegressor

model = SGDRegressor(loss, penalty=, alpha, max_iter)

上述可以建立一個SGDRegressor 的實例物件,各參數意義如下:

  • loss:這定義了所使用的損失函數,預設情況下,這是「平方損失 ('squared_loss')」,這對應於普通最小平方迴歸。
  • penalty:這定義了所使用的懲罰項,預設情況是 "L2",這對應於線性模型的權重的平方和。其他可能的選項包括 "L1"(對應於權重的絕對值之和) 和"elasticnet"( 這是L1 和L2 的組合)。所謂的「懲罰」,我們可以把機器學習模型想像成一個小學生正在學習拼字。每當他學到一個新的單詞,他就會試著記住它。如果他只記住了幾個單詞,那他可能會很容易把它們拼對。但是如果他試圖記住太多的單詞,那麼他可能會開始混淆,並且拼錯一些單詞。在這裡,我們可以把「試圖記住太多的單詞」看作是模型「過擬合」訓練數據。也就是說,模型可能過於複雜,試圖擬合訓練數據中的每一個細節,甚至包括噪聲,而失去了對新數據的預測能力。這時候,我們就需要一種「懲罰」來限制模型的複雜度,讓它不要試圖記住太多的單詞。這就是所謂的 penalty。我們可以通過增加模型錯誤的「成本」或「懲罰」來阻止它記住太多的單詞。這樣,模型會更加專注於學習最重要的特徵,而不是訓練數據中的每一個細節。這就是我們在機器學習模型中使用懲罰或正則化的原因。
  • alpha:這是懲罰項的強度,預設是 0.0001。
  • learning_rate:這定義了學習率的調整策略。預設情況下,它被設置為「invscaling」,這表示使用的是逆比例縮放學習率,也就是說,每一步的學習率會隨著迭代次數的增加而減小。這種學習率的調整策略有一個特點,就是在演算法開始時,給予較大的學習率以快速接近最優解,然後隨著迭代次數增加,逐漸減小學習率,以防止在最優解附近震盪,更精確地找到最優解,這學習率將由預設的學習速率時間表來確定。其他選項包括 'constant'、'optimal'和 'adaptive'。如果學習率太高可能造成梯度無法進入局部最低點,也就是無法找出錯誤最小的參數。如果學習率太低,會造成需要比較多次的迭代,才可以進入局部最低點,也就是找出錯誤最小的參數。
  • max_iter:這是要執行的最大迭代次數,預設是 1000。
  • random_state:隨機種子值。


透過SGDRegressor( ) 我們可以讓機器學習運用梯度下降的方式來達到目標或預測結果,也能透過不同的參數設定來調整修正,降低誤差值。更多有關機器學習的方法與運用,歡迎參閱《機器學習最強入門 - 基礎數學/機率/統計邁向AI真實數據專題實作 - 王者歸來》獲取最完整的內容!

 

上文圖片及書摘由深智數位提供,內容取材自《機器學習最強入門 - 基礎數學/機率/統計邁向AI真實數據專題實作 - 王者歸來》。

天瓏:https://reurl.cc/aVj4oX

深智數位出版:《機器學習最強入門 - 基礎數學/機率/統計邁向AI真實數據專題實作 - 王者歸來》

深智數位出版:《機器學習最強入門 - 基礎數學/機率/統計邁向AI真實數據專題實作 - 王者歸來》


9會員
25Content count
留言0
查看全部
發表第一個留言支持創作者!
深智數位的沙龍 的其他內容
  在程式設計中,變數(Variable)是一個代表內存位置的符號,用於存儲和操作數據。它是一個內存單元,可以存儲各種類型的數據,例如整數、浮點數、字符串等。變數的值可以在程式執行時改變,並在需要時被讀取。 變數是暫時存放資料用的,可以將變數想像成是一個箱子,箱子裡面可以是空的,
新手在使用ChatGPT 時,對於ChatGPT的回答普遍印象是廢話連篇,而這通常是因為沒有給出足夠清晰的指示所導致,以下將介紹3個讓你跟ChatGPT溝通更有效的提示技巧,幫助讀者快速掌握提升回答品質的秘訣!
ChatGPT 橫空出世,開啟新的工作模式,電腦領域人氣作家洪錦魁最新力作《ChatGPT領軍 DALL-E 2 + Midjourney + D-ID + Synthesia:邁向AI文字、圖像、影片之路》,為國內第一本講解AI文字、圖像、影片的專書,展示多種AI生成技術的應用指南。
數學為我們提供了豐富多彩的素材用以學習程式設計:從讀者已掌握的知識(例如繪製一個抛物線,計算一個函數的導數)到未知的領域(如求一個複雜函數的極值),這期間有驗證的快樂,也有探索的艱辛,在不斷重複這些活動的過程中學會熟練運用這一工具,工具的熟練使用反過來也會幫助我們對特定問題進行更為深入的探討與研究。
常常聽到影像處理、Python、OpenCV等技術,最近又在流行機器學習、深度學習、CNN、人工神經網路,常常不知從何開始學習,如果有一本書能把這些知識從頭到尾講清楚有多好,再加上如果有最常用的案例實作,一定可以完整將這個現在最賺錢行業的領域變成一技之長。
2023年來看處理器的發展,x86_64系統結構與ARM64系統結構是目前市場上的主流處理器系統結構,ARM是一個整合作業系統、組合語言、C語言、電子電路技術的宏大領域。熟悉ARM架構一定是硬體工程師想要進軍CPU領域的唯一目標(當然還有一個是RISC-V)。
  在程式設計中,變數(Variable)是一個代表內存位置的符號,用於存儲和操作數據。它是一個內存單元,可以存儲各種類型的數據,例如整數、浮點數、字符串等。變數的值可以在程式執行時改變,並在需要時被讀取。 變數是暫時存放資料用的,可以將變數想像成是一個箱子,箱子裡面可以是空的,
新手在使用ChatGPT 時,對於ChatGPT的回答普遍印象是廢話連篇,而這通常是因為沒有給出足夠清晰的指示所導致,以下將介紹3個讓你跟ChatGPT溝通更有效的提示技巧,幫助讀者快速掌握提升回答品質的秘訣!
ChatGPT 橫空出世,開啟新的工作模式,電腦領域人氣作家洪錦魁最新力作《ChatGPT領軍 DALL-E 2 + Midjourney + D-ID + Synthesia:邁向AI文字、圖像、影片之路》,為國內第一本講解AI文字、圖像、影片的專書,展示多種AI生成技術的應用指南。
數學為我們提供了豐富多彩的素材用以學習程式設計:從讀者已掌握的知識(例如繪製一個抛物線,計算一個函數的導數)到未知的領域(如求一個複雜函數的極值),這期間有驗證的快樂,也有探索的艱辛,在不斷重複這些活動的過程中學會熟練運用這一工具,工具的熟練使用反過來也會幫助我們對特定問題進行更為深入的探討與研究。
常常聽到影像處理、Python、OpenCV等技術,最近又在流行機器學習、深度學習、CNN、人工神經網路,常常不知從何開始學習,如果有一本書能把這些知識從頭到尾講清楚有多好,再加上如果有最常用的案例實作,一定可以完整將這個現在最賺錢行業的領域變成一技之長。
2023年來看處理器的發展,x86_64系統結構與ARM64系統結構是目前市場上的主流處理器系統結構,ARM是一個整合作業系統、組合語言、C語言、電子電路技術的宏大領域。熟悉ARM架構一定是硬體工程師想要進軍CPU領域的唯一目標(當然還有一個是RISC-V)。
你可能也想看
Thumbnail
1.加權指數與櫃買指數 週五的加權指數在非農就業數據開出來後,雖稍微低於預期,但指數仍向上噴出,在美股開盤後於21500形成一個爆量假突破後急轉直下,就一路收至最低。 台股方面走勢需觀察週一在斷頭潮出現後,週二或週三開始有無買單進場支撐,在沒有明確的反轉訊號形成前,小夥伴盡量不要貿然抄底,或是追空
Thumbnail
重點摘要: 1.9 月降息 2 碼、進一步暗示年內還有 50 bp 降息 2.SEP 上修失業率預期,但快速的降息速率將有助失業率觸頂 3.未來幾個月經濟數據將繼續轉弱,經濟復甦的時點或是 1Q25 季底附近
Thumbnail
近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎? 新版式整體視覺上「更加凸顯圖片」,為了搭配這次的更新,我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務,還有機會獲得富士即可拍,讓你的美好回憶都可以用即可拍珍藏!
Thumbnail
前言 我在工作中沒有什麼機會接觸到機器學習,學生時期也沒有學習過相關知識。 作為一個業餘小白,我對機器學習非常感興趣。在自學的過程中,我逐漸意識到利用機器學習可以做很多有趣的事情。 因此,我決定嘗試使用 AWS SageMaker JumpStart 來實驗文字生成式繪圖 AI ,以了解機
Thumbnail
在資料科學中常可以聽到「權重」,可藉由專家經驗和機器學習取得「權重」,但他們差別是什麼?在透過演算法決定權重的想法相對盛行的現今,又如何整合兩種途徑的結果?
Thumbnail
我在去年10月底加入占星師Patrick《職業占星大師班》的課程, 比起很多第一時間就看完課程並開始接諮詢的同學, 我的進度很拖延,而且我明明只有兼職工作, 比有正職的同學多很多時間, 卻如此拖延,這讓我中間一度陷入自我厭惡的低潮; 直到今年3月初受到派派的鼓勵, 我才能夠克服心魔、認真重啟課程,
Thumbnail
由於做的研究大概和「視覺研究」沾得上一點邊,雖然是computer vision,但日本視覺學會現在也把電腦視覺納入視覺研究的範疇之一了。於是經過教授的推薦,就去報名了日本視覺學會的2023年冬季大會,也順利得到了口頭發表的機會。這次的學會辦在東京的工學院大學,位於日本新宿,這次學到了很多機器學習相
Thumbnail
本文章介紹給你,在機器學習 (Machine Learning)應用中,隱私之所以重要的三大原因:法律合規,倫理考量,商業利益。
Thumbnail
兼回答觀眾來信問題 經過上一次的文章之後,棒棒的觀眾們依然有問題丟過來 有些觀眾的問題都滿認真的,也不好像其他節目一樣 在節目上講講就沒了,所以依然用文章的方式帶給大家一點東西。 我們先來看看觀眾疑問: 1. 是不是機器人預測的結果,都是依照revenue? 特徵是什麼? 特徵提取又是什麼?
Thumbnail
大數據和機器學習正掀起一波“數位革命”,巨量的資料正掀起人類生活、工作和思考方式的全面革新。 以股票市場來說, 許多國家允許投資者自行探索自由市場的相關數據。例如,數百萬種金融商品的即時價格、電子商務在某個時間的交易的客戶數量或者用衛星探測某個國家農業的總產量等等。
Thumbnail
我們明天要去戶外教學耶!要準備水壺、帽子、穿運動服……  為了迎接戶外教學,孩子一回家就馬上跟爸爸、媽媽分享,積極地準備相關用品,開心地等待明天的到來。 在幼兒園,戶外教學的活動深受孩子的喜愛,對充滿好奇、喜歡新鮮事物的孩子來說,戶外教學時與同儕互動,一起發現、一起看見,都是相當珍貴的學習歷程。
Thumbnail
稱為NeurIPS(神經資訊處理系統會議)的全球人工智慧領域盛會剛剛結束,出席者人數創下歷史新高,即使採取抽票制也難以容納。9,000張門票在12分鐘內售完,顯示了世界各地對AI興趣的爆炸式增長。
Thumbnail
1.加權指數與櫃買指數 週五的加權指數在非農就業數據開出來後,雖稍微低於預期,但指數仍向上噴出,在美股開盤後於21500形成一個爆量假突破後急轉直下,就一路收至最低。 台股方面走勢需觀察週一在斷頭潮出現後,週二或週三開始有無買單進場支撐,在沒有明確的反轉訊號形成前,小夥伴盡量不要貿然抄底,或是追空
Thumbnail
重點摘要: 1.9 月降息 2 碼、進一步暗示年內還有 50 bp 降息 2.SEP 上修失業率預期,但快速的降息速率將有助失業率觸頂 3.未來幾個月經濟數據將繼續轉弱,經濟復甦的時點或是 1Q25 季底附近
Thumbnail
近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎? 新版式整體視覺上「更加凸顯圖片」,為了搭配這次的更新,我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務,還有機會獲得富士即可拍,讓你的美好回憶都可以用即可拍珍藏!
Thumbnail
前言 我在工作中沒有什麼機會接觸到機器學習,學生時期也沒有學習過相關知識。 作為一個業餘小白,我對機器學習非常感興趣。在自學的過程中,我逐漸意識到利用機器學習可以做很多有趣的事情。 因此,我決定嘗試使用 AWS SageMaker JumpStart 來實驗文字生成式繪圖 AI ,以了解機
Thumbnail
在資料科學中常可以聽到「權重」,可藉由專家經驗和機器學習取得「權重」,但他們差別是什麼?在透過演算法決定權重的想法相對盛行的現今,又如何整合兩種途徑的結果?
Thumbnail
我在去年10月底加入占星師Patrick《職業占星大師班》的課程, 比起很多第一時間就看完課程並開始接諮詢的同學, 我的進度很拖延,而且我明明只有兼職工作, 比有正職的同學多很多時間, 卻如此拖延,這讓我中間一度陷入自我厭惡的低潮; 直到今年3月初受到派派的鼓勵, 我才能夠克服心魔、認真重啟課程,
Thumbnail
由於做的研究大概和「視覺研究」沾得上一點邊,雖然是computer vision,但日本視覺學會現在也把電腦視覺納入視覺研究的範疇之一了。於是經過教授的推薦,就去報名了日本視覺學會的2023年冬季大會,也順利得到了口頭發表的機會。這次的學會辦在東京的工學院大學,位於日本新宿,這次學到了很多機器學習相
Thumbnail
本文章介紹給你,在機器學習 (Machine Learning)應用中,隱私之所以重要的三大原因:法律合規,倫理考量,商業利益。
Thumbnail
兼回答觀眾來信問題 經過上一次的文章之後,棒棒的觀眾們依然有問題丟過來 有些觀眾的問題都滿認真的,也不好像其他節目一樣 在節目上講講就沒了,所以依然用文章的方式帶給大家一點東西。 我們先來看看觀眾疑問: 1. 是不是機器人預測的結果,都是依照revenue? 特徵是什麼? 特徵提取又是什麼?
Thumbnail
大數據和機器學習正掀起一波“數位革命”,巨量的資料正掀起人類生活、工作和思考方式的全面革新。 以股票市場來說, 許多國家允許投資者自行探索自由市場的相關數據。例如,數百萬種金融商品的即時價格、電子商務在某個時間的交易的客戶數量或者用衛星探測某個國家農業的總產量等等。
Thumbnail
我們明天要去戶外教學耶!要準備水壺、帽子、穿運動服……  為了迎接戶外教學,孩子一回家就馬上跟爸爸、媽媽分享,積極地準備相關用品,開心地等待明天的到來。 在幼兒園,戶外教學的活動深受孩子的喜愛,對充滿好奇、喜歡新鮮事物的孩子來說,戶外教學時與同儕互動,一起發現、一起看見,都是相當珍貴的學習歷程。
Thumbnail
稱為NeurIPS(神經資訊處理系統會議)的全球人工智慧領域盛會剛剛結束,出席者人數創下歷史新高,即使採取抽票制也難以容納。9,000張門票在12分鐘內售完,顯示了世界各地對AI興趣的爆炸式增長。