AI 深度學習之父 - Geoffrey Hinton 辛頓

更新於 2024/05/21閱讀時間約 3 分鐘


1986 年,人工智慧的崛起,神經網路的出現

1986年,Geoffrey Hinton等學者提出了反向傳播演算法(Backpropagation) ℹ️,為人工神經網路研究拓展了新的道路,掀起了一股研究熱潮。 然而,這項創新在當時遇到了一些瓶頸。 首先,受限於硬體的運算能力,訓練深層神經網路的效率較低。 另外,神經網路在架構上也存在一個棘手的問題-梯度消失問題。 這指的是,在反向傳播過程中,梯度會隨著網絡層數的增加而逐層減小,導致深層網絡的參數無法被很好地調整和優化。 因此,當時只能處理較淺層的神經網路結構,從而限制了模型的性能表現。 由於上述原因,人工神經網路的發展一度陷入了停滯期。

ℹ️ 反向傳播(Backpropagation):對多層類神經網路進行梯度下降的演算法,也就是用鏈式法則以網路每層的權重為變數計算損失函式的梯度,以更新權重來最小化損失函式。



2006年,深度學習起飛的一年

2006年,Hinton找到了突破反向傳播演算法優化困境的方法,Hinton 是如何成功訓練深層神經網路的呢?

他提出了"限制玻爾茲曼機"和"深度信念網絡"兩個關鍵概念,他指出,具有多個隱藏層的深層神經網路能夠學習到更高級、抽象的特徵表示,模型因而有更出色的表現。但訓練過程中也面臨難以直接優化的挑戰,他提出的解決方案是透過層層逐步預先訓練的方式,初始化深層網路的參數,從而有效減輕了訓練的複雜度。

由於深層神經網路的研究在此前長期處於停滯狀態,Hinton賦予了「深度學習」這個名稱,重新點燃了人們對這一領域的熱情,正因為這項開創性的貢獻,Hinton 被尊稱為「深度學習之父」,這一年被認為是深度學習元年。



2018年,Hinton 對於深度學習的貢獻獲得認可,榮獲圖靈獎

在深度學習爆發後,Hinton 也持續在這個領域研究,例如 2017 年提出膠囊網路(CapsNet)模型,試圖讓神經網路能夠更好地理解空間等高維度資料。2018 年,他憑藉在深度學習領域的開創性工作,獲得了享有「計算機界諾貝爾獎」美譽的最高榮譽—圖靈獎。 與他並肩分享這一殊榮的,還有兩位同為人工智慧領域的領導人物、多年好友:Yoshua Bengio和Yann LeCun。 三人因在深度神經網路的理論概念和工程實現方面的突破性貢獻,一併獲得了這個計算機科學界最崇高的獎項。


近年,Hinton 談論 AI 帶來的危險


2023年,Hinton 從工作十年的 Google 離職,並且提到,自己離開 Google 的原因是為了更自由地談論 AI 帶來的風險。深度學習之父的 Hinton 不斷地呼籲大眾關注 AI 帶來的危險,他甚至在訪談中提到,人們不應該擔心氣候變遷,雖然氣候是個嚴重的問題。但在這個問題上,我們可以很明確地知道如何解決,減少碳的使用等作法將改善氣候問題,反觀 AI,我們根本還不清楚未來會帶來什麼問題


avatar-img
5會員
17內容數
AI x Data Science 探討 AI 大小事
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Everything ✨ 的其他內容
黃仁勳在史丹佛 View From The Top 的演講,他談到了許多關於 NVIDIA 的故事,創立的初衷、遇到的挑戰、公司轉型的契機等等,也分享了面對困難與未知的挑戰,自己是如何堅持做對的事情,帶領公司持續前進。
Devin 是世界上首位虛擬 AI 工程師,擁有寫程式、架設網站、除錯、自動化測試等技術。憑藉出色的學習能力,Devin 能夠自動檢查並修正程式碼錯誤,還能自行訓練和微調自身 AI 模型。本文探討了 AI 工程師的能力以及對軟體工程師就業市場的潛在影響。
Elon Musk 是一位傳奇企業家,創辦了多家知名公司,如 PayPal、SpaceX、Tesla、The Boring Company、Neuralink 等等。本文介紹馬斯克的創業經歷,包括創辦公司的過程和一些成功與爭議,並探討他所推崇的「第一性原理」思考方式及未來可能的新創業故事。
世界西洋棋冠軍 Garry Kasparov分享了他在 1997 年與 IBM Deep Blue 比賽下棋卻輸給機器的故事。然而,他呼籲人們不要害怕被人工智能超越,而是要與機器合作,因為科技的進步將帶來更多力量。影片中提到了與人工智能共存的可能性,以及機器與人類各自的優勢。值得一看的影片!
OpenAI的推出了許多產品,包括Gym強化學習工具包、Dactyl AI機械手臂、Five遊戲模型、DALL·E文字生成圖片以及Sora文字生成影片。這些產品不僅展示了AI的發展與進步,也在不同領域有著廣泛的應用和影響。
Anthropic推出了新的Claude 3系列模型,號稱打敗OpenAI GPT-4與Google Gemini,成為地表最強的AI模型。文章介紹了Anthropic公司的核心理念、Claude 3模型家族與GPT-4 Gemini的比較。Claude 3模型在文字與圖像的理解能力都有大幅提升。
黃仁勳在史丹佛 View From The Top 的演講,他談到了許多關於 NVIDIA 的故事,創立的初衷、遇到的挑戰、公司轉型的契機等等,也分享了面對困難與未知的挑戰,自己是如何堅持做對的事情,帶領公司持續前進。
Devin 是世界上首位虛擬 AI 工程師,擁有寫程式、架設網站、除錯、自動化測試等技術。憑藉出色的學習能力,Devin 能夠自動檢查並修正程式碼錯誤,還能自行訓練和微調自身 AI 模型。本文探討了 AI 工程師的能力以及對軟體工程師就業市場的潛在影響。
Elon Musk 是一位傳奇企業家,創辦了多家知名公司,如 PayPal、SpaceX、Tesla、The Boring Company、Neuralink 等等。本文介紹馬斯克的創業經歷,包括創辦公司的過程和一些成功與爭議,並探討他所推崇的「第一性原理」思考方式及未來可能的新創業故事。
世界西洋棋冠軍 Garry Kasparov分享了他在 1997 年與 IBM Deep Blue 比賽下棋卻輸給機器的故事。然而,他呼籲人們不要害怕被人工智能超越,而是要與機器合作,因為科技的進步將帶來更多力量。影片中提到了與人工智能共存的可能性,以及機器與人類各自的優勢。值得一看的影片!
OpenAI的推出了許多產品,包括Gym強化學習工具包、Dactyl AI機械手臂、Five遊戲模型、DALL·E文字生成圖片以及Sora文字生成影片。這些產品不僅展示了AI的發展與進步,也在不同領域有著廣泛的應用和影響。
Anthropic推出了新的Claude 3系列模型,號稱打敗OpenAI GPT-4與Google Gemini,成為地表最強的AI模型。文章介紹了Anthropic公司的核心理念、Claude 3模型家族與GPT-4 Gemini的比較。Claude 3模型在文字與圖像的理解能力都有大幅提升。
你可能也想看
Google News 追蹤
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
在晶狀智慧的時代,人類與AI共舞,共同建構更先進、更智能的未來。這是一場革命,一場改變人類命運的奇蹟,讓我們共同見證這個智慧的新紀元。
Thumbnail
一直以來,我們在浩瀚的宇宙中尋找地外生命的任務都遇到一個重大的挑戰,那就是我們無法有效處理天文望遠鏡每15秒就產生的2GB數據。但現在,隨著AI的興起,我們能夠更有效地分析這些龐大的資料。
Thumbnail
AI在銀行業中的歧視問題是如何產生的?這種情況是否普遍存在? AI的歧視問題源於其學習和決策的基礎——數據。AI系統的訓練數據如果存在偏見,那麼AI的決策也將帶有偏見。
Thumbnail
上篇文章我們解說到了神經網路的基本架構包含了輸入層,輸出層,還有中間的隱藏層,也說明了這是一個把輸入資料拆解出特徵然後依照特徵做判斷的過程。究竟每一層的神經網路,如何影響下一層的神經網路可以辨識出特徵呢? 這些中間的線條(連結)到底是什麼意義呢? 這就是這一篇要告訴你的。
Thumbnail
在我的上一篇文章中,我們提到了人工智慧 & 機器學習 & 深度學習跟神經網路的關係,我們也了解到了所謂的深度學習是一種基於神經網路上的機器學習方法。那麼神經網路到底是什麼呢? 我們上一篇文章裡面提到的神經網路的層Layer究竟是什麼呢? 到底為什麼神經網路需要這麼多的神經元(Neurons)跟層數呢
Thumbnail
我們這個系列就是希望以非常科普的角度來解釋人工智慧。本篇要釐清人工智慧(AI: Artificial Intelligence),機器學習 Machine Learning, 深度學習Deep Learning,另外還有類神經網路,到底互相是什麼關係呢?
Thumbnail
作者:陳華夫 《易經》、量子力學、AI深度學習都是在學習一套形式系統─即某種形式語言加上其推理規則或轉換規則的集合。數學就是一種形式語言,學習理工科的關鍵在學習數學。學習數學的關鍵在加強記憶力,其關鍵又在利用八種關係:同一、空間、時間、數量、性質、對立、因果、價值等,建立記憶索引的編碼過程。
Thumbnail
——日本「深度學習商業運用大獎」首屆得獎專案全收錄!——  ◆最具影響力的日本財經媒體之一《日本經濟新聞社》集團日經BP旗下日經xTREND與日經xTECH主辦  ◆Kewpie、NTT DOCOMO、日本菸草產業、軟體銀行、SMBC日興證券、三菱總合研究所、日本交易所……26家頂尖企業最成功的A
Thumbnail
這篇是意外翻到的,本來只貼在Medium,就再貼過來給大家分享。基本上這算是《精準學習》的讀後心得,不過今天再重看一次,還是覺得蠻有感的。
Thumbnail
現代流圍棋五原則能擊敗(干擾)「ZenGo 九段」與「Katrain 9段」電腦圍棋,其意義類似當今時髦的愚弄人工智慧的「干擾遊戲」。也同時證明了,人類的圍棋智慧卻是「由上而下」(Top-Down)的「知識策略」,最終可能戰勝有史以來最強的AI人工智慧電腦圍棋─ AlphaGo Zero。
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
在晶狀智慧的時代,人類與AI共舞,共同建構更先進、更智能的未來。這是一場革命,一場改變人類命運的奇蹟,讓我們共同見證這個智慧的新紀元。
Thumbnail
一直以來,我們在浩瀚的宇宙中尋找地外生命的任務都遇到一個重大的挑戰,那就是我們無法有效處理天文望遠鏡每15秒就產生的2GB數據。但現在,隨著AI的興起,我們能夠更有效地分析這些龐大的資料。
Thumbnail
AI在銀行業中的歧視問題是如何產生的?這種情況是否普遍存在? AI的歧視問題源於其學習和決策的基礎——數據。AI系統的訓練數據如果存在偏見,那麼AI的決策也將帶有偏見。
Thumbnail
上篇文章我們解說到了神經網路的基本架構包含了輸入層,輸出層,還有中間的隱藏層,也說明了這是一個把輸入資料拆解出特徵然後依照特徵做判斷的過程。究竟每一層的神經網路,如何影響下一層的神經網路可以辨識出特徵呢? 這些中間的線條(連結)到底是什麼意義呢? 這就是這一篇要告訴你的。
Thumbnail
在我的上一篇文章中,我們提到了人工智慧 & 機器學習 & 深度學習跟神經網路的關係,我們也了解到了所謂的深度學習是一種基於神經網路上的機器學習方法。那麼神經網路到底是什麼呢? 我們上一篇文章裡面提到的神經網路的層Layer究竟是什麼呢? 到底為什麼神經網路需要這麼多的神經元(Neurons)跟層數呢
Thumbnail
我們這個系列就是希望以非常科普的角度來解釋人工智慧。本篇要釐清人工智慧(AI: Artificial Intelligence),機器學習 Machine Learning, 深度學習Deep Learning,另外還有類神經網路,到底互相是什麼關係呢?
Thumbnail
作者:陳華夫 《易經》、量子力學、AI深度學習都是在學習一套形式系統─即某種形式語言加上其推理規則或轉換規則的集合。數學就是一種形式語言,學習理工科的關鍵在學習數學。學習數學的關鍵在加強記憶力,其關鍵又在利用八種關係:同一、空間、時間、數量、性質、對立、因果、價值等,建立記憶索引的編碼過程。
Thumbnail
——日本「深度學習商業運用大獎」首屆得獎專案全收錄!——  ◆最具影響力的日本財經媒體之一《日本經濟新聞社》集團日經BP旗下日經xTREND與日經xTECH主辦  ◆Kewpie、NTT DOCOMO、日本菸草產業、軟體銀行、SMBC日興證券、三菱總合研究所、日本交易所……26家頂尖企業最成功的A
Thumbnail
這篇是意外翻到的,本來只貼在Medium,就再貼過來給大家分享。基本上這算是《精準學習》的讀後心得,不過今天再重看一次,還是覺得蠻有感的。
Thumbnail
現代流圍棋五原則能擊敗(干擾)「ZenGo 九段」與「Katrain 9段」電腦圍棋,其意義類似當今時髦的愚弄人工智慧的「干擾遊戲」。也同時證明了,人類的圍棋智慧卻是「由上而下」(Top-Down)的「知識策略」,最終可能戰勝有史以來最強的AI人工智慧電腦圍棋─ AlphaGo Zero。