【深智書摘】卷積神經網路(CNN)的發展與結構

更新於 2022/11/10閱讀時間約 6 分鐘
  卷積神經網路(Convolutional Neural Networks,CNN),其應用包括影像辨識、自然語言處理(NLP)等領域。若能從其發展至今的脈絡開始了解,必定可以更進一步地理解專案的想法,將該技術掌握得更得心應手。以下就其發展和結構分別說明。
  LeNet是最早的分類卷積網路,在1998年由Yann Lecun提出。當時,LeNet被設計用於手寫數字辨識,但是因為其理論解釋性較差,並且效果不如處理人工特徵的SVM,所以一直沒有得到重視。
  一直到2012年,AlexNet在ILSVRC(也就是ImageNet比賽)中一舉奪魁,才觸發了人們對於深度學習的熱情,從此深度學習進入了高速發展的時期,之後便誕生了VGG、ResNet等一系列卷積網路架構。
1. LeNet
  LeNet的結構如圖4-4所示,其中只有3種網路層——卷積層、池化層和全連接層。在啟動函數的選擇上,LeNet選擇了雙曲正切函數(Tanh),確定了卷積神經網路的基本結構。
圖4-4 LeNet 結構示意圖
  現在有些深度學習框架中已經不提供定義好的LeNet 網路了,即使有,也是經過簡化改良之後的LeNet-5,用於辨識MNIST資料集的LeNet-5結構如圖4-5 所示。
圖4-5 LeNet-5 結構圖
  Tanh 啟動函數被替換成了ReLU 啟動函數。
2. AlexNet
  AlexNet中主要是提出了ReLU啟動函數和Dropout方法,同時還引入了資料增強操作,使模型的泛化能力得到進一步提高。但是這個網路中的參數量達到了6000萬,AlexNet的作者使用了兩片GTX 580訓練了五六天才得到分類結果。最終的分類結果也不負所望,以超越第二名10.9%的絕對優勢奪得第一名。AlexNet 網路結構如圖4-6 所示。
  AlexNet中包含了5個卷積層和3個全連接層,層數比LeNet多,但是卷積、池化這樣的整體流程並沒有改變。AlexNet中用到的3個訓練技巧對最終的結果造成了積極作用。
圖4-6 AlexNet 網路結構示意圖
  • ReLU:ReLU啟動函數具有非線性的特徵,又不會像Sigmoid和Tanh那樣,容易出現梯度彌散的問題。
  • Dropout:其原理類似於sklearn中的整合演算法,在訓練過程中,會以一定機率讓神經網路節點失去活性。在預測過程中,會將所有節點的輸出乘以這個機率值。這樣訓練出來的神經網路能夠得到類似多模型整合的效果,緩解了模型的過擬合問題。
  • 資料增強:資料增強過程相當於增加了樣本的多樣性,使模型具有更強的泛化能力。
3. VGGNet
  我們可以將VGGNet看作一個加深版的AlexNet,它使用了3個全連接層,使模型的總參數量達到了1.3億,這個架構最大的貢獻是它證明了:使用小尺寸的卷積核心並增加網路深度可以有效提升模型效果。不過有關VGGNet的論文中提到,當網路層數疊加到19層時,其準確率幾乎達到飽和,即此時無法再透過加深網路來提高準確率了。
  這個網路在當時看來已經非常深了,VGG的作者在訓練VGG模型的時候,是先訓練了淺層網路(VGG-11),等淺層網路穩定之後,再往上增加新的卷積層,這樣逐步將網路深度增加到13、16、19。圖4-7展示了VGG-16的網路結構。
圖4-7  VGG-16 網路結構示意圖
  VGG使用多個小卷積核心替代了大卷積核心,比如使用3個3×3卷積核心得到的特徵圖尺寸和使用1個7×7卷積核心得到的特徵圖尺寸相同,7×7卷積核心有49×channel個參數,而3個3×3卷積核心只有27×channel個參數(channel 是通道數)。
  在VGG之後出現的網路中,卷積核心基本以3×3卷積和1×1卷積為主。
4. GoogleNet
  GoogleNet也叫InceptionNet,與AlexNet和VGGNet這種單純依靠加深網路結構進而改進網路性能的想法不一樣,它另闢蹊徑,在加深網路的同時,改進了網路結構:引入Inception模組(見圖4-8),使用分支結構。在僅有500萬參數的情況下,GoogleNet力壓VGG模型獲得2014年ILSVRC分類比賽的冠軍(VGG是定位比賽的冠軍和分類比賽的亞軍)。
圖4-8 Inception 模組
  GoogleNet為了能讓模型更進一步地收斂,在較淺層的特徵圖上設計了輔助損失單元,這樣得到的淺層特徵也能有很好的區分能力。
  Inception v2中提出了Batch Normalization(本書將其簡稱為BatchNorm),對啟動值進行了規範化操作,使網路梯度反向傳播時不再受參數尺度影響,這個方法已經被後來很多網路架構應用。在有些專案中,為了最佳化模型的速度和記憶體佔用情況,會將BatchNorm合併到卷積中。
5. ResNet
  ResNet可以說是卷積神經網路發展史上里程碑式的貢獻,其獨創的殘差結構(見圖4-9)能夠有效緩解梯度彌散問題,在網路層數達到100多層的時候,仍然可以有效地進行訓練。
  考慮到x的維度與F(x)的維度可能不匹配,需進行維度匹配工作,在恆等層採用1×1 卷積核心來增加維度。
  在網路進一步加深之後,圖4-9中的殘差模組變得不是特別有效,所以又設計了一種瓶頸參數模組,如圖4-10所示。第一個1×1卷積有著降維的作用,將原來256維的x降維到64維,從而使3×3卷積得以在較低維度上進行運算,有著提高運算效率的作用。3×3卷積計算完畢之後,再使用1×1卷積進行升維,以便與原有的x相加。
圖4-9 ResNet 中的殘差模組
圖4-10 瓶頸殘差模組
《PyTorch深度學習:電腦視覺流行專案親自動手》/ 郭卡、戴亮 編著
即將進入廣告,捲動後可繼續閱讀
為什麼會看到廣告
avatar-img
9會員
25內容數
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
深智數位的沙龍 的其他內容
Kubernetes是什麼? 1. Kubernetes是Google嚴格保密十幾年的秘密武器——Borg的一個開放原始碼版本。 2. Kubernetes是一個開放的開發平台。 3. Kubernetes是一個完備的分散式系統支撐平台。
大部分處理影像的神經網路,例如簡單的神經網路、CNN、物件偵測、語義分割、臉部辨識等,都是以像素為輸入特徵,圖神經網路 (GNN) 則是以圖形理論 (Graph Theory) 為基礎,以向量作為輸入,內含節點 (Node) 及邊 (Edge),如下圖,以圖形表達集團交叉持股的關係及持股比例。
要徹底了解深度學習,必須從數學/統計奠定基礎,從張量運算、偏微分、梯度下降優化求解,最後依據機率統計衡量模的效能指標,包括準確率 (Accuracy)、精確率 (Precision)、召回率 (Recall),乃至於混淆矩陣 (Confusion Matrix)。
TensorFlow、PyTorch 是目前佔有率最高的深度學習框架,初學者常會問『應該選擇PyTorch或 TensorFlow套件』,依個人看法,PyTorch、TensorFlow好比倚天劍與屠龍刀,各有擅場,兩個套件的發展重點有所不同,例如在偵錯方面,PyTorch比較容易,但Tensor
2020年VMware發布VMware vSphere 7.0,透過整合資料中心伺服器、靈活設定資源等方式降低了營運成本,同時還可在不增加成本的情況下提供給使用者高可用、災難恢復等進階特性。
行動通訊系統十年一代,從 1G 到 4G,歷經了「模擬、數位、資料、寬頻」四次技術變革,為全世界的億萬使用者帶來了「前所未有」的嶄新感受。尤其是 4G 技術開啟了行動網際網路時代,深刻改變了人們的生活方式。
Kubernetes是什麼? 1. Kubernetes是Google嚴格保密十幾年的秘密武器——Borg的一個開放原始碼版本。 2. Kubernetes是一個開放的開發平台。 3. Kubernetes是一個完備的分散式系統支撐平台。
大部分處理影像的神經網路,例如簡單的神經網路、CNN、物件偵測、語義分割、臉部辨識等,都是以像素為輸入特徵,圖神經網路 (GNN) 則是以圖形理論 (Graph Theory) 為基礎,以向量作為輸入,內含節點 (Node) 及邊 (Edge),如下圖,以圖形表達集團交叉持股的關係及持股比例。
要徹底了解深度學習,必須從數學/統計奠定基礎,從張量運算、偏微分、梯度下降優化求解,最後依據機率統計衡量模的效能指標,包括準確率 (Accuracy)、精確率 (Precision)、召回率 (Recall),乃至於混淆矩陣 (Confusion Matrix)。
TensorFlow、PyTorch 是目前佔有率最高的深度學習框架,初學者常會問『應該選擇PyTorch或 TensorFlow套件』,依個人看法,PyTorch、TensorFlow好比倚天劍與屠龍刀,各有擅場,兩個套件的發展重點有所不同,例如在偵錯方面,PyTorch比較容易,但Tensor
2020年VMware發布VMware vSphere 7.0,透過整合資料中心伺服器、靈活設定資源等方式降低了營運成本,同時還可在不增加成本的情況下提供給使用者高可用、災難恢復等進階特性。
行動通訊系統十年一代,從 1G 到 4G,歷經了「模擬、數位、資料、寬頻」四次技術變革,為全世界的億萬使用者帶來了「前所未有」的嶄新感受。尤其是 4G 技術開啟了行動網際網路時代,深刻改變了人們的生活方式。
你可能也想看
Google News 追蹤
Thumbnail
投資新手大多從身邊市場開始著手,選擇台股市場入門,單筆投資或台股定期定額投資,隨著經驗累積,進入美股市場也是好選擇,這篇文章帶你前進美股投資,證券開戶選擇國內券商複委託,使用美股定期定額投資,並以國泰 CUBE App為例說明。 內容目錄: 1.一站式開戶:以國泰世華 CUBE App 為例
Thumbnail
這是張老師的第三本書,我想前二本應該也有很多朋友們都有讀過,我想絕對是受益良多,而這次在書名上就直接點出,著重在從投資的角度來切入
Thumbnail
立法委員郭昱晴今(27)針對文化部業務報告,以三大議題提出質詢,包括「戲曲學校性平案」涉案教師仍在業界為所欲為、「獨立書店訪視員爭議」從遴選制度到評估專業度皆受質疑,以及「資深影視從業人員關懷」依舊沒有進度。
Thumbnail
致鬱系(イヤミス)是由評論家霜月蒼於二○○七年提出的一種推理小說類型,指的是那些讀完後讓人心情沮喪、餘味不佳的作品,其主題通常圍繞在人內心的陰暗面。 森澤藤子,一個遭到父母虐待、同學欺凌,在悲慘的日子裡苦苦掙扎的少女。她始終以為自己的人生就只能在底層打滾,再無翻身的可能。
Thumbnail
用自己的話來寫出自己理解的內容,這種能力是每個寫作者都需要具備的基本技能。
Thumbnail
平均地權條例子法規即將於今(112)年 7 月 1 日正式上路,這次平均地權條例其中一項修正重點,就是限制私法人購買住宅用房屋,必須取得內政部的許可方可購買,本文將完整解析私法人購屋許可制之詳細內容,讓大家瞭解規定以及對自身的影響,並提供申請書表供大家下載參考! 繼續閱讀:https://cpac
Thumbnail
「有聲作品」是小說/文學/漫畫創作者的一項發行選擇型式 眼睛總是在忙,耳朵永遠有空 連續幾年,大家都在說台灣的有聲市場起飛,台灣的收聽群眾的確一直在增加,小說/故事演播、廣播劇改編,是圖文創作者在實體書本、電子書、電視劇、電影以外的的發行型式。在許多國家,因為有聲劇帶起了收聽數,促成電視劇電影爭取改
Thumbnail
在AI已經全民運動的年代,Google還是希望有一個更小巧精美的深度學習套件讓大家都能快速上手──JAX就這麼誕生了。 現在,你真的可以放心的進入JAX的世界,當你上手之後,不論是CNN、RNN、NLP或是GAN,全部可以又快又好又清楚的做出來
Thumbnail
這部作品有很多細節可以討論,我很佩服作者為這個故事的世界觀制定了一套很合乎邏輯的理論,至少我這個文科女子沒有看出什麼破綻。看完電影的時候,我聽到其他觀眾邊走邊討論劇情,大部分的人都認為要兩部一起看才能完全看懂,但理論的部分可能還是要看小說了。畢竟小說裡面用了好幾頁解釋的事情,字幕就只有一、二句。 沒
Thumbnail
嗨,年假結束了,大家都胖了一圈嗎?(笑) 今天要跟大家分享一件很開心的事。我三年前的譯作改編成電影版,而且還引進台灣了。去年我得知電影版要在日本上映,已經覺得很激動,沒想到在灌籃高手與阿凡達雙面夾擊的情況下,竟然引進台灣,真的是眼淚都要流下來了。 編輯日前邀請我去參加媒體試映,開心拍完照之後我就進入
Thumbnail
如果下輩子到來前可以選擇,你想當男生還是女生? 一直到現在都還存在於這個社會之中,《82 年生的金智英》帶給女性很大的共鳴,也推薦給男性閱讀,讀完能深刻體會到女性面對社會輿論與那些「理所當然」的種種,下次在面對另一半或女性友人、同事時也能多一點的體貼。
Thumbnail
投資新手大多從身邊市場開始著手,選擇台股市場入門,單筆投資或台股定期定額投資,隨著經驗累積,進入美股市場也是好選擇,這篇文章帶你前進美股投資,證券開戶選擇國內券商複委託,使用美股定期定額投資,並以國泰 CUBE App為例說明。 內容目錄: 1.一站式開戶:以國泰世華 CUBE App 為例
Thumbnail
這是張老師的第三本書,我想前二本應該也有很多朋友們都有讀過,我想絕對是受益良多,而這次在書名上就直接點出,著重在從投資的角度來切入
Thumbnail
立法委員郭昱晴今(27)針對文化部業務報告,以三大議題提出質詢,包括「戲曲學校性平案」涉案教師仍在業界為所欲為、「獨立書店訪視員爭議」從遴選制度到評估專業度皆受質疑,以及「資深影視從業人員關懷」依舊沒有進度。
Thumbnail
致鬱系(イヤミス)是由評論家霜月蒼於二○○七年提出的一種推理小說類型,指的是那些讀完後讓人心情沮喪、餘味不佳的作品,其主題通常圍繞在人內心的陰暗面。 森澤藤子,一個遭到父母虐待、同學欺凌,在悲慘的日子裡苦苦掙扎的少女。她始終以為自己的人生就只能在底層打滾,再無翻身的可能。
Thumbnail
用自己的話來寫出自己理解的內容,這種能力是每個寫作者都需要具備的基本技能。
Thumbnail
平均地權條例子法規即將於今(112)年 7 月 1 日正式上路,這次平均地權條例其中一項修正重點,就是限制私法人購買住宅用房屋,必須取得內政部的許可方可購買,本文將完整解析私法人購屋許可制之詳細內容,讓大家瞭解規定以及對自身的影響,並提供申請書表供大家下載參考! 繼續閱讀:https://cpac
Thumbnail
「有聲作品」是小說/文學/漫畫創作者的一項發行選擇型式 眼睛總是在忙,耳朵永遠有空 連續幾年,大家都在說台灣的有聲市場起飛,台灣的收聽群眾的確一直在增加,小說/故事演播、廣播劇改編,是圖文創作者在實體書本、電子書、電視劇、電影以外的的發行型式。在許多國家,因為有聲劇帶起了收聽數,促成電視劇電影爭取改
Thumbnail
在AI已經全民運動的年代,Google還是希望有一個更小巧精美的深度學習套件讓大家都能快速上手──JAX就這麼誕生了。 現在,你真的可以放心的進入JAX的世界,當你上手之後,不論是CNN、RNN、NLP或是GAN,全部可以又快又好又清楚的做出來
Thumbnail
這部作品有很多細節可以討論,我很佩服作者為這個故事的世界觀制定了一套很合乎邏輯的理論,至少我這個文科女子沒有看出什麼破綻。看完電影的時候,我聽到其他觀眾邊走邊討論劇情,大部分的人都認為要兩部一起看才能完全看懂,但理論的部分可能還是要看小說了。畢竟小說裡面用了好幾頁解釋的事情,字幕就只有一、二句。 沒
Thumbnail
嗨,年假結束了,大家都胖了一圈嗎?(笑) 今天要跟大家分享一件很開心的事。我三年前的譯作改編成電影版,而且還引進台灣了。去年我得知電影版要在日本上映,已經覺得很激動,沒想到在灌籃高手與阿凡達雙面夾擊的情況下,竟然引進台灣,真的是眼淚都要流下來了。 編輯日前邀請我去參加媒體試映,開心拍完照之後我就進入
Thumbnail
如果下輩子到來前可以選擇,你想當男生還是女生? 一直到現在都還存在於這個社會之中,《82 年生的金智英》帶給女性很大的共鳴,也推薦給男性閱讀,讀完能深刻體會到女性面對社會輿論與那些「理所當然」的種種,下次在面對另一半或女性友人、同事時也能多一點的體貼。