[AI小學堂(三)]神經網路是什麼? 淺談深度學習的神經網路Neural Network的架構-續

更新於 發佈於 閱讀時間約 4 分鐘
raw-image

這篇文章是繼上一篇文章之後,我們繼續講解神經網路的基本架構。我們先複習一下,上篇文章我們解說到了神經網路的基本架構包含了輸入層,輸出層,還有中間的隱藏層,也說明了這是一個把輸入資料拆解出特徵然後依照特徵做判斷的過程。

raw-image

但是究竟每一層的神經網路,如何影響下一層的神經網路可以辨識出特徵呢? 這些中間的線條(連結)到底是什麼意義呢? 這就是這一篇要告訴你的。首先我們要知道第二層的每一個神經元跟第一層的每個神經元都是fully-connected,這是什麼意思? 也就是說每個第二層的神經元,都跟每個第一層的神經原有連接。

我們來假設我們挑選了第二層的某一個神經元,我們叫做神經元A好了,而這個神經元A是可以決定是否圖案中有這樣的一個短線(如下圖),那麼因為第一層的784個神經元都有連接到這個第二層的這個神經元A,所以我們可以說這784個神經元都有各自的權重Weight可以影響這個神經元A,所以這些神經元的數值再乘上各自的權重,就會是這個神經元A的值了。

raw-image

實際上這樣的公式叫做Activation function,還要加上sigmoid function跟誤差(Bias),這是為了要讓計算出來的數值可以維持在0~1之間的數值,因為我們的目的是要儘量簡單的介紹,所以這邊就不在繼續深究。重點是,這些誤差(Bias)跟權重(Weight),是會隨著我們訓練這個神經網路而變動的數值。

如果我們來想想這樣一個簡單的神經網路,輸入層有784個神經元,而中間兩層隱藏層僅有16 個神經元,輸出層只有10個神經元好了,那我們光是第一層到第二層的連結,就有784 (個神經元) x16個 權重,而每一條連結線都有自己不同的誤差值(Bias)

raw-image

然後再往下計算整個神經網路的話,就會有總共有784*16加上16x16加上16x10的權重數,誤差值則是有16+16+10個。光是這樣的一個簡單的網路,就可以想像成有13002個數值會隨時變動,導致輸入的資料到輸出的結果會有不同的結果。

raw-image

這13002個會變動的權重Weight跟誤差值Bias就是我們希望神經網路透過學習而能夠得到最佳值的,我們相信,經過學習的神經網路,可以替這13002的數值找到最佳的解答,然後我們輸入的數字圖片都可以被正確的辨識。

這麼簡單基礎的神經網路,都會需要13002個數值,不是很可怕嗎? 而且實際上的神經網路,每一層可能都有遠超768的神經元,而且神經網路的層數也可能會有數百層以上,可以想像這些權重Weight跟誤差值Bias是一個非常非常驚人的數量。但是我們回頭想想,如果神經網路沒有很複雜其實才可怕,畢竟神經網路是被認為可以邏輯推理的人工智慧的雛形,所以是應該會具備一定的複雜程度的。

關於神經網路的架構我們就很基礎的介紹到這邊,如果有興趣了解裡面的數學式的,請務必去看原本的英文影片,下一篇我們會介紹神經網路是如何透過餵進大量的資料去學習的,我們下次見囉。



留言
avatar-img
留言分享你的想法!
avatar-img
技術PM路易斯的沙龍
50會員
35內容數
技術PM的AI實驗室,是以輕鬆的角度深入簡出的探討各種生成式AI工具的使用。無論你是想理解AI到底是怎麼運作的? 想知道有那些好用的生成式AI工具? 或者是對AI繪圖有興趣的,都歡迎加入我們的AI實驗室一起輕鬆地玩耍,我們邊玩邊學,學習跟AI一起共創新的可能。
2023/12/23
SDXL Turbo主打可以1 step就產生一定品質的圖片 (圖片品質比SDXL甚至SD 1.5還要低),完全是以速度取勝,那麼SDXL Turbo這個技術代表的是怎樣的突破呢? 究竟秒出圖的技術能夠有什麼實際的應用呢? 這就是我們這篇想要探討的。
Thumbnail
2023/12/23
SDXL Turbo主打可以1 step就產生一定品質的圖片 (圖片品質比SDXL甚至SD 1.5還要低),完全是以速度取勝,那麼SDXL Turbo這個技術代表的是怎樣的突破呢? 究竟秒出圖的技術能夠有什麼實際的應用呢? 這就是我們這篇想要探討的。
Thumbnail
2023/11/18
這篇文章會跟大家介紹,為什麼我覺得ChatGPT的多模態輸入輸出其實是最重要的一個功能之一,讓AI往成為真正人工智慧代理人的路上前進了一大步,我們也會稍微探討(想像)一下,所謂的理想的AI載具到底應該是怎樣的?
Thumbnail
2023/11/18
這篇文章會跟大家介紹,為什麼我覺得ChatGPT的多模態輸入輸出其實是最重要的一個功能之一,讓AI往成為真正人工智慧代理人的路上前進了一大步,我們也會稍微探討(想像)一下,所謂的理想的AI載具到底應該是怎樣的?
Thumbnail
2023/11/01
本篇文章是 以ChatGPT翻譯華頓商學院教授Ethan Mollick的文章,並且稍微加上修飾而來的,是一篇相當好的該如何使用AI的引言,分享給各位。 我們學到的就是,只要使用AI,你就會學會如何使用AI。你只需大量使用AI,直到你弄清楚它的優點和缺點,就可以成為你領域的AI應用專家。
Thumbnail
2023/11/01
本篇文章是 以ChatGPT翻譯華頓商學院教授Ethan Mollick的文章,並且稍微加上修飾而來的,是一篇相當好的該如何使用AI的引言,分享給各位。 我們學到的就是,只要使用AI,你就會學會如何使用AI。你只需大量使用AI,直到你弄清楚它的優點和缺點,就可以成為你領域的AI應用專家。
Thumbnail
看更多
你可能也想看
Thumbnail
孩子寫功課時瞇眼?小心近視!這款喜光全光譜TIONE⁺光健康智慧檯燈,獲眼科院長推薦,網路好評不斷!全光譜LED、180cm大照明範圍、5段亮度及色溫調整、350度萬向旋轉,讓孩子學習更舒適、保護眼睛!
Thumbnail
孩子寫功課時瞇眼?小心近視!這款喜光全光譜TIONE⁺光健康智慧檯燈,獲眼科院長推薦,網路好評不斷!全光譜LED、180cm大照明範圍、5段亮度及色溫調整、350度萬向旋轉,讓孩子學習更舒適、保護眼睛!
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
創作者營運專員/經理(Operations Specialist/Manager)將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力,找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。
Thumbnail
WaveNet 提供了一個先進的架構用於音訊重建,但是,有必要嗎? Mel 頻譜本身就是經過數學轉換而獲得的結果,不能反運算嗎 ? 到底 WaveNet 在其中扮演了甚麼腳色 ?它是如何運作的 ? 讓我們在這篇好好探討下去。
Thumbnail
WaveNet 提供了一個先進的架構用於音訊重建,但是,有必要嗎? Mel 頻譜本身就是經過數學轉換而獲得的結果,不能反運算嗎 ? 到底 WaveNet 在其中扮演了甚麼腳色 ?它是如何運作的 ? 讓我們在這篇好好探討下去。
Thumbnail
『宇宙編程碼』源自接收宇宙信息,將其信息碼轉換成可閱讀的文字,因此運用『編程碼』一詞。 宇宙編程碼的運用,是藉由啟動大腦發出每一個思想的波動現象=(能量振動頻率),以雙手為媒介輕觸身體,透過念頭將"編程碼文字"=(宇宙信息波)傳遞至肌肉所儲存的能量訊息波相互抵銷,幫助身體釋放與清理因情緒、壓力、能
Thumbnail
『宇宙編程碼』源自接收宇宙信息,將其信息碼轉換成可閱讀的文字,因此運用『編程碼』一詞。 宇宙編程碼的運用,是藉由啟動大腦發出每一個思想的波動現象=(能量振動頻率),以雙手為媒介輕觸身體,透過念頭將"編程碼文字"=(宇宙信息波)傳遞至肌肉所儲存的能量訊息波相互抵銷,幫助身體釋放與清理因情緒、壓力、能
Thumbnail
將單位脈衝(Unit Impulse)輸入系統時,其響應即是此系統的特性函數 h(t), 此h(t)稱為脈衝響應。 ●時域的脈衝響應為Convolution 函數式 ●頻域的脈衝響應為乘積函數式:
Thumbnail
將單位脈衝(Unit Impulse)輸入系統時,其響應即是此系統的特性函數 h(t), 此h(t)稱為脈衝響應。 ●時域的脈衝響應為Convolution 函數式 ●頻域的脈衝響應為乘積函數式:
Thumbnail
在我們的上一篇文章,我們把神經網路的架構用簡化再簡化的方式來說明,本篇文章我們會說明神經網路怎麼透過很多輸入資料來調整神經網路裡面的權重跟誤差值,藉由得到接近完美個權重跟誤差值,來做到學習的效果
Thumbnail
在我們的上一篇文章,我們把神經網路的架構用簡化再簡化的方式來說明,本篇文章我們會說明神經網路怎麼透過很多輸入資料來調整神經網路裡面的權重跟誤差值,藉由得到接近完美個權重跟誤差值,來做到學習的效果
Thumbnail
上篇文章我們解說到了神經網路的基本架構包含了輸入層,輸出層,還有中間的隱藏層,也說明了這是一個把輸入資料拆解出特徵然後依照特徵做判斷的過程。究竟每一層的神經網路,如何影響下一層的神經網路可以辨識出特徵呢? 這些中間的線條(連結)到底是什麼意義呢? 這就是這一篇要告訴你的。
Thumbnail
上篇文章我們解說到了神經網路的基本架構包含了輸入層,輸出層,還有中間的隱藏層,也說明了這是一個把輸入資料拆解出特徵然後依照特徵做判斷的過程。究竟每一層的神經網路,如何影響下一層的神經網路可以辨識出特徵呢? 這些中間的線條(連結)到底是什麼意義呢? 這就是這一篇要告訴你的。
Thumbnail
Google JAX是一種用於轉換數值函數的機器學習框架。 它被描述為匯集了autograd(通過函數微分自動獲得梯度函數)和TensorFlow的XLA(加速線性代數)的修改版本。 它旨在盡可能地遵循NumPy的結構和工作流程,並與各種現有框架(如TensorFlow和PyTorch)一起工作。
Thumbnail
Google JAX是一種用於轉換數值函數的機器學習框架。 它被描述為匯集了autograd(通過函數微分自動獲得梯度函數)和TensorFlow的XLA(加速線性代數)的修改版本。 它旨在盡可能地遵循NumPy的結構和工作流程,並與各種現有框架(如TensorFlow和PyTorch)一起工作。
Thumbnail
============================================= 根軌跡的定義 ============================================= ■根軌跡的定義 ●控制系統轉移函數 ●特性方程式及特性根 亦即 1+開迴路轉移函數=0 ●根軌跡
Thumbnail
============================================= 根軌跡的定義 ============================================= ■根軌跡的定義 ●控制系統轉移函數 ●特性方程式及特性根 亦即 1+開迴路轉移函數=0 ●根軌跡
Thumbnail
此為蔡老師提供給修課學生的參考資料的handout,為Jure Leskovec 課程的Graph Neural Network投影片的簡略解說,在此分享給有興趣的同好。這可不是完整的介紹文章,請對照原投影片使用。
Thumbnail
此為蔡老師提供給修課學生的參考資料的handout,為Jure Leskovec 課程的Graph Neural Network投影片的簡略解說,在此分享給有興趣的同好。這可不是完整的介紹文章,請對照原投影片使用。
Thumbnail
感知器  (perceptron) 利用逐一探訪訓練資料,以更多的訓練例子被正確的分類為目標,來更新任意初始的權重。然而該方法難以延伸到非線性的分類平面,所以以梯度為主的最佳化演算法取而代之,並發展出更多的應用。在本篇中,除了介紹梯度下降法外,亦會討論如何利用學習曲線圖診斷一個機械模型,並對症下藥。
Thumbnail
感知器  (perceptron) 利用逐一探訪訓練資料,以更多的訓練例子被正確的分類為目標,來更新任意初始的權重。然而該方法難以延伸到非線性的分類平面,所以以梯度為主的最佳化演算法取而代之,並發展出更多的應用。在本篇中,除了介紹梯度下降法外,亦會討論如何利用學習曲線圖診斷一個機械模型,並對症下藥。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News