3. 實作 全連接神經網路

JN-avatar-img
發佈於計算機
更新於 發佈於 閱讀時間約 3 分鐘

這篇會示範,只要稍微會寫 python,儘管對 AI 只有極淺的認識,也能輕易兜出一個,專家們眼中可能很白癡的 AI 模型。若題目不難、訓練資料夠多,這個白癡模型仍可以莫名其妙的變聰明。


全都的程式碼都在下圖,20行就能兜出一個全連層 (fully connected layer ) 組成的全連接神經網路模型 (DNN)。

raw-image


簡單解釋

  • line 5: MyDNN 繼承 torch.nn.Module
  • line 6: 36指的是,圖片中五個驗證碼,每一碼都可能是 ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789 這36類其中之一
  • line 8: 全連接層 fc1,輸入整張圖片,大小為 H x W x C,輸出長度 60 x 200 的特徵,是我憑感覺任意定的。也許可以想成把長度 36000 的圖片內容轉換成長度 12000 的特徵。
  • line 9: 可有可無。全連接層 fc2,把長度 12000 的特徵轉換成 1200。
  • line 11: 全連接層 fca 把長度 1200 的特徵,轉換成 36 個分數,代表圖片中第一個驗證碼是 36 類的哪一類。以下圖來說,會希望 fca 輸出的 36 的分數中,Y 的分數最高。
  • line 11~15: fca fcb fcc fcd fce 分別對應到驗證碼的五個文字。
  • line 18: 在 forward 函數理,把輸入 x 攤平成 36000 的資料,然後依序經過每一層。每一層輸出記得多做 relu 函數,可以想像成把 input feature 做完線性轉換後再做一個非線性轉換。
驗證碼固定有五個文字

驗證碼固定有五個文字


(關於為什麼全連接層是在做特徵轉換,之前有寫一篇 誤上 AI 列車的山道猴,就是我。由於是把文章當作個人筆記,順便在同溫層中抒發心情,所以寫得有點零散,也不嚴謹,當故事看就好,有興趣的讀者一定要去網路找正式教材,才不會學歪。)

模型的發展通常似乎都是先用大模型嘗試可行性,可行後再用其他知識或技術來簡化模型?當初全連接神經網路 (DNN) 似乎也是?因為參數較多,執行慢,記憶體需求大,後來就有人導入了類似傳統影像處理演算法的濾波器,把模型簡化成捲積式神經網路 (CNN)。


下一篇會示範怎麼兜一個 CNN,跟這篇一樣,由於這類模型幾乎都成了公版,不用知道太多原理也能兜出來。


這次的專案用 DNN 或 CNN 都可以,可以直接跳到第 5 篇,訓練、匯出模型。




系列文整理:

0. 從零開始,打造第一個 AI 模型 (序言)

1. 環境設定

2. 準備資料集

3. 實做 全連接神經網路 (參數較多)

4. 實做 捲積式神經網路 (參數較少)

5. 訓練、匯出模型

6. 載入、使用模型

avatar-img
62會員
29內容數
個人網誌啦~ 內容包含但不限於學習筆記、心情抒發、火星廢文...
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
JN的沙龍 的其他內容
抓圖&標記 沒別招,只能一張張把圖片抓下來,少說抓個幾百~幾千張吧。抓下來的圖可以用遞增數字當檔名。 再來這步更麻煩,標記。 新增一個文字檔,或跟我一樣用 label.csv 都可以,然後把一張張圖片上的驗證碼正確答案記錄下來。 儘管步驟再簡單,只靠自己人工抓圖和標記,既耗時又煩
本文是以 Windows 電腦為主,但理論上 macOS 的步驟也差不多。 主要就兩個步驟 安裝 Python (我裝 3.12) 安裝 PyTorch
最近工作剛好有用到 PyTorch,由於僅止於些簡單的功能和除錯,事後對這個熱門的 AI 框架還是一知半解。想了下,如果連用 PyTorch 做個簡單的 AI 模型都辦不到,不就浪費了這段時間的接觸? 於是訂個簡單的題目並試著去完成,順手做個紀錄。內容非常初階,篇幅也不多,主要著重在...
烏龍轉桌,常用來形容股市網紅在預測股票失準後,硬要自圓其說的行為,常見的情況大概是.. 漲了就 PO 文: 一切預告在前!恭喜有跟上的粉絲! 跌了就改口: 早就提醒要賣!有跟著賣的都在數錢了! 等風頭過了就改推別檔,然後再輪迴一次。 這種網紅勝率永遠 100%,非常厲害,然而...
最近多變的天氣, 和複雜的心情, 讓我常在上班時間, 看著天花板發呆, 任由白日夢覆蓋我的思緒, 看著看著,便想起一段念書時的往事...
社會在走,基本行情要有啦。 大家都在瘋 AI,身為 Sym道猴的我,能不一起湊熱鬧嗎。 很多人聊股票,討論真 AI、假 AI, 我跟你講, 這篇就是真 AI。
抓圖&標記 沒別招,只能一張張把圖片抓下來,少說抓個幾百~幾千張吧。抓下來的圖可以用遞增數字當檔名。 再來這步更麻煩,標記。 新增一個文字檔,或跟我一樣用 label.csv 都可以,然後把一張張圖片上的驗證碼正確答案記錄下來。 儘管步驟再簡單,只靠自己人工抓圖和標記,既耗時又煩
本文是以 Windows 電腦為主,但理論上 macOS 的步驟也差不多。 主要就兩個步驟 安裝 Python (我裝 3.12) 安裝 PyTorch
最近工作剛好有用到 PyTorch,由於僅止於些簡單的功能和除錯,事後對這個熱門的 AI 框架還是一知半解。想了下,如果連用 PyTorch 做個簡單的 AI 模型都辦不到,不就浪費了這段時間的接觸? 於是訂個簡單的題目並試著去完成,順手做個紀錄。內容非常初階,篇幅也不多,主要著重在...
烏龍轉桌,常用來形容股市網紅在預測股票失準後,硬要自圓其說的行為,常見的情況大概是.. 漲了就 PO 文: 一切預告在前!恭喜有跟上的粉絲! 跌了就改口: 早就提醒要賣!有跟著賣的都在數錢了! 等風頭過了就改推別檔,然後再輪迴一次。 這種網紅勝率永遠 100%,非常厲害,然而...
最近多變的天氣, 和複雜的心情, 讓我常在上班時間, 看著天花板發呆, 任由白日夢覆蓋我的思緒, 看著看著,便想起一段念書時的往事...
社會在走,基本行情要有啦。 大家都在瘋 AI,身為 Sym道猴的我,能不一起湊熱鬧嗎。 很多人聊股票,討論真 AI、假 AI, 我跟你講, 這篇就是真 AI。
你可能也想看
Google News 追蹤
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
程式設計與技術能力 在現代社會中的重要性越來越明顯,尤其是在人工智能(AI)和自動化技術迅速發展的背景下。理解編程語言,如Python、R等,以及熟悉相關技術架構和工具,能夠幫助個人在這樣的環境中更好地工作。這種能力不僅對技術專業人士至關重要,也對非技術領域的人士日益重要,因為基礎的程式設計知識已
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
在現今以及未來的工作中,AI 技能將扮演關鍵角色。為了滿足這一需求,許多頂尖科技公司和大學提供了免費的線上 AI 課程,讓有興趣進修、提升能力的讀者可以選擇適合自己的課程。
https://www.youtube.com/watch?v=wjZofJX0v4M 這是我看過最好的AI科普影片了;現在流行的GPT使用的大語言模型 (large language model, LLM), 是把每一個單字都當作一個高維度向量 影片中GPT3共儲存50257個英文單字, 每
Thumbnail
筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型 三個步驟: 1.預訓練,訓練一次要用幾萬顆處理器、訓練時間要1個月,ChatGPT訓練一次的成本為1000萬美金。 2.微調(
Thumbnail
AI 相關的內容每天都非常多,有聽過很多人因此感覺到焦慮,怕錯過了最新資訊就會趕不上,這篇內容會跟大家詳細的分享我自己的學習方法和經驗,並且會在最後分享一些我的學習資訊來源。
大語言模型能夠生成文本,因此被認為是生成式人工智慧的一種形式。 人工智慧的學科任務,是製作機器,使其能執行需要人類智慧才能執行的任務,例如理解語言,便是模式,做出決策。 除了大語言模型,人工智慧也包含了深度學習以及機器學習。 機器學習的學科任務,是透過演算法來實踐AI。 特別
這個頻道將提供以下服務: 深入介紹各種Machine Learning技術 深入介紹各種Deep Learning技術 深入介紹各種Reinforcement Learning技術 深入介紹Probabilistic Graphical Model技術 不定時提供讀書筆記 讓我們一起在未
Thumbnail
這篇文章介紹瞭如何利用生成式AI(GenAI)來提高學習效率,包括文章重點整理、完善知識體系、客製化學習回饋、提供多元觀點等方法。同時提醒使用者應注意內容的信效度,保持學術誠信,適當運用GenAI能大幅提升工作效率。
Thumbnail
延續上週提到的,「有哪些不訓練模型的情況下,能夠強化語言模型的能力」,這堂課接續介紹其中第 3、4 個方法
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
程式設計與技術能力 在現代社會中的重要性越來越明顯,尤其是在人工智能(AI)和自動化技術迅速發展的背景下。理解編程語言,如Python、R等,以及熟悉相關技術架構和工具,能夠幫助個人在這樣的環境中更好地工作。這種能力不僅對技術專業人士至關重要,也對非技術領域的人士日益重要,因為基礎的程式設計知識已
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
在現今以及未來的工作中,AI 技能將扮演關鍵角色。為了滿足這一需求,許多頂尖科技公司和大學提供了免費的線上 AI 課程,讓有興趣進修、提升能力的讀者可以選擇適合自己的課程。
https://www.youtube.com/watch?v=wjZofJX0v4M 這是我看過最好的AI科普影片了;現在流行的GPT使用的大語言模型 (large language model, LLM), 是把每一個單字都當作一個高維度向量 影片中GPT3共儲存50257個英文單字, 每
Thumbnail
筆記-曲博談AI模型.群聯-24.05.05 https://www.youtube.com/watch?v=JHE88hwx4b0&t=2034s *大型語言模型 三個步驟: 1.預訓練,訓練一次要用幾萬顆處理器、訓練時間要1個月,ChatGPT訓練一次的成本為1000萬美金。 2.微調(
Thumbnail
AI 相關的內容每天都非常多,有聽過很多人因此感覺到焦慮,怕錯過了最新資訊就會趕不上,這篇內容會跟大家詳細的分享我自己的學習方法和經驗,並且會在最後分享一些我的學習資訊來源。
大語言模型能夠生成文本,因此被認為是生成式人工智慧的一種形式。 人工智慧的學科任務,是製作機器,使其能執行需要人類智慧才能執行的任務,例如理解語言,便是模式,做出決策。 除了大語言模型,人工智慧也包含了深度學習以及機器學習。 機器學習的學科任務,是透過演算法來實踐AI。 特別
這個頻道將提供以下服務: 深入介紹各種Machine Learning技術 深入介紹各種Deep Learning技術 深入介紹各種Reinforcement Learning技術 深入介紹Probabilistic Graphical Model技術 不定時提供讀書筆記 讓我們一起在未
Thumbnail
這篇文章介紹瞭如何利用生成式AI(GenAI)來提高學習效率,包括文章重點整理、完善知識體系、客製化學習回饋、提供多元觀點等方法。同時提醒使用者應注意內容的信效度,保持學術誠信,適當運用GenAI能大幅提升工作效率。
Thumbnail
延續上週提到的,「有哪些不訓練模型的情況下,能夠強化語言模型的能力」,這堂課接續介紹其中第 3、4 個方法