即時精選

6. 載入、使用模型

JN-avatar-img
發佈於計算機
更新於 發佈於 閱讀時間約 2 分鐘

使用 torch.load() 載入 my_cnn.pt,再用 model.load_state_dict() 把 my_cnn.pt 的參數導到 model,再來就可以開始使用 model 了。

下圖為程式碼節錄

raw-image


output 印出來看,會發現有五組數字,每一組數字依序對應到驗證碼圖片的五個文字。

每一組數字裡有 36 個分數,依序代表ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789 每一個字的可能性。

若第一組數字的36的分數中,第 1 個分數最高,代表 model 猜驗證碼第一個文字是 A。

若第一組數字的36的分數中,第 5 個分數最高,代表 model 猜驗證碼第一個文字是 E。

共五組,把五組分數最高的文字取出來,就是 model 猜的驗證碼了。


實驗範例:


🫣




系列文整理:

0. 從零開始,打造第一個 AI 模型 (序言)

1. 環境設定

2. 準備資料集

3. 實做 全連接神經網路 (參數較多)

4. 實做 捲積式神經網路 (參數較少)

5. 訓練、匯出模型

6. 載入、使用模型




avatar-img
62會員
29內容數
個人網誌啦~ 內容包含但不限於學習筆記、心情抒發、火星廢文...
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
JN的沙龍 的其他內容
資料集有了,模型兜好了,再來可以開始訓練了。 首先準備 train.py,下圖僅節錄部分程式碼。 圖中包含了大部分的程式和註解,整段 code 也幾乎是公版了,建議簡單看過再自己融會貫通,有問題可以根據執行時的 error log 去解決,也可以留言討論。 此時資料夾應該長這樣
不太確定捲積式神經網路 (CNN) 的精確定義,但大致上是用捲積層 (convolution layer) 取代 DNN 中的幾個全連接層 (fully connected layer),這些捲積層概念跟 feature filter 類似。 先大概有個概念就夠,實作時跟前一篇 DNN 一樣,這些
這篇會示範,只要稍微會寫 python,儘管對 AI 只有極淺的認識,也能輕易兜出一個,專家們眼中可能很白癡的 AI 模型。若題目不難、訓練資料夠多,這個白癡模型仍可以莫名其妙的變聰明。 全都的程式碼都在下圖,20行就能兜出一個全連層 (fully connected layer ) 組成的全
抓圖&標記 沒別招,只能一張張把圖片抓下來,少說抓個幾百~幾千張吧。抓下來的圖可以用遞增數字當檔名。 再來這步更麻煩,標記。 新增一個文字檔,或跟我一樣用 label.csv 都可以,然後把一張張圖片上的驗證碼正確答案記錄下來。 儘管步驟再簡單,只靠自己人工抓圖和標記,既耗時又煩
本文是以 Windows 電腦為主,但理論上 macOS 的步驟也差不多。 主要就兩個步驟 安裝 Python (我裝 3.12) 安裝 PyTorch
最近工作剛好有用到 PyTorch,由於僅止於些簡單的功能和除錯,事後對這個熱門的 AI 框架還是一知半解。想了下,如果連用 PyTorch 做個簡單的 AI 模型都辦不到,不就浪費了這段時間的接觸? 於是訂個簡單的題目並試著去完成,順手做個紀錄。內容非常初階,篇幅也不多,主要著重在...
資料集有了,模型兜好了,再來可以開始訓練了。 首先準備 train.py,下圖僅節錄部分程式碼。 圖中包含了大部分的程式和註解,整段 code 也幾乎是公版了,建議簡單看過再自己融會貫通,有問題可以根據執行時的 error log 去解決,也可以留言討論。 此時資料夾應該長這樣
不太確定捲積式神經網路 (CNN) 的精確定義,但大致上是用捲積層 (convolution layer) 取代 DNN 中的幾個全連接層 (fully connected layer),這些捲積層概念跟 feature filter 類似。 先大概有個概念就夠,實作時跟前一篇 DNN 一樣,這些
這篇會示範,只要稍微會寫 python,儘管對 AI 只有極淺的認識,也能輕易兜出一個,專家們眼中可能很白癡的 AI 模型。若題目不難、訓練資料夠多,這個白癡模型仍可以莫名其妙的變聰明。 全都的程式碼都在下圖,20行就能兜出一個全連層 (fully connected layer ) 組成的全
抓圖&標記 沒別招,只能一張張把圖片抓下來,少說抓個幾百~幾千張吧。抓下來的圖可以用遞增數字當檔名。 再來這步更麻煩,標記。 新增一個文字檔,或跟我一樣用 label.csv 都可以,然後把一張張圖片上的驗證碼正確答案記錄下來。 儘管步驟再簡單,只靠自己人工抓圖和標記,既耗時又煩
本文是以 Windows 電腦為主,但理論上 macOS 的步驟也差不多。 主要就兩個步驟 安裝 Python (我裝 3.12) 安裝 PyTorch
最近工作剛好有用到 PyTorch,由於僅止於些簡單的功能和除錯,事後對這個熱門的 AI 框架還是一知半解。想了下,如果連用 PyTorch 做個簡單的 AI 模型都辦不到,不就浪費了這段時間的接觸? 於是訂個簡單的題目並試著去完成,順手做個紀錄。內容非常初階,篇幅也不多,主要著重在...
你可能也想看
Google News 追蹤
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
在網路速度有限的情況下,依序記錄不斷產生的資訊,能統計使用者在頁面上操作了哪些功能。
在學習大語言模型的技術細節時, 弄清楚「輸入文本 Input Text」與「符元化文本 Tokenized Text」之間的差異會很方便[1]。 舉個具體的例子: 輸入文本:Hello, 你好. Obsidian is great! 符元化文本:['Hello', ',',
2024年6月11日晚上6點48分於洛杉磯, 我打算開始每天花點時間學習大語言模型的技術部分。 主要使用的教材是 Manning出版的Build a Large Language Model (From Scratch) [1]。 這本書有配套的code,還有詳細的講解,是我信賴的
※ Javascript和HTML的關係 當我們輸入新的網址或按下重新整理時,從解析檔案到畫面顯示出來,瀏覽器會進行以下流程: 解析 HTML / CSS 檔案,建立物件模型: HTML → DOM (Document Object Model)。 CSS → CSSOM (CSS Obje
Thumbnail
最近有專案需求要在 Web 上進行一個掃描條碼辨識的動作,做了一些功課,有 Open Source 方案跟商業解決方案,整理起來分享給大家。
今天就讓我們依照前一天的情境題,來撰寫測試案例函數吧! 先讓我們規畫擬訂測試案例: 測試案例 當使用者瀏覽文章清單頁時: 使用者可看到所有文章清單,也就是【文章清單API】要能確實將資料庫內的文章資料,筆數不多不少地回應出來。 當使用者瀏覽單一文章頁時: 使用者可看到該文章資料,也就是【
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
在網路速度有限的情況下,依序記錄不斷產生的資訊,能統計使用者在頁面上操作了哪些功能。
在學習大語言模型的技術細節時, 弄清楚「輸入文本 Input Text」與「符元化文本 Tokenized Text」之間的差異會很方便[1]。 舉個具體的例子: 輸入文本:Hello, 你好. Obsidian is great! 符元化文本:['Hello', ',',
2024年6月11日晚上6點48分於洛杉磯, 我打算開始每天花點時間學習大語言模型的技術部分。 主要使用的教材是 Manning出版的Build a Large Language Model (From Scratch) [1]。 這本書有配套的code,還有詳細的講解,是我信賴的
※ Javascript和HTML的關係 當我們輸入新的網址或按下重新整理時,從解析檔案到畫面顯示出來,瀏覽器會進行以下流程: 解析 HTML / CSS 檔案,建立物件模型: HTML → DOM (Document Object Model)。 CSS → CSSOM (CSS Obje
Thumbnail
最近有專案需求要在 Web 上進行一個掃描條碼辨識的動作,做了一些功課,有 Open Source 方案跟商業解決方案,整理起來分享給大家。
今天就讓我們依照前一天的情境題,來撰寫測試案例函數吧! 先讓我們規畫擬訂測試案例: 測試案例 當使用者瀏覽文章清單頁時: 使用者可看到所有文章清單,也就是【文章清單API】要能確實將資料庫內的文章資料,筆數不多不少地回應出來。 當使用者瀏覽單一文章頁時: 使用者可看到該文章資料,也就是【