2. 準備資料集

發佈於計算機

更新於 2025/01/13發佈於 2025/01/13閱讀時間約 3 分鐘

抓圖&標記

沒別招，只能一張張把圖片抓下來，少說抓個幾百~幾千張吧。抓下來的圖可以用遞增數字當檔名。

大概像這樣把圖片存好

再來這步更麻煩，標記。

新增一個文字檔，或跟我一樣用 label.csv 都可以，然後把一張張圖片上的驗證碼正確答案記錄下來。

第 1 行對應到 1.jpg，第 N 行對應到 N.jpg

儘管步驟再簡單，只靠自己人工抓圖和標記，既耗時又煩悶，如何用程式抓圖、輔助標記，或是資料不夠多時怎麼訓練 AI，都是常見的議題，可以參考網路文章，或直接去問 AI。從這步驟應該能體會，擁有某領域大量或取得不易資料的企業，有多犯規了~

(對了，正如前篇讀者的分享，類似的專案已有人做過，網路上很容易找到整包標記好的資料集，真心建議有興趣的讀者去找找吧。系列文的目標是學習怎麼用 PyTorch 訓練 AI 模型，不用把時間花在抓圖跟標記。)

實作 MyDataset

新增一個 my_dataset.py 檔案，裡面定義 MyDataset class，如圖。

三個重點

MyDataset 繼承 torch.utils.data.Dataset
在 MyDataset 內定義 __len__ 函示，負責回傳 dataset 長度
在 MyDataset 內定義 __getitem__ 函示，負責讀圖

最後把剛剛的資料集 (dataset) 跟 my_dataset.py 放在 C:\my_pytorch_project\my_first_model 裡，大概像這樣

這樣就算完成了。

下一篇會開始實作 AI 模型，全連接神經網路，也就是上圖的 my_dnn.py。

系列文整理：

0. 從零開始，打造第一個 AI 模型 (序言)

1. 環境設定

2. 準備資料集

3. 實做全連接神經網路 (參數較多)

4. 實做捲積式神經網路 (參數較少)

留言

留言分享你的想法！

JN的沙龍

62會員

30內容數

個人網誌啦~ 內容包含但不限於學習筆記、心情抒發、火星廢文...

JN的沙龍的其他內容

2025/01/17

環弦歸一！島國花生農的神祕航線，與似曾相似的 Ring AllReduce 算法！

某天，某島國上的花生農老G，因為體力漸衰、氣候異常、地緣政治...等因素，種出的花生品質越來越不穩定，於是邀了其他島上的A格斯先生、高手B爾、阿國兄，四人一起組了個互助會...

2025/01/17

環弦歸一！島國花生農的神祕航線，與似曾相似的 Ring AllReduce 算法！

2025/01/13

6. 載入、使用模型

下圖為程式碼節錄把 output 印出來看，會發現有五組數字，每一組數字依序對應到驗證碼圖片

2025/01/13

6. 載入、使用模型

下圖為程式碼節錄把 output 印出來看，會發現有五組數字，每一組數字依序對應到驗證碼圖片

2025/01/13

5. 訓練、匯出模型

資料集有了，模型兜好了，再來可以開始訓練了。首先準備 train.py，下圖僅節錄部分程式碼。圖中包含了大部分的程式和註解，整段 code 也幾乎是公版了，建議簡單看過再自己融會貫通，有問題可以根據執行時的 error log 去解決，也可以留言討論。此時資料夾應該長這樣

2025/01/13

5. 訓練、匯出模型

看更多

你可能也想看

小愛和彤彤的小日常的沙龍

告別瞇眼寫功課！喜光TIONE⁺光健康智慧檯燈守護孩子視力

孩子寫功課時瞇眼？小心近視！這款喜光全光譜TIONE⁺光健康智慧檯燈，獲眼科院長推薦，網路好評不斷！全光譜LED、180cm大照明範圍、5段亮度及色溫調整、350度萬向旋轉，讓孩子學習更舒適、保護眼睛！

#方格新手#保護眼睛#閱讀

2025/06/21

小愛和彤彤的小日常的沙龍

告別瞇眼寫功課！喜光TIONE⁺光健康智慧檯燈守護孩子視力

#方格新手#保護眼睛#閱讀

2025/06/21

方格子 vocus 官方沙龍

徵才：創作者營運專員/經理（Operations Specialist）｜Creator Partnership 部門

創作者營運專員/經理（Operations Specialist/Manager）將負責對平台成長及收入至關重要的 Partnership 夥伴創作者開發及營運。你將發揮對知識與內容變現、影響力變現的精準判斷力，找到你心中的潛力新星或有聲量的中大型創作者加入 vocus。

#vocus#方格子#求職

2025/06/23

方格子 vocus 官方沙龍

徵才：創作者營運專員/經理（Operations Specialist）｜Creator Partnership 部門

#vocus#方格子#求職

2025/06/23

JayRay 的沙龍

【資料分析】python資料處理-特徵工程的使用時機與基礎操作語法彙整

特徵工程是機器學習中的核心技術，通過將原始數據轉換為有意義的特徵，以提升模型的準確性和穩定性。常見的特徵工程方法包括異常值檢測、特徵轉換、特徵縮放、特徵表示、特徵選擇和特徵提取。本文將深入探討這些方法的適用情況及具體實施流程，以幫助讀者有效利用特徵工程來優化機器學習模型表現。

#數據#模型#異常

2024/08/14

JayRay 的沙龍

【資料分析】python資料處理-特徵工程的使用時機與基礎操作語法彙整

#數據#模型#異常

2024/08/14

一世千銘

閒章6

最近AI的産圖越來越多，是時候開始整理了，隨機生成的廢圖基本上都清除了，剩下一堆感覺不差的挑一挑，只是數量有點多。

2024/08/04

一世千銘

閒章6

最近AI的産圖越來越多，是時候開始整理了，隨機生成的廢圖基本上都清除了，剩下一堆感覺不差的挑一挑，只是數量有點多。

2024/08/04

螃蟹_crab的沙龍

[深度學習]訓練VAE模型用於生成圖片_生成篇

本文將延續上一篇文章，經由訓練好的VAE模型其中的解碼器，來生成圖片。 [深度學習]訓練VAE模型用於生成圖片_訓練篇輸入產生的隨機雜訊，輸入VAE的解碼器後，生成的圖片

#深度學習#VAE模型#生成圖片

2024/07/25

螃蟹_crab的沙龍

[深度學習]訓練VAE模型用於生成圖片_生成篇

#深度學習#VAE模型#生成圖片

2024/07/25

柴郡貓姍蒂的沙龍

筆記-深度學習模型訓練：利用殘差網路做影像辨識

前言讀了許多理論，是時候實際動手做做看了，以下是我的模型訓練初體驗，有點糟就是了XD。正文 def conv(filters, kernel_size, strides=1): return Conv2D(filters, kernel_size,

#深度學習#AI#人工智慧

2024/07/23

柴郡貓姍蒂的沙龍

筆記-深度學習模型訓練：利用殘差網路做影像辨識

#深度學習#AI#人工智慧

2024/07/23

螃蟹_crab的沙龍

[OCR][Python]tesseract 4.0 辨識模型Fine tune

微調(Fine tune)是深度學習中遷移學習的一種方法，其中預訓練模型的權重會在新數據上進行訓練。本文主要介紹如何使用新的訓練圖檔在tesseract 辨識模型進行Fine tune 有關於安裝的部分可以參考友人的其他文章 Tesseract OCR - 繁體中文【安裝篇】將所有資料

#tesseract#OCR#python

2024/06/21

螃蟹_crab的沙龍

[OCR][Python]tesseract 4.0 辨識模型Fine tune

#tesseract#OCR#python

2024/06/21

凱文馬拉穆の雪橇犬星球

股癌EP458筆記整理(Marvell、Dell、AI）

事前聲明：我先說明我的筆記製作流程：在YT下載 >> 生成逐字稿 >> 利用 AI 整理條列式筆記 >> 人工整理我已經將逐字稿放上來分享在<<1+1罐罐 | 股癌筆記 + 股癌未校稿逐字稿>>，不過逐字稿多少會有錯，如果要使用請多注意。 <<1+1罐罐 | 股癌筆記 + 股癌未校稿逐

#市場#Dell#觀察

2024/06/01

凱文馬拉穆の雪橇犬星球

股癌EP458筆記整理(Marvell、Dell、AI）

#市場#Dell#觀察

2024/06/01

貓貓學習筆記

圖像風格轉換(二)-每次重訓練好麻煩

在第一篇我講到一開始的圖像風格轉換，每產生一張圖片都得重新訓練，這對於使用上難免綁手綁腳，所以理所當然的下一步就是要解決這個問題，看看能不能只要訓練一次，就可以重複使用。

#AI#StyleTransfer#Pytorch

2024/05/07

貓貓學習筆記

圖像風格轉換(二)-每次重訓練好麻煩

#AI#StyleTransfer#Pytorch

2024/05/07

子不語怪・力・亂・神

照片縫合AI圖

今天要聊聊一個我最近AI作圖時常用的手法，就是使用真實世界的照片拼接縫合進AI生產的圖片後，補完AI作圖常出現的缺陷（歪曲的武器、錯誤的肢體姿勢、手指錯誤）。使用這個方法，可以讓AI更貼近我所需要的完成圖，且少了很多用繪圖軟體修修補補的時間。

#StableDiffusion#AI#AI繪圖

2024/04/11

子不語怪・力・亂・神

照片縫合AI圖

#StableDiffusion#AI#AI繪圖

2024/04/11

阿Han的沙龍

【Python 軍火庫🧨 - EasyOCR】讓我們對圖片進行文字辨識吧

EasyOCR是一個能夠幫助你對圖片中的文字進行辨識的工具，透過進階分析，可以應用在文件掃描、自動化數據輸入、發票掃描等領域。本章節將介紹如何安裝、引用模型、進行文字辨識、以及辨識結果的分析。透過學習，你可以建立屬於自己的文字辨識系統。

#模型#GPU#文章

2024/02/20

阿Han的沙龍

【Python 軍火庫🧨 - EasyOCR】讓我們對圖片進行文字辨識吧

#模型#GPU#文章

2024/02/20

阿Han的沙龍

【Google Colab Python系列】視覺化資料Matplotlib 新手村

圖片來源相信視覺化報表對於資料科學來說是非常重要的一環，透過圖表來呈現資料的樣態，過程中分析模型訓練時，觀察訓練的收斂趨勢是否如我們預期，視覺化加速我們的判斷時間，節省找問題的成本。數據就如同鐵證一般，當我們常常苦於為什麼訓練出來的A模型這麼差勁，但B模型卻非常好，這中間發生了

#python#程式語言#matplotlib

2023/07/24

阿Han的沙龍

【Google Colab Python系列】視覺化資料Matplotlib 新手村

#python#程式語言#matplotlib

2023/07/24

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News