即時精選

🚀 PaddleOCR Windows TextRecognition安裝與執行教學

更新 發佈閱讀 5 分鐘

適合:Windows 10/11、Python 3.9~3.12

測試環境paddleocr==3.2.0paddlepaddle==3.

使用 TextRecognition 文字辨識模型

以下參考官網


1️⃣ 建立與啟動虛擬環境

建議用 virtualenv 或 conda(避免污染全域環境)

用 Python venv

# 1. 打開 CMD 或 PowerShell
cd D:\WPy64-312101_new

# 2. 建立虛擬環境 (這裡命名為 myenv)
python -m venv myenv

# 3. 啟動環境
myenv\Scripts\activate

啟動成功後,命令列前面會看到 (myenv)


2️⃣ 安裝 PaddleOCR 與必要套件

CPU 使用者(最簡單)

pip install --upgrade pip setuptools wheel
pip install paddlepaddle==3.2.0 -i https://mirror.baidu.com/pypi/simple
pip install paddleocr==3.2.0

💡 如果要用 GPU,需安裝對應 CUDA 版本的 paddlepaddle-gpu(官方安裝文件:https://www.paddlepaddle.org.cn/install/quick

其他常用依賴(可選)

pip install opencv-contrib-python pillow numpy pandas shapely pyclipper

3️⃣ 下載或指定模型路徑

PaddleOCR 會自動下載官方模型,但你也可以自己放模型。

程式碼用到:

det_model_dir = r"D:\WPy64-312101_new\myenv\PP-OCRv5_server_rec_infer"

這個資料夾放有 inference.pdiparamsinference.pdmodel 等模型檔案。

raw-image
若沒有,執行時會自動下載;或到 PaddleOCR 官方模型頁面手動下載。 模型列表:https://github.com/PaddlePaddle/PaddleOCR/blob/release/3.2/doc/doc_en/models_list_en.md

4️⃣ 執行範例程式碼

把下列存成 test_ocr.py,放在你的虛擬環境中。

# test_ocr.py
from paddleocr import TextRecognition

# 指定模型資料夾(建議放官方下載的模型路徑)
det_model_dir = r"D:\WPy64-312101_new\myenv\PP-OCRv5_server_rec_infer"

# 建立辨識模型
model = TextRecognition(model_name="PP-OCRv5_server_rec", model_dir=det_model_dir)

# 測試圖片路徑
img_path = r"D:\WPy64-312101_new\myenv\PP-OCRv5_server_rec_infer\general_ocr_rec_001.png"

def main_test(img_path):
output = model.predict(input=img_path)
for res in output:
print(type(res)) # dict
print(res['rec_text']) # 文字辨識結果

if __name__ == "__main__":
main_test(img_path)

執行:

python test_ocr.py

成功後會輸出類似:

<class 'dict'>
Hello World
<class 'str'>
留言
avatar-img
留言分享你的想法!
avatar-img
螃蟹_crab的沙龍
153會員
300內容數
本業是影像辨識軟體開發,閒暇時間進修AI相關內容,將學習到的內容寫成文章分享。 興趣是攝影,踏青,探索未知領域。 人生就是不斷的挑戰及自我認清,希望老了躺在床上不會後悔自己什麼都沒做。
螃蟹_crab的沙龍的其他內容
2025/09/24
單純比較單行文字的結果 PaddleOCR 辨識率及速度就高好多,資料集為英文加數字 詳細比較結果 PaddleOCR只有少數O跟0會誤判 1. Tesseract 的 AI 模型 版本差異 Tesseract 3 以前:主要是傳統 OCR(字元切割 → 模板匹配/分類器)。
Thumbnail
2025/09/24
單純比較單行文字的結果 PaddleOCR 辨識率及速度就高好多,資料集為英文加數字 詳細比較結果 PaddleOCR只有少數O跟0會誤判 1. Tesseract 的 AI 模型 版本差異 Tesseract 3 以前:主要是傳統 OCR(字元切割 → 模板匹配/分類器)。
Thumbnail
2025/06/20
在工業視覺、文字辨識、或醫學影像中,我們常常需要對物件的線條進行寬度一致性分析。本篇文章將深入解析一段實作程式碼,這段程式會針對輸入的 二值影像區塊,執行: 骨架化(Skeletonization) 距離轉換(Distance Transform) 線寬統計分析(Mean, Std, CV 等
Thumbnail
2025/06/20
在工業視覺、文字辨識、或醫學影像中,我們常常需要對物件的線條進行寬度一致性分析。本篇文章將深入解析一段實作程式碼,這段程式會針對輸入的 二值影像區塊,執行: 骨架化(Skeletonization) 距離轉換(Distance Transform) 線寬統計分析(Mean, Std, CV 等
Thumbnail
2025/04/01
1. 概述 在光學字符識別(OCR)過程中,常見的問題之一是「斷字」,即原本應為一個完整字符的部分被錯誤地分割成兩個或多個獨立的字符。這通常發生在掃描文件、圖像降噪或影像二值化處理後。本篇文章將介紹一種基於 骨架化端點距離分析 的斷字檢測方法,並提供完整的 Python 實作。 2. 斷字檢測的
Thumbnail
2025/04/01
1. 概述 在光學字符識別(OCR)過程中,常見的問題之一是「斷字」,即原本應為一個完整字符的部分被錯誤地分割成兩個或多個獨立的字符。這通常發生在掃描文件、圖像降噪或影像二值化處理後。本篇文章將介紹一種基於 骨架化端點距離分析 的斷字檢測方法,並提供完整的 Python 實作。 2. 斷字檢測的
Thumbnail
看更多
你可能也想看
Thumbnail
呈上篇文章,針對單排的圖像文字增加間隔,但如果文字是雙排呢 [OpenCV][Python]OCR分割及增加間隔[單排文字]
Thumbnail
呈上篇文章,針對單排的圖像文字增加間隔,但如果文字是雙排呢 [OpenCV][Python]OCR分割及增加間隔[單排文字]
Thumbnail
本文將說明如何去辨識出圖片文字​位置及高寬。
Thumbnail
本文將說明如何去辨識出圖片文字​位置及高寬。
Thumbnail
牽涉到的工具:wsl2 + anaconda + jupyter-nootbook
Thumbnail
牽涉到的工具:wsl2 + anaconda + jupyter-nootbook
Thumbnail
在某些特殊情況下,需要將圖片進行黑白反轉,例如Tesseract(OCR辨識引擎)就有建議黑底白字的狀況下辨識率較高。 本文將使用 NumPy 進行影像黑白反轉,並顯示反轉前後的影像。
Thumbnail
在某些特殊情況下,需要將圖片進行黑白反轉,例如Tesseract(OCR辨識引擎)就有建議黑底白字的狀況下辨識率較高。 本文將使用 NumPy 進行影像黑白反轉,並顯示反轉前後的影像。
Thumbnail
還記得我們之前介紹過「【Google Colab Python系列】 初探Whisper: 來一段Youtube影片進行語音辨識吧!」這套語音辨識引擎, 那為什麼我們又要教這一套? 因為我們也可以將whisper的模型轉換成onnx的格式, 輕鬆移植到各種平台, 且效能更佳。 語音辨識的熱門組件之
Thumbnail
還記得我們之前介紹過「【Google Colab Python系列】 初探Whisper: 來一段Youtube影片進行語音辨識吧!」這套語音辨識引擎, 那為什麼我們又要教這一套? 因為我們也可以將whisper的模型轉換成onnx的格式, 輕鬆移植到各種平台, 且效能更佳。 語音辨識的熱門組件之
Thumbnail
本文利用pyqt5,使用pyttsx3將QLineEdit(單行輸入框)的字串,轉成語音呈現出來。
Thumbnail
本文利用pyqt5,使用pyttsx3將QLineEdit(單行輸入框)的字串,轉成語音呈現出來。
Thumbnail
本文主要使用SpeechRecognition來做一個簡單的語音辨識,使用pyqt5介面呈現。 按下Start Recording,開始錄音,並顯示請開始說話。然後按鈕名改名Stop 在按下Stop Recording,稍等片刻後就會呈現出辨識結果​ 程式範例 import sys i
Thumbnail
本文主要使用SpeechRecognition來做一個簡單的語音辨識,使用pyqt5介面呈現。 按下Start Recording,開始錄音,並顯示請開始說話。然後按鈕名改名Stop 在按下Stop Recording,稍等片刻後就會呈現出辨識結果​ 程式範例 import sys i
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News