🚀 PaddleOCR Windows TextRecognition安裝與執行教學

螃蟹_crab

發佈於[Python][OpenCV]學習心得筆記

2025/09/24 更新2025/09/24 發佈閱讀 5 分鐘

適合：Windows 10/11、Python 3.9~3.12

測試環境paddleocr==3.2.0、paddlepaddle==3.

使用 TextRecognition 文字辨識模型

以下參考官網

1️⃣ 建立與啟動虛擬環境

建議用 virtualenv 或 conda（避免污染全域環境）

用 Python venv

# 1. 打開 CMD 或 PowerShell
cd D:\WPy64-312101_new

# 2. 建立虛擬環境 (這裡命名為 myenv)
python -m venv myenv

# 3. 啟動環境
myenv\Scripts\activate

啟動成功後，命令列前面會看到 (myenv)。

2️⃣ 安裝 PaddleOCR 與必要套件

CPU 使用者（最簡單）

pip install --upgrade pip setuptools wheel
pip install paddlepaddle==3.2.0 -i https://mirror.baidu.com/pypi/simple
pip install paddleocr==3.2.0

💡 如果要用 GPU，需安裝對應 CUDA 版本的 paddlepaddle-gpu（官方安裝文件：https://www.paddlepaddle.org.cn/install/quick ）

其他常用依賴（可選）

pip install opencv-contrib-python pillow numpy pandas shapely pyclipper

3️⃣ 下載或指定模型路徑

PaddleOCR 會自動下載官方模型，但你也可以自己放模型。

程式碼用到：

det_model_dir = r"D:\WPy64-312101_new\myenv\PP-OCRv5_server_rec_infer"

這個資料夾放有 inference.pdiparams、inference.pdmodel 等模型檔案。
若沒有，執行時會自動下載；或到 PaddleOCR 官方模型頁面手動下載。模型列表：https://github.com/PaddlePaddle/PaddleOCR/blob/release/3.2/doc/doc_en/models_list_en.md

4️⃣ 執行範例程式碼

把下列存成 test_ocr.py，放在你的虛擬環境中。

# test_ocr.py
from paddleocr import TextRecognition

# 指定模型資料夾（建議放官方下載的模型路徑）
det_model_dir = r"D:\WPy64-312101_new\myenv\PP-OCRv5_server_rec_infer"

# 建立辨識模型
model = TextRecognition(model_name="PP-OCRv5_server_rec", model_dir=det_model_dir)

# 測試圖片路徑
img_path = r"D:\WPy64-312101_new\myenv\PP-OCRv5_server_rec_infer\general_ocr_rec_001.png"

def main_test(img_path):
    output = model.predict(input=img_path)
    for res in output:
        print(type(res))           # dict
        print(res['rec_text'])     # 文字辨識結果

if __name__ == "__main__":
    main_test(img_path)

執行：

python test_ocr.py

成功後會輸出類似：

<class 'dict'>
Hello World
<class 'str'>

#OCR

#PaddleOCR

#TextRecognition

螃蟹_crab的沙龍[Python][OpenCV]學習心得筆記AOI開發應用

留言

螃蟹_crab的沙龍

164會員

320內容數

本業是影像辨識軟體開發，閒暇時間進修AI相關內容，將學習到的內容寫成文章分享。興趣是攝影，踏青，探索未知領域。人生就是不斷的挑戰及自我認清，希望老了躺在床上不會後悔自己什麼都沒做。

螃蟹_crab的沙龍的其他內容

2025/09/24

[Python]Tesseract 5 與PaddleOCR v5比較

單純比較單行文字的結果 PaddleOCR 辨識率及速度就高好多，資料集為英文加數字詳細比較結果 PaddleOCR只有少數O跟0會誤判 1. Tesseract 的 AI 模型版本差異 Tesseract 3 以前：主要是傳統 OCR（字元切割 → 模板匹配/分類器）。

2025/09/24

[Python]Tesseract 5 與PaddleOCR v5比較

2025/06/20

[Python]偵測線寬來判斷有無輕微斷字

在工業視覺、文字辨識、或醫學影像中，我們常常需要對物件的線條進行寬度一致性分析。本篇文章將深入解析一段實作程式碼，這段程式會針對輸入的二值影像區塊，執行：骨架化（Skeletonization）距離轉換（Distance Transform）線寬統計分析（Mean, Std, CV 等

2025/06/20

[Python]偵測線寬來判斷有無輕微斷字

2025/04/01

[Python][OpenCV]斷字檢測：基於文字端點距離的檢測方法

1. 概述在光學字符識別（OCR）過程中，常見的問題之一是「斷字」，即原本應為一個完整字符的部分被錯誤地分割成兩個或多個獨立的字符。這通常發生在掃描文件、圖像降噪或影像二值化處理後。本篇文章將介紹一種基於骨架化端點距離分析的斷字檢測方法，並提供完整的 Python 實作。 2. 斷字檢測的

2025/04/01

[Python][OpenCV]斷字檢測：基於文字端點距離的檢測方法

看更多

你可能也想看

哈斯的煉金工房

投資海外市場就選玉山證券！！玉山證券「小額債」體驗分享 ⛰️

對於害怕風險、擔心賠錢的投資新手，本文介紹債券投資的優勢，說明其風險相對可控、能定期領息的特性，並介紹玉山「小額債」如何以低門檻（1,000美元/澳幣起）提供投資者參與海外債市的機會，強調其低波動、固定收益的友善特點，適合有明確時間目標的資金規劃。

#理財#債券#報酬

2026/02/11

哈斯的煉金工房

投資海外市場就選玉山證券！！玉山證券「小額債」體驗分享 ⛰️

#理財#債券#報酬

2026/02/11

理財好好玩

【一位CFP的日常】打造穩定現金流，不必冒進：小額債的投資思維

本文深入探討債券投資的本質、常見迷思、風險控制方法，並詳細介紹玉山證券「小額債」平臺的特色與優勢，包括低門檻、24hr即時報價、精準篩選等，幫助投資人建立理性、有紀律的債券投資策略，打造穩定的現金流，讓金錢成為財務上的助力。

#CFP#投資#財務

2026/03/13

理財好好玩

【一位CFP的日常】打造穩定現金流，不必冒進：小額債的投資思維

#CFP#投資#財務

2026/03/13

黛•Adele的生活隨筆

自由工作者的理財筆記｜第一次嘗試小額債就上手，打造多元資產配置｜玉山證券小額債券

自由工作者收入不穩定，適合選擇穩健的小額債做資產配置。玉山證券小額債最低一千美金就能開始，支援 24 小時委託下單與即時報價，並提供多條件篩選找到適合的債券。本文分享我的操作體驗與為何小額債能成為自由工作者的安心配置。

#小額債#玉山證券#債券投資

2026/02/10

黛•Adele的生活隨筆

自由工作者的理財筆記｜第一次嘗試小額債就上手，打造多元資產配置｜玉山證券小額債券

#小額債#玉山證券#債券投資

2026/02/10

艾比小劇場

不用每天盯盤，也能讓資產慢慢長大

為什麼「小額債券」會成為越來越多人關注的選項？如果你跟我一樣，經歷過股市大漲的甜、也嚐過劇烈修正的苦，大概就會慢慢明白一件事—— 投資，不只是追求報酬，更是關於「穩定感」。很多投資新手一開始進市場，很容易把全部資金都丟進股票，漲的時候很快樂，跌的時候卻發現自己根本睡不好。這

2026/03/14

2026/03/14

[OpenCV][Python]OCR分割及增加間隔[雙排文字]

呈上篇文章，針對單排的圖像文字增加間隔，但如果文字是雙排呢 [OpenCV][Python]OCR分割及增加間隔[單排文字]

#OCR分割及增加間隔#OCR分割#圖像文字增加間隔

2024/07/24

螃蟹_crab的沙龍

[OpenCV][Python]OCR分割及增加間隔[雙排文字]

呈上篇文章，針對單排的圖像文字增加間隔，但如果文字是雙排呢 [OpenCV][Python]OCR分割及增加間隔[單排文字]

#OCR分割及增加間隔#OCR分割#圖像文字增加間隔

2024/07/24

螃蟹_crab的沙龍

[OpenCV][Python]印出圖像中文字的位置及高寬

本文將說明如何去辨識出圖片文字位置及高寬。

#文字的位置及高寬#OCR#OpenCV

2024/07/24

螃蟹_crab的沙龍

[OpenCV][Python]印出圖像中文字的位置及高寬

本文將說明如何去辨識出圖片文字位置及高寬。

#文字的位置及高寬#OCR#OpenCV

2024/07/24

typedef struct 隨筆記{

wsl2中架設tensorflowGPU環境

牽涉到的工具:wsl2 + anaconda + jupyter-nootbook

#機器學習#tensorflow

2024/07/23

typedef struct 隨筆記{

wsl2中架設tensorflowGPU環境

牽涉到的工具:wsl2 + anaconda + jupyter-nootbook

#機器學習#tensorflow

2024/07/23

螃蟹_crab的沙龍

[Python]使用NumPy 進行影像黑白反轉

在某些特殊情況下，需要將圖片進行黑白反轉，例如Tesseract(OCR辨識引擎)就有建議黑底白字的狀況下辨識率較高。本文將使用 NumPy 進行影像黑白反轉，並顯示反轉前後的影像。

#NumPy#Python#黑白影像反轉

2024/07/18

螃蟹_crab的沙龍

[Python]使用NumPy 進行影像黑白反轉

#NumPy#Python#黑白影像反轉

2024/07/18

阿Han的沙龍

【🆓 語音辨識引擎sherpa-onnx CPU上篇】讓您輕鬆體驗語音辨識功能(Docker架設)

還記得我們之前介紹過「【Google Colab Python系列】初探Whisper: 來一段Youtube影片進行語音辨識吧！」這套語音辨識引擎，那為什麼我們又要教這一套? 因為我們也可以將whisper的模型轉換成onnx的格式，輕鬆移植到各種平台，且效能更佳。語音辨識的熱門組件之

#sherpa#語音辨識#asr

2024/07/02

阿Han的沙龍

【🆓 語音辨識引擎sherpa-onnx CPU上篇】讓您輕鬆體驗語音辨識功能(Docker架設)

#sherpa#語音辨識#asr

2024/07/02

螃蟹_crab的沙龍

[Python]使用pyttsx3將文字轉語音

本文利用pyqt5，使用pyttsx3將QLineEdit(單行輸入框)的字串，轉成語音呈現出來。

#文字轉語音#python#pyttsx3

2024/06/22

螃蟹_crab的沙龍

[Python]使用pyttsx3將文字轉語音

本文利用pyqt5，使用pyttsx3將QLineEdit(單行輸入框)的字串，轉成語音呈現出來。

#文字轉語音#python#pyttsx3

2024/06/22

螃蟹_crab的沙龍

[Python]使用SpeechRecognition進行語音辨識

本文主要使用SpeechRecognition來做一個簡單的語音辨識，使用pyqt5介面呈現。按下Start Recording，開始錄音，並顯示請開始說話。然後按鈕名改名Stop 在按下Stop Recording，稍等片刻後就會呈現出辨識結果程式範例 import sys i

#Python#語音辨識#SpeechRecognition

2024/06/22

螃蟹_crab的沙龍

[Python]使用SpeechRecognition進行語音辨識

#Python#語音辨識#SpeechRecognition

2024/06/22

果農的沙龍

如何用Python篩選每個人的第一筆紀錄？

用Python篩選每個人的第一筆紀錄

#python#資料分析#數據分析

2024/06/14

果農的沙龍

如何用Python篩選每個人的第一筆紀錄？

用Python篩選每個人的第一筆紀錄

#python#資料分析#數據分析

2024/06/14

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News