適合:Windows 10/11、Python 3.9~3.12
測試環境paddleocr==3.2.0
、paddlepaddle==3.
以下參考官網
1️⃣ 建立與啟動虛擬環境
建議用 virtualenv 或 conda(避免污染全域環境)
用 Python venv
# 1. 打開 CMD 或 PowerShell
cd D:\WPy64-312101_new
# 2. 建立虛擬環境 (這裡命名為 myenv)
python -m venv myenv
# 3. 啟動環境
myenv\Scripts\activate
啟動成功後,命令列前面會看到 (myenv)
。
2️⃣ 安裝 PaddleOCR 與必要套件
CPU 使用者(最簡單)
pip install --upgrade pip setuptools wheel
pip install paddlepaddle==3.2.0 -i https://mirror.baidu.com/pypi/simple
pip install paddleocr==3.2.0
💡 如果要用 GPU,需安裝對應 CUDA 版本的
paddlepaddle-gpu
(官方安裝文件:https://www.paddlepaddle.org.cn/install/quick )
其他常用依賴(可選)
pip install opencv-contrib-python pillow numpy pandas shapely pyclipper
3️⃣ 下載或指定模型路徑
PaddleOCR 會自動下載官方模型,但你也可以自己放模型。
程式碼用到:
det_model_dir = r"D:\WPy64-312101_new\myenv\PP-OCRv5_server_rec_infer"
這個資料夾放有
inference.pdiparams
、inference.pdmodel
等模型檔案。若沒有,執行時會自動下載;或到 PaddleOCR 官方模型頁面手動下載。 模型列表:https://github.com/PaddlePaddle/PaddleOCR/blob/release/3.2/doc/doc_en/models_list_en.md
4️⃣ 執行範例程式碼
把下列存成 test_ocr.py
,放在你的虛擬環境中。
# test_ocr.py
from paddleocr import TextRecognition
# 指定模型資料夾(建議放官方下載的模型路徑)
det_model_dir = r"D:\WPy64-312101_new\myenv\PP-OCRv5_server_rec_infer"
# 建立辨識模型
model = TextRecognition(model_name="PP-OCRv5_server_rec", model_dir=det_model_dir)
# 測試圖片路徑
img_path = r"D:\WPy64-312101_new\myenv\PP-OCRv5_server_rec_infer\general_ocr_rec_001.png"
def main_test(img_path):
output = model.predict(input=img_path)
for res in output:
print(type(res)) # dict
print(res['rec_text']) # 文字辨識結果
if __name__ == "__main__":
main_test(img_path)
執行:
python test_ocr.py
成功後會輸出類似:
<class 'dict'>
Hello World
<class 'str'>