Tesseract OCR - 繁體中文【安裝篇】

閱讀時間約 3 分鐘
GitHub
Tesseract OCRtesseract-ocr/tesseract: Tesseract Open Source OCR Engine (main repository) (github.com)
Tesseract User ManualTesseract User Manual | tessdoc (tesseract-ocr.github.io)
How to train LSTM Tesseracttessdoc/TrainingTesseract-5.md at main ·tesseract-ocr/tessdoc (github.com)
  • 作業系統:win10
  • 版本訊息-命令提示字元(cmd)
C:\Users\user>tesseract --version
tesseract v5.0.1.20220118
 leptonica-1.78.0
  libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.3) : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.3.0
 Found AVX2
 Found AVX
 Found FMA
 Found SSE4.1
 Found libarchive 3.5.0 zlib/1.2.11 liblzma/5.2.3 bz2lib/1.0.6 liblz4/1.7.5 libzstd/1.4.5
 Found libcurl/7.77.0-DEV Schannel zlib/1.2.11 zstd/1.4.5 libidn2/2.0.4 nghttp2/1.31.0

一、安裝tesseract-ocr

二、安裝opencv-python【可略】

python --version
pip install opencv-python
pip install pytesseract
命令提示字元(cmd)

三、安裝語言包tessdata_best

下載:chi_tra.traineddata
貼至(預設路徑):C:\Program Files\Tesseract-OCR\tessdata

四、環境配置

新增【TESSDATA_PREFIX】環境變數
  • C:\Program Files\Tesseract-OCR\tessdata
新增【TESSDATA_PREFIX】環境變數
環境變數PATH 新增
  • C:\Program Files\Tesseract-OCR\tessdata
  • C:\Program Files\Tesseract-OCR
環境變數PATH 新增

五、確認tesseract是否安裝成功

命令提示字元:tesseract
版本: tesseract --version
列出語言包:tesseract --list-langs
命令提示字元
備註:環境變數更動後須重新開機才會啟用設定
為什麼會看到廣告
6會員
46內容數
這是新手寫給新手的學習程式語言基礎教學筆記,內容會以C++為主
留言0
查看全部
發表第一個留言支持創作者!
匿名李的沙龍 的其他內容
二維陣列轉一維陣列 (C++)
閱讀時間約 1 分鐘
三維陣列轉一維陣列 (C++)
閱讀時間約 1 分鐘
Vector (C++)
閱讀時間約 5 分鐘
三角函數 (C++)
閱讀時間約 1 分鐘
承諾升級與沉沒成本
閱讀時間約 1 分鐘
營收成長率(YOY、QOQ、MOM)
閱讀時間約 1 分鐘
你可能也想看
如何利用OCR技術提高PDF文檔處理效率學習如何將掃描的PDF轉換為可搜索文本,並高效管理和查找文件。探索先進的OCR技術如何提升文檔處理效率。
Thumbnail
avatar
leqi.ai
2024-06-11
[OCR][Python]測試tesseract與easyOCR誰比較準跟快平時都在用tesseract來辨識OCR的部分,在網路上也常常聽說easyOCR比tesseract好用,就拿之前測試的OCR素材來比較看看囉。 以下輸入同樣圖片直接測試,並非絕對誰就比較準,只單純測試數字含英文的部分。 圖片素材就是15碼(英文加數字),檔名為OCR正確結果
Thumbnail
avatar
螃蟹_crab
2024-06-01
What is OCR? Discover the Advantages and Applications of OCROCR (Optical Character Recognition) technology revolutionizes the conversion of texts from physical documents into digital data, enhancing processing
avatar
Anice H.
2024-05-14
[OCR_應用]Tesseract-OCR_Config說明Google Tesseract Config說明,程式範例實際修改示範 前言 Tesseract 的 config 檔案用於指定 OCR 引擎的設定和參數。這些參數可以影響文本識別的結果 本文將彙整常用參數調整,並呈現不同參數出現不同的辨識結果 官網Tesseract OCR參數說明連結
Thumbnail
avatar
螃蟹_crab
2024-01-06
[OCR_應用]Tesseract-OCR_擷取字元面積使用Google Tesseract應用,擷取圖像的OCR並將讀取到的字元標註在原圖上 光學字元辨識功能 (Optical character recognition,光學字符辨識) 可以將影像中特徵範圍內的文本轉換為數字形式的文本。使用前必須安装Google Tesseract並更新
Thumbnail
avatar
螃蟹_crab
2024-01-06
阿姨時代:繁體中文的新字體,差點唸不出來 Day 47 / 365 芫荽 ㄩㄢ‘ ㄙㄨㄟ - 繖形科「胡荽」的別名。也稱為「香菜」、「香荽」。 - 芫荽在台灣各地栽培普遍,台灣全島各地均有栽培。 - 邰智源很討厭的植物。 - 台南到處可見。 - 還好我會講台語。 Shopping Design 的介紹:按這裡 字體「芫荽」:按此下載
Thumbnail
avatar
吳姓主筆
2022-02-16
激情(珍奈‧溫特森魔幻寫實小說代表作,首見繁體中文譯本)《柳橙不是唯一的水果》、《正常就好,何必快樂?》作者珍奈‧溫特森 「坦誠檢視愛、熱情、慾望」的魔幻寫實小說代表作 首見繁體中文譯本 在一個奇蹟與日常相互碰撞的世界裡, 在愛和絕望之間,在恐懼與慾望之間, 激情存在。
Thumbnail
avatar
臉譜出版
2022-02-14
[懷舊遊戲週報 2021/11-1]《復活邪神2》繁體中文版發售日確認等[懷舊遊戲週報 2021/11-1] 懷舊遊戲週報收集每週與懷舊遊戲相關的新訊,預定每週五出刊。 本週主要的消息包含: ‧《復活邪神2》繁體中文版發售日確認 ‧《Eschatos》將推出 Switch 版 ‧FC/NES開發技術講解影片...等其他資訊
Thumbnail
avatar
低分少年
2021-11-05
《空橋上的少年》簡體中文版相關資料這是關於兩個人的故事,也是關於兩個地方的故事。十七歲的高中生張朋城,一個有著心理困境的少年。他每天往返於某醫院的青少年日間病房,一個像是學校的地方。這裡每天都有新的病患加入或是離開,但他卻是永恆的「班長」,他甚至不知道自己是否還想回到學校。直到他遇見新來的醫師蔡伯鑫。少年漸漸發現,蔡醫師的心…
Thumbnail
avatar
蔡伯鑫
2021-10-11