電腦也能看懂圖片-善用AI的OCR能力

更新 發佈閱讀 3 分鐘
raw-image

好像還在4、5年前的時候,我們利用網路搜尋功能,搜尋資訊時多數還是以文字搜尋為主,很多時候如果我們對圖像資訊有疑問,通常我們接收資料後,必須在腦中轉化成文字內容再於瀏覽器的搜尋欄位輸出成文字。現在使用AI進行以圖搜尋的功能越來越普及了,如果能善加利用,肯定能夠增加工作上的效率!

OCR指的是Optical Character Recognition,是一項讓電腦能夠「讀懂」圖像中的文字,並將其轉換為可編輯、可搜尋的數位文字格式的技術,最普遍應用於日常生活中的情境應該就是停車場的車牌辨識系統,攝影機拍攝車牌內容後再上傳至系統進行文字辨識,建立停車資訊;另外像是申請金融服務時,部分應用程式也可以透過拍攝身分證卡面,經過系統辨識後,將很多繁瑣的內容自動填入欄位,減少不少的作業時間。

目前各家的大型語言模型,多數都已經有OCR的能力了,從最簡單的辨識文字,一直到菜單、海報甚至是單純的影像,都能夠將內容資訊進行蒐集,再依照我們的需求指令搜索資訊,而目前OCR的能力也已經再延伸到將辨識的內容應用於圖片生成(相關的應用在之前圖片生成功能的文章也有帶到)、影片生成的功能,發展速度之快。

raw-image

如果你是行政人員,免不了就是會有一些紙本文件,有時候要將內容建立成電子檔時,傳統手key會讓人發狂,現在可以拍個照上傳到語言模型,請他進行內容的全文輸出或是摘要。如果你是正在看原文書的同學,閱讀英文如果太過吃力,同樣也可以透過這種方式進行內容翻譯。如果你像我一樣是在學習AI應用的人,電腦操作時遇到不懂的內容也可以截圖下來,讓AI為你進行問題的分析與解說。

實在是有太多應用與發揮的場合了,以前遇到問題除了一開始要釐清問題,將關鍵字精準在google中搜尋,還要再將搜尋好的內容作整理以及分類,挑出合適自己問題的解答。現在的語言模型提供的內容幾乎等於一站式服務中心,就只要截圖上傳問問題就好,甚至不精準的問題AI還會另外進行詢問,還有可能幫你抓出其他有問題的內容。這麼好用的功能,如果還沒有使用過,推薦一定要試試看。

留言
avatar-img
園丁的AI練習手記
0會員
13內容數
觀賞植物種久了,怕與社會脫節。 抱著同時也對AI工具好奇的心態,將學到的事物記錄下來,也在平台上分享。
你可能也想看
Thumbnail
創作不只是個人戰,在 vocus ,也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」,現在有了更強大的新夥伴加入!除了大家熟悉的「官方主題沙龍」,這次我們徵召了 8 位領域各異的「個人主題專家」,將再度嘗試創作的各種可能,和格友們激發出更多未知的火花。
Thumbnail
創作不只是個人戰,在 vocus ,也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」,現在有了更強大的新夥伴加入!除了大家熟悉的「官方主題沙龍」,這次我們徵召了 8 位領域各異的「個人主題專家」,將再度嘗試創作的各種可能,和格友們激發出更多未知的火花。
Thumbnail
vocus 最具指標性的創作者社群──「野格團」, 2026 年春季,這支充滿專業、熱情的團隊再次擴編,迎來了 8 位實力堅強的「個人主題專家」新成員 💫💫💫 從投資理財、自我成長、閱讀書評到電影戲劇,他們各自帶著獨特的「創作超能力」準備在格友大廳與大家見面。
Thumbnail
vocus 最具指標性的創作者社群──「野格團」, 2026 年春季,這支充滿專業、熱情的團隊再次擴編,迎來了 8 位實力堅強的「個人主題專家」新成員 💫💫💫 從投資理財、自我成長、閱讀書評到電影戲劇,他們各自帶著獨特的「創作超能力」準備在格友大廳與大家見面。
Thumbnail
本文討論了在AI時代下我們需要具備的職能,例如提問力、判斷力和專業能力。同時也提到了在使用AI時需要注意的事情,以及一些問答希望可以跟讀者有所互動與交流。另外作者也分享了自己使用AI工具的心得,並期待可以幫助初學者更快地瞭解如何應對AI的基礎邏輯。
Thumbnail
本文討論了在AI時代下我們需要具備的職能,例如提問力、判斷力和專業能力。同時也提到了在使用AI時需要注意的事情,以及一些問答希望可以跟讀者有所互動與交流。另外作者也分享了自己使用AI工具的心得,並期待可以幫助初學者更快地瞭解如何應對AI的基礎邏輯。
Thumbnail
AI繪圖要廣泛用於商用還有一大段路,還需要依賴人類的經驗判斷、調整,為什麼呢?
Thumbnail
AI繪圖要廣泛用於商用還有一大段路,還需要依賴人類的經驗判斷、調整,為什麼呢?
Thumbnail
AnyText是一款先進的圖像AI工具,利用深度學習技術,根據你輸入的文字描述生成圖像,更棒的是,它能生成繁體中文,而且能指定文字生成的位置。
Thumbnail
AnyText是一款先進的圖像AI工具,利用深度學習技術,根據你輸入的文字描述生成圖像,更棒的是,它能生成繁體中文,而且能指定文字生成的位置。
Thumbnail
上圖是根據彩色故事腳本生成的照片與草圖。 運用圖生圖的原理,把AI視覺故事腳本的其中一個畫面。擷取出來。 輸入重新繪製這張圖片 AI 會自然根據草圖,重新繪製元素一樣的精細畫面。
Thumbnail
上圖是根據彩色故事腳本生成的照片與草圖。 運用圖生圖的原理,把AI視覺故事腳本的其中一個畫面。擷取出來。 輸入重新繪製這張圖片 AI 會自然根據草圖,重新繪製元素一樣的精細畫面。
Thumbnail
🚀 正在為翻譯掃描書籍PDF而苦惱嗎?🧐 使用 PDFtoPDF.ai,輕鬆將圖片轉換為文字並翻譯!對於需要快速參考和理解外文文本的學生來說,非常完美。透過高精度OCR和簡便的翻譯工具,提升你的學術工作效率。📚✨
Thumbnail
🚀 正在為翻譯掃描書籍PDF而苦惱嗎?🧐 使用 PDFtoPDF.ai,輕鬆將圖片轉換為文字並翻譯!對於需要快速參考和理解外文文本的學生來說,非常完美。透過高精度OCR和簡便的翻譯工具,提升你的學術工作效率。📚✨
Thumbnail
在學習描寫文的過程中,將思維視覺化是一個重要的教學策略。通過使用AI生成圖片功能,教師能夠幫助學生將抽象的描述轉化為具體的圖像。
Thumbnail
在學習描寫文的過程中,將思維視覺化是一個重要的教學策略。通過使用AI生成圖片功能,教師能夠幫助學生將抽象的描述轉化為具體的圖像。
Thumbnail
未來,針對圖片生成的 prompt engineering 可能會越來越不重要。
Thumbnail
未來,針對圖片生成的 prompt engineering 可能會越來越不重要。
Thumbnail
這篇文章介紹了 12 個超酷的免費 AI 工具,讓你讀書事半功倍,成績突飛猛進!從課堂筆記到科研論文,這些 AI 工具都能助你提高效率,增進學習成效。
Thumbnail
這篇文章介紹了 12 個超酷的免費 AI 工具,讓你讀書事半功倍,成績突飛猛進!從課堂筆記到科研論文,這些 AI 工具都能助你提高效率,增進學習成效。
Thumbnail
瞭解讓AI寫文章的好處,包括提高效率、快速獲取答案和資料整理
Thumbnail
瞭解讓AI寫文章的好處,包括提高效率、快速獲取答案和資料整理
Thumbnail
使用Google Tesseract應用,擷取圖像的OCR並將讀取到的字元標註在原圖上 光學字元辨識功能 (Optical character recognition,光學字符辨識) 可以將影像中特徵範圍內的文本轉換為數字形式的文本。使用前必須安装Google Tesseract並更新
Thumbnail
使用Google Tesseract應用,擷取圖像的OCR並將讀取到的字元標註在原圖上 光學字元辨識功能 (Optical character recognition,光學字符辨識) 可以將影像中特徵範圍內的文本轉換為數字形式的文本。使用前必須安装Google Tesseract並更新
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News