vocus logo

方格子 vocus

OCR 圖像識別測試

更新 發佈閱讀 3 分鐘

OCR,全名為光學字元辨識(Optical Character Recognition),是一種將圖像中的文字轉換為可編輯的數位文字的技術。實際上現在在實用上已經非常普遍,如停車場的車牌識別等等。

raw-image


「bot.學習.人」有時因為出差常跑國外,對於韓文日文和泰文,可是不懂又不懂,想想能不能利用自己的專長,做一個拍照識別的bot 呢?在網路上尋找了一下,發現 OCR Space 還蠻好用的,實測了一次也很容易,準確度也高,不過免費的似乎有點限制,至少沒有一些東南亞語言,所以就放棄了。

後來問了Gemini AI, 才知道Google 本身也有提供OCR, 只是檔案要先存在Google drive 裏。用app script 寫了函數如下:

function ocrFromGoogleDrive(fileId) {
  // 1. 使用 DriveApp 服務取得檔案物件
  var file = DriveApp.getFileById(fileId);
  file.setSharing(DriveApp.Access.ANYONE_WITH_LINK, DriveApp.Permission.VIEW);
  // 2. 準備要傳給 API 的資源物件
  var resource = {
    title: file.getName()
  };
  // 3. 透過 Drive API Advanced Service 執行 OCR讓 Google 自動偵測語言
  var newFile = Drive.Files.insert(resource, file.getBlob(), {
    ocr: true
  });
  // 4. 開啟轉換後的 Google 文件,讀取文字
  var doc = DocumentApp.openById(newFile.id);
  var text = doc.getBody().getText();
  // 5. 處理完畢後,刪除暫時產生的 Google Doc 檔案
  Drive.Files.remove(newFile.id);
  return text;
}

如此,提供在Google drive裏的file id 給函數,就會回傳圖片上的文字了。「bot.學習.人」親試了一下,對韓文、日文、泰文翻譯的還可以哦。

留言
avatar-img
bot.學習.人的沙龍
2會員
55內容數
2025/07/27
先提供機器人的連結 「bot.學習.人」作為一位經驗豐富的telegram使用者及機器人開發者,發現在telegram的社群中,充斥著各種資訊,有時難免會出現不雅言論、詐騙訊息,甚至有心人士利用改名來偽裝群組的知名人士在私下詐騙。為了解決這些問題,「bot.學習.人」設計並開發了這款機器人,它
Thumbnail
2025/07/27
先提供機器人的連結 「bot.學習.人」作為一位經驗豐富的telegram使用者及機器人開發者,發現在telegram的社群中,充斥著各種資訊,有時難免會出現不雅言論、詐騙訊息,甚至有心人士利用改名來偽裝群組的知名人士在私下詐騙。為了解決這些問題,「bot.學習.人」設計並開發了這款機器人,它
Thumbnail
2025/07/22
GNEWS API 是一個很不錯的新聞API,內有提供免費的額度,每天100個request,已經很夠「bot.學習.人」自己使用。 裏面也有不少的台灣新聞,[bot.學習.人」最早使用它的原因,是因為平常有在看上市公司的新聞,想說是不是可以用新聞api 捕捉到一些新聞,但是一直沒找到好的api,
Thumbnail
2025/07/22
GNEWS API 是一個很不錯的新聞API,內有提供免費的額度,每天100個request,已經很夠「bot.學習.人」自己使用。 裏面也有不少的台灣新聞,[bot.學習.人」最早使用它的原因,是因為平常有在看上市公司的新聞,想說是不是可以用新聞api 捕捉到一些新聞,但是一直沒找到好的api,
Thumbnail
2025/07/11
「bot.學習.人」上網尋找了telegram 群組搜尋的幾個工具,介紹給大家:
Thumbnail
2025/07/11
「bot.學習.人」上網尋找了telegram 群組搜尋的幾個工具,介紹給大家:
Thumbnail
看更多
你可能也想看
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
本文分析導演巴里・柯斯基(Barrie Kosky)如何運用極簡的舞臺配置,將布萊希特(Bertolt Brecht)的「疏離效果」轉化為視覺奇觀與黑色幽默,探討《三便士歌劇》在當代劇場中的新詮釋,並藉由舞臺、燈光、服裝、音樂等多方面,分析該作如何在保留批判核心的同時,觸及觀眾的觀看位置與人性幽微。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
5 月將於臺北表演藝術中心映演的「2026 北藝嚴選」《海妲・蓋柏樂》,由臺灣劇團「晃晃跨幅町」製作,本文將以從舞台符號、聲音與表演調度切入,討論海妲・蓋柏樂在父權社會結構下的困境,並結合榮格心理學與馮.法蘭茲對「阿尼姆斯」與「永恆少年」原型的分析,理解女人何以走向精神性的操控、毀滅與死亡。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
《轉轉生》(Re:INCARNATION)為奈及利亞編舞家庫德斯.奧尼奎庫與 Q 舞團創作的當代舞蹈作品,結合拉各斯街頭節奏、Afrobeat/Afrobeats、以及約魯巴宇宙觀的非線性時間,建構出關於輪迴的「誕生—死亡—重生」儀式結構。本文將從約魯巴哲學概念出發,解析其去殖民的身體政治。
Thumbnail
AI繪圖要廣泛用於商用還有一大段路,還需要依賴人類的經驗判斷、調整,為什麼呢?
Thumbnail
AI繪圖要廣泛用於商用還有一大段路,還需要依賴人類的經驗判斷、調整,為什麼呢?
Thumbnail
AnyText是一款先進的圖像AI工具,利用深度學習技術,根據你輸入的文字描述生成圖像,更棒的是,它能生成繁體中文,而且能指定文字生成的位置。
Thumbnail
AnyText是一款先進的圖像AI工具,利用深度學習技術,根據你輸入的文字描述生成圖像,更棒的是,它能生成繁體中文,而且能指定文字生成的位置。
Thumbnail
🚀 正在為翻譯掃描書籍PDF而苦惱嗎?🧐 使用 PDFtoPDF.ai,輕鬆將圖片轉換為文字並翻譯!對於需要快速參考和理解外文文本的學生來說,非常完美。透過高精度OCR和簡便的翻譯工具,提升你的學術工作效率。📚✨
Thumbnail
🚀 正在為翻譯掃描書籍PDF而苦惱嗎?🧐 使用 PDFtoPDF.ai,輕鬆將圖片轉換為文字並翻譯!對於需要快速參考和理解外文文本的學生來說,非常完美。透過高精度OCR和簡便的翻譯工具,提升你的學術工作效率。📚✨
Thumbnail
  在 AI 應用中,圖像、語音、文字三種可以說是主要應用,其中我一直以來都是專注於圖像上的研究,對於另兩種僅止於淺嚐,接下來就往音訊上研究看看,先從入門級的Text-To-Speech (TTL) 入場並一個個嘗試其他類型的應用,那麼,就讓我們開始吧。
Thumbnail
  在 AI 應用中,圖像、語音、文字三種可以說是主要應用,其中我一直以來都是專注於圖像上的研究,對於另兩種僅止於淺嚐,接下來就往音訊上研究看看,先從入門級的Text-To-Speech (TTL) 入場並一個個嘗試其他類型的應用,那麼,就讓我們開始吧。
Thumbnail
在學習描寫文的過程中,將思維視覺化是一個重要的教學策略。通過使用AI生成圖片功能,教師能夠幫助學生將抽象的描述轉化為具體的圖像。
Thumbnail
在學習描寫文的過程中,將思維視覺化是一個重要的教學策略。通過使用AI生成圖片功能,教師能夠幫助學生將抽象的描述轉化為具體的圖像。
Thumbnail
針對辨識物的不同,流程就會不一樣,在依照現實狀況進行刪減,以下說明為個人常用的流程。 基本流程: 讀圖 灰階 濾波 (看圖片雜訊多不多) 二值化 連通區域 特徵篩選 特徵資訊 辨識 - (OCR,量測,瑕疵檢測等。) 名詞介紹 Gray 灰階 將原始的彩色圖像轉換為灰階圖
Thumbnail
針對辨識物的不同,流程就會不一樣,在依照現實狀況進行刪減,以下說明為個人常用的流程。 基本流程: 讀圖 灰階 濾波 (看圖片雜訊多不多) 二值化 連通區域 特徵篩選 特徵資訊 辨識 - (OCR,量測,瑕疵檢測等。) 名詞介紹 Gray 灰階 將原始的彩色圖像轉換為灰階圖
Thumbnail
點陣圖 點陣圖是由許多方格像素組成的圖片, 因此我們常常在將圖片放大時會呈現像是馬賽克的狀況, 假設期望圖片越清晰那所需要的像素會較多個, 因此空間耗用量也相對較大。 常見的格式有: .JPG .PNG .GIF .BMP .TIFF等格式。 繪製程式碼: 向量圖 向量
Thumbnail
點陣圖 點陣圖是由許多方格像素組成的圖片, 因此我們常常在將圖片放大時會呈現像是馬賽克的狀況, 假設期望圖片越清晰那所需要的像素會較多個, 因此空間耗用量也相對較大。 常見的格式有: .JPG .PNG .GIF .BMP .TIFF等格式。 繪製程式碼: 向量圖 向量
Thumbnail
我们在熟练地使用另一种“写”的能力,可以理解成打字的能力,在屏幕上绘制并辨识的能力,并且真的创造出巨量的模拟物。
Thumbnail
我们在熟练地使用另一种“写”的能力,可以理解成打字的能力,在屏幕上绘制并辨识的能力,并且真的创造出巨量的模拟物。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News