免費開源的語音辨識功能：Cloudflare Workers AI + Whisper

Let's Write

2024/08/07 更新2024/08/07 發佈閱讀 1 分鐘

本篇要解決的問題

之前寫過二篇開源的語音辨識功能：

免費開源的語音辨識功能：Google Colab + Whisper large v3

免費開源的語音辨識功能：Google Colab + Faster Whisp er

這篇算是第三篇，是這幾天想調整一下 Cloudflare 上的設定時，看到有多了 Workers AI 的功能，點一點後意外發現的。

原本很開心的以為終於有個好操作的免費版可以使用，但實際使用時，發現 Workers AI 對檔案大小有限制，而且是超過 2MB 就會直接跳「AiError」不給辨識。

不能超過 2MB 的檔案？

想了一想，應該就只有短影音之類的了，所以覺得用 Workers AI 來語音辨識好像不怎麼實用。

只是都已經研究出使用方式了，就還是整理為本篇筆記文，期待以後會再放寬檔案大小的限制。

註冊 Cloudflare 帳號

Cloudflare 是佛心來的，免費帳號就可以擁有很多功能，包含今天這篇 Workers AI。

進到官方網站後，點右上角的「註冊」按鈕，就可以免費註冊：

https://www.cloudflare.com/zh-tw

開通 Speech to Text App 功能

註冊成功後，左側選單點擊「AI > Workers AI」，接著右側點擊「從 Worker 範本建立」：

方格子太難建立文章了，尤其是圖片無法直接用網址嵌入，懶得花時間搬，請直接看原文：
https://www.letswrite.tw/cloudflare-workers-ai-whisper/

#Cloudflare

#OpenAI

#Whisper

留言

Let's Write 的沙龍

9會員

19內容數

沙龍到底是…做什麼用的勒？

Let's Write 的沙龍的其他內容

2024/08/24

CodiumAI PR-Agent，在 GitLab 上用 AI 來 Code Review

了解如何在 GitLab 中設置和使用 CodiumAI PR-Agent 進行 AI Code Review，自動檢查和改進程式碼。本文提供詳細步驟，包括環境設置、提交必要檔案，以及如何使用 OpenAI API Key 進行配置。

2024/08/24

CodiumAI PR-Agent，在 GitLab 上用 AI 來 Code Review

2024/06/05

用 TensorFlow.js COCO-SSD 辨識圖片物件

學習如何使用 Tensorflow.js 的 COCO-SSD 模型在網頁上進行圖片物件辨識，包括基本使用方法、進階應用及實作範例，輕鬆辨識圖片中的人數和物件。

2024/06/05

用 TensorFlow.js COCO-SSD 辨識圖片物件

學習如何使用 Tensorflow.js 的 COCO-SSD 模型在網頁上進行圖片物件辨識，包括基本使用方法、進階應用及實作範例，輕鬆辨識圖片中的人數和物件。

2024/02/01

MongoDB 學習筆記 – Mac 上用 Docker 安裝 MongoDB Community

詳細解說如何在 Mac 上透過 Docker 安裝 MongoDB 社群版。包括 MongoDB Compass 的安裝與配置，以及 MongoDB Shell 的使用方法，為開發者提供 MongoDB 學習資源。

2024/02/01

MongoDB 學習筆記 – Mac 上用 Docker 安裝 MongoDB Community

詳細解說如何在 Mac 上透過 Docker 安裝 MongoDB 社群版。包括 MongoDB Compass 的安裝與配置，以及 MongoDB Shell 的使用方法，為開發者提供 MongoDB 學習資源。

看更多

你可能也想看

Let's Write 的沙龍

免費開源的語音辨識功能：Cloudflare Workers AI + Whisper

了解如何使用 Cloudflare Workers AI 與 Whisper 建立免費開源的語音辨識功能。本文詳細說明註冊步驟、部署流程及程式碼修改，讓你輕鬆將語音轉換成文字。

#Cloudflare#OpenAI#Whisper

2024/08/07

Let's Write 的沙龍

免費開源的語音辨識功能：Cloudflare Workers AI + Whisper

了解如何使用 Cloudflare Workers AI 與 Whisper 建立免費開源的語音辨識功能。本文詳細說明註冊步驟、部署流程及程式碼修改，讓你輕鬆將語音轉換成文字。

#Cloudflare#OpenAI#Whisper

2024/08/07

Let's Write 的沙龍

免費開源的語音辨識功能：Google Colab + Faster Whisper

本文提供如何使用 Google Colab 結合 Faster Whisper 來提升語音辨識速度與準確性，包含安裝指南與使用方法。探索如何將語音轉換為文本，並對檔案進行不同格式的輸出。

#Whisper#FasterWhisper#OpenAI

2024/01/17

Let's Write 的沙龍

免費開源的語音辨識功能：Google Colab + Faster Whisper

#Whisper#FasterWhisper#OpenAI

2024/01/17

螃蟹_crab的沙龍

[Python]使用SpeechRecognition進行語音辨識

本文主要使用SpeechRecognition來做一個簡單的語音辨識，使用pyqt5介面呈現。按下Start Recording，開始錄音，並顯示請開始說話。然後按鈕名改名Stop 在按下Stop Recording，稍等片刻後就會呈現出辨識結果程式範例 import sys i

#Python#語音辨識#SpeechRecognition

2024/06/22

螃蟹_crab的沙龍

[Python]使用SpeechRecognition進行語音辨識

#Python#語音辨識#SpeechRecognition

2024/06/22

無限智慧學院的沙龍

一起探索文生語音的奧術，OpenVoice 開源MyShell.ai後臺模型

要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成，這聽起來很不可思議對吧? 但這就是本篇論文取得的成就，不僅如此，該有的功能，如調整情感，口音節奏，停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文，這會是很有趣的旅程。

#AI論文詳解#OpenVoice#MyshellAI

2024/01/19

無限智慧學院的沙龍

一起探索文生語音的奧術，OpenVoice 開源MyShell.ai後臺模型

#AI論文詳解#OpenVoice#MyshellAI

2024/01/19

阿Han的沙龍

【🆓 語音辨識引擎sherpa-onnx CPU上篇】讓您輕鬆體驗語音辨識功能(Docker架設)

還記得我們之前介紹過「【Google Colab Python系列】初探Whisper: 來一段Youtube影片進行語音辨識吧！」這套語音辨識引擎，那為什麼我們又要教這一套? 因為我們也可以將whisper的模型轉換成onnx的格式，輕鬆移植到各種平台，且效能更佳。語音辨識的熱門組件之

#sherpa#語音辨識#asr

2024/07/02

阿Han的沙龍

【🆓 語音辨識引擎sherpa-onnx CPU上篇】讓您輕鬆體驗語音辨識功能(Docker架設)

#sherpa#語音辨識#asr

2024/07/02

Amily的沙龍

在理解與拒絕之間：從多重身分觀看《海妲．蓋柏樂》

若說易卜生的《玩偶之家》為 19 世紀的女性，開啟了一扇離家的窄門，那麼《海妲．蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆，同為熟稔文本的演員，亦是深刻體察制度縫隙的當代女性，此文所看見的不僅僅是崩壞前夕的最後發聲，更是女人被迫置於冷酷的制度之下，步步陷入無以言說的困境。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/28