付費限定

三分鐘內實作聲音轉字幕網頁App

無限智慧學院

發佈於人工智慧宇宙

更新於 2024/11/04發佈於 2023/11/04閱讀時間約 12 分鐘

相信替影片配字幕是許多人心中的痛，本文帶你在三分鐘內能夠用你的電腦，寫出一個使用AI將聲音轉成字幕srt檔案的互動操作網頁，可以連接麥克風測試，也可以上傳聲音檔案或是MP3來測試。

本文主要帶你跑通整個流程，想了解更多，可以參考以下的文章

實作完成圖片:

操作介面簡單俐落，可以麥克風錄音，也可以上傳聲音檔案

實作導出字幕檔範例:

本程式碼有額外把輸出轉成srt字幕檔案，方便使用者做微調與修改。

完整流程:

安裝Anaconda (For python 初次使用者)
安裝git，並且設定好Git (For git 初次使用者)
打開Power shell依序輸入以下指令，從Github上面下載程式包，然後到程式目錄下，藉由requirements.txt 安裝好程式運作所需要的python套件

git clone https://github.com/tim9510019/voice2srt.git
cd voice2srt
pip install -r requirements.txt

以行動支持創作者！付費即可解鎖

本篇內容共 4851 字、0 則留言，僅發佈於人工智慧宇宙你目前無法檢視以下內容，可能因為尚未登入，或沒有該房間的查看權限。

留言

留言分享你的想法！

無限智慧學院的沙龍

95會員

128內容數

帶你用上帝視角，針對市面上具有高度價值的影片/論文/書籍，用東方取象，與西方邏輯辯證的角度同時出發，跟著我一起來探討宇宙萬事萬物的本質，隨時隨地都可以來一場說走就走的思維旅行。作者在台積電 / 聯發科等科技產業有累計10年的資歷，近期對於人工智慧，東方易經，西方辯證邏輯，還有佛法向內求有深度興趣。

無限智慧學院的沙龍的其他內容

2024/06/13

迎戰未來，AI 量子計算基礎篇 (1)，Single Systems

預計量子AI計算會在2032年左右來到，在這之前，我們還有充足的時間可以逐步去學習量子計算與演算法，讓我們按部就班，持續前進，做輕鬆無負擔的超前學習 !

2024/06/13

迎戰未來，AI 量子計算基礎篇 (1)，Single Systems

2024/06/09

從Computex 窺探人工智慧產業的發展

介紹這次Computex的兩大主題，AI Server與AI PC，展現了台灣廠商強大的供應能力，隨處可見黃仁勳的簽名，展示了美國頂尖企業與台灣製造那層密不可分的夥伴關係，就讓我們一起來探索，這些尖端科技產品。

2024/06/09

從Computex 窺探人工智慧產業的發展

2024/02/28

Mask-LM 生成影片能力趨近完美 with MAGVIT-V2 by Google & CMU Yu et al.

這次要介紹的這篇，使用Mask-LM的生成方式，可以達到最頂尖的FID/FVD分數，取得超越Diffusion Model的生成品質，並兼顧了生成速度，讓我們一起從MAGVIT開始，逐步理解到MAGVIT-V2，相信能讓對於最新影像生成領域有興趣的讀者，感到收穫滿滿。

2024/02/28

Mask-LM 生成影片能力趨近完美 with MAGVIT-V2 by Google & CMU Yu et al.

看更多

你可能也想看

渡狼／DL

蝦皮開箱｜TOMICA 吉伊卡哇烏薩奇兔兔小車

TOMICA第一波推出吉伊卡哇聯名小車車的時候馬上就被搶購一空，一直很扼腕當時沒有趕緊入手。前陣子閒來無事逛蝦皮，突然發現幾家商場都又開始重新上架，價格也都回到正常水準，估計是官方又再補了一批貨，想都沒想就立刻下單！同文也跟大家分享近期蝦皮購物紀錄、好用推薦、蝦皮分潤計畫的聯盟行銷！

#吉伊卡哇#開箱#蝦皮分潤計畫

2025/05/13

渡狼／DL

蝦皮開箱｜TOMICA 吉伊卡哇烏薩奇兔兔小車

#吉伊卡哇#開箱#蝦皮分潤計畫

2025/05/13

阿千看世界

2025年綜合所得稅繳稅教學：線上申報、信用卡回饋、拆單攻略！

每年4月、5月都是最多稅要繳的月份，當然大部份的人都是有機會繳到「綜合所得稅」，只是相當相當多人還不知道，原來繳給政府的稅！可以透過一些有活動的銀行信用卡或電子支付來繳，從繳費中賺一點點小確幸！就是賺個１%~2%大家也是很開心的，因為你們把沒回饋變成有回饋，就是用卡的最高境界所得稅線上申報

#2025所得稅#綜合所得稅#繳稅有回饋

2025/05/03

阿千看世界

2025年綜合所得稅繳稅教學：線上申報、信用卡回饋、拆單攻略！

#2025所得稅#綜合所得稅#繳稅有回饋

2025/05/03

螃蟹_crab的沙龍

[Python]使用SpeechRecognition進行語音辨識

本文主要使用SpeechRecognition來做一個簡單的語音辨識，使用pyqt5介面呈現。按下Start Recording，開始錄音，並顯示請開始說話。然後按鈕名改名Stop 在按下Stop Recording，稍等片刻後就會呈現出辨識結果程式範例 import sys i

#Python#語音辨識#SpeechRecognition

2024/06/22

螃蟹_crab的沙龍

[Python]使用SpeechRecognition進行語音辨識

#Python#語音辨識#SpeechRecognition

2024/06/22

逍遙資訊

Free text to speech 免費文字轉語音

免費文字轉語音（Free text to speech）免費的線上語音合成工具，使用微軟 AI 語音庫生成仿真人語音，支援 129 種語言，提供三百多種聲音，輸入文本即可線上聆聽和下載 MP3 檔案。

#文字轉語音#TTS#免費服務

2024/04/23

逍遙資訊

Free text to speech 免費文字轉語音

#文字轉語音#TTS#免費服務

2024/04/23

Wei 的工程師聊什麼

使用 OpenAI Whisper API 進行語音轉文字，方便字幕後製或內容整理

本文介紹如何設置OpenAI API密鑰並使用Whisper API轉寫音訊檔案。文章詳細說明了轉寫單個音訊檔案，以及將長音訊分割並轉寫的過程。透過範例演示，讀者可以學習如何將音訊轉寫為文字，提高工作效率。

#OpenAI#檔案#程式

2024/02/13

Wei 的工程師聊什麼

使用 OpenAI Whisper API 進行語音轉文字，方便字幕後製或內容整理

#OpenAI#檔案#程式

2024/02/13

無限智慧學院的沙龍

一起探索文生語音的奧術，OpenVoice 開源MyShell.ai後臺模型

要如何做到無須任何額外訓練樣本就能做到"跨語言"的語音生成，這聽起來很不可思議對吧? 但這就是本篇論文取得的成就，不僅如此，該有的功能，如調整情感，口音節奏，停頓語調這些功能也不在話下。跟著我一起用探秘還有獨立思考的眼光來分析這篇論文，這會是很有趣的旅程。

#AI論文詳解#OpenVoice#MyshellAI

2024/01/19

無限智慧學院的沙龍

一起探索文生語音的奧術，OpenVoice 開源MyShell.ai後臺模型

#AI論文詳解#OpenVoice#MyshellAI

2024/01/19

多元人生記事錄

試用 AI 將演講逐字稿轉換成簡報大綱

※先說明，或許有更好的做法，如果您知道怎麼做，歡迎留言指導，謝謝好的，先說我最後完成~ 有成功的做法，如下: 我的情境我手上 "搞到" 一份約兩個小時 "如何安全地使用電腦" 的演講影片，因版權關係，無法分享原影片出來，也因為組織內，需要進行資訊安全的教育訓練，我就想要認真的看完此影片後，

2023/12/22

2023/12/22

相信替影片配字幕是許多人心中的痛，本文帶你在三分鐘內能夠用你的電腦，實做聲音轉字幕網站，準備好了就來吧!

#Huggingface#github#三分鐘

2023/11/04

無限智慧學院的沙龍

三分鐘內實作聲音轉字幕網頁App

相信替影片配字幕是許多人心中的痛，本文帶你在三分鐘內能夠用你的電腦，實做聲音轉字幕網站，準備好了就來吧!

#Huggingface#github#三分鐘

2023/11/04

無限智慧學院的沙龍

訓練 OpenAI Whisper V2-幫你的影片上字幕

大名鼎鼎的openai推出Whisper-large-v2 AI 的第二版，可以用來製作屬於自己的自動影片上字幕程式，就讓我們一起來看看吧!

#上字幕#自動化#機器人流程自動化

2023/10/23

無限智慧學院的沙龍

訓練 OpenAI Whisper V2-幫你的影片上字幕

大名鼎鼎的openai推出Whisper-large-v2 AI 的第二版，可以用來製作屬於自己的自動影片上字幕程式，就讓我們一起來看看吧!

#上字幕#自動化#機器人流程自動化

2023/10/23

多元人生記事錄

可以讓您語音轉文字產生逐字稿(或字幕)的網站 vocol.ai

由於我個人英文能力實在不太好，經常查一些電腦相關資訊查到一些英文網頁或英文影片去了，英文網頁還好，慢慢看~還能看出個端倪，了不起來個整篇翻譯，還是大概能看懂。影片~ 雖然 Youtube 是有自動翻譯成中文字幕的功能，但... 如果是看稍微技術方面的影片，我常常看得是一個頭兩個大。

#逐字稿#翻譯#字幕

2023/08/08

多元人生記事錄

可以讓您語音轉文字產生逐字稿(或字幕)的網站 vocol.ai

#逐字稿#翻譯#字幕

2023/08/08

窩 World

AI可以提供雙語字幕的即時翻譯了！

觀看外語影片時，字幕是必要的輔助工具。「字幕精靈 - 實時語音辨別、AI字幕翻譯」Google 擴充功能就跟上這波 AI 風潮，可透過 AI 技術偵測聲音，並生成相對應的文字，提供使用者即時翻譯的功能。此擴充功能需要付費使用，但首次註冊並登陸，就會贈送 30 分鐘的免費使用體驗給大家！快去測試看看！

#Google#註冊#AI

2023/04/30