相信替影片配字幕是許多人心中的痛,本文帶你在三分鐘內能夠用你的電腦,寫出一個使用AI將聲音轉成字幕srt檔案的互動操作網頁,可以連接麥克風測試,也可以上傳聲音檔案或是MP3來測試。
目前的多國語言版本,能自動辨別語言,不須額外微調,經實測,中英文混雜也能夠正確輸出。本文主要帶你跑通整個流程,想了解更多,可以參考以下的文章
實作完成圖片:
操作介面簡單俐落,可以麥克風錄音,也可以上傳聲音檔案
實作導出字幕檔範例:
本程式碼有額外把輸出轉成srt字幕檔案,方便使用者做微調與修改。
完整流程:
- 安裝ffmpeg (windows / linux / mac)
- 安裝Anaconda (For python 初次使用者)
- 安裝git,並且設定好Git (For git 初次使用者)
- 打開Power shell依序輸入以下指令,從Github上面下載程式包,然後到程式目錄下,藉由requirements.txt 安裝好程式運作所需要的python套件