付費限定

三分鐘實作"多國語言"轉字幕網頁APP (Whisper-V3-Large)

更新於 發佈於 閱讀時間約 10 分鐘

相信替影片配字幕是許多人心中的痛,本文帶你在三分鐘內能夠用你的電腦,寫出一個使用AI將聲音轉成字幕srt檔案的互動操作網頁,可以連接麥克風測試,也可以上傳聲音檔案或是MP3來測試。

目前的多國語言版本,能自動辨別語言,不須額外微調,經實測,中英文混雜也能夠正確輸出。本文主要帶你跑通整個流程,想了解更多,可以參考以下的文章

實作完成圖片:

操作介面簡單俐落,可以麥克風錄音,也可以上傳聲音檔案

操作介面簡單俐落,可以麥克風錄音,也可以上傳聲音檔案

實作導出字幕檔範例:

本程式碼有額外把輸出轉成srt字幕檔案,方便使用者做微調與修改。

本程式碼有額外把輸出轉成srt字幕檔案,方便使用者做微調與修改。

完整流程:

  1. 安裝ffmpeg (windows / linux / mac)
  2. 安裝Anaconda (For python 初次使用者)
  3. 安裝git,並且設定好Git (For git 初次使用者)
  4. 打開Power shell依序輸入以下指令,從Github上面下載程式包,然後到程式目錄下,藉由requirements.txt 安裝好程式運作所需要的python套件
以行動支持創作者!付費即可解鎖
本篇內容共 4252 字、0 則留言,僅發佈於人工智慧宇宙你目前無法檢視以下內容,可能因為尚未登入,或沒有該房間的查看權限。
留言
avatar-img
留言分享你的想法!
avatar-img
無限智慧學院的沙龍
95會員
128內容數
帶你用上帝視角,針對市面上具有高度價值的影片/論文/書籍,用東方取象,與西方邏輯辯證的角度同時出發,跟著我一起來探討宇宙萬事萬物的本質,隨時隨地都可以來一場說走就走的思維旅行。作者在台積電 / 聯發科等科技產業有累計10年的資歷,近期對於人工智慧,東方易經,西方辯證邏輯,還有佛法向內求有深度興趣。
2024/01/15
三分鐘內實作取得您專屬的人工智慧西洋占星助理,隨時掌握自己完整的星座運勢,隨時都能來占卜一下,知道自己完整的運勢以後,也比較好提前規劃該如何面對,本範例使用專業的西洋占星術,提供逆行,特別是水膩的相關資訊,齊帶大家都能趨吉避凶,從中找到快樂。
Thumbnail
2024/01/15
三分鐘內實作取得您專屬的人工智慧西洋占星助理,隨時掌握自己完整的星座運勢,隨時都能來占卜一下,知道自己完整的運勢以後,也比較好提前規劃該如何面對,本範例使用專業的西洋占星術,提供逆行,特別是水膩的相關資訊,齊帶大家都能趨吉避凶,從中找到快樂。
Thumbnail
2023/11/21
本文帶你三分鐘內跑通"文字生圖片"的網頁APP,使用最頂尖生成技術,LCM-Lora-SDXL模型,能夠在短時間內生成符合文字描述的高解析圖片。屬於免費開源模型(License Link),請不要產生有害內容,進行合理的使用。
Thumbnail
2023/11/21
本文帶你三分鐘內跑通"文字生圖片"的網頁APP,使用最頂尖生成技術,LCM-Lora-SDXL模型,能夠在短時間內生成符合文字描述的高解析圖片。屬於免費開源模型(License Link),請不要產生有害內容,進行合理的使用。
Thumbnail
2023/11/14
本文帶你在3分鐘內跑通基本範例,用llamaIndex 串接Excel,經過爬蟲與Mistral 7B整理的資料,讓GPT4成為國際政治經濟大師,每天為您自動產生經濟分析報告。
Thumbnail
2023/11/14
本文帶你在3分鐘內跑通基本範例,用llamaIndex 串接Excel,經過爬蟲與Mistral 7B整理的資料,讓GPT4成為國際政治經濟大師,每天為您自動產生經濟分析報告。
Thumbnail
看更多
你可能也想看
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
訊息的即時傳遞已然成為現代社會的趨勢了, 影音也是如此, 即時! 即時! 即時! 已經是目前使用者體驗的必要元素了, 在這邊我們要分享的主題是如何在python程式語言的情境下使用ffmpeg來將音檔串流的轉換格式, 為什麼會有這樣的需求呢? 因為我們處理音檔時可能會需要統一輸出的格式, 當然背後也
Thumbnail
訊息的即時傳遞已然成為現代社會的趨勢了, 影音也是如此, 即時! 即時! 即時! 已經是目前使用者體驗的必要元素了, 在這邊我們要分享的主題是如何在python程式語言的情境下使用ffmpeg來將音檔串流的轉換格式, 為什麼會有這樣的需求呢? 因為我們處理音檔時可能會需要統一輸出的格式, 當然背後也
Thumbnail
在離線環境需要安裝Python套件時就相當的麻煩,需要先下載好套件包,在打指令安裝,若套件數量一多時就會相當麻煩。 本文將介紹如何利用兩行指令快速的安裝整個資料夾的套件。
Thumbnail
在離線環境需要安裝Python套件時就相當的麻煩,需要先下載好套件包,在打指令安裝,若套件數量一多時就會相當麻煩。 本文將介紹如何利用兩行指令快速的安裝整個資料夾的套件。
Thumbnail
本文利用pyqt5,使用pyttsx3將QLineEdit(單行輸入框)的字串,轉成語音呈現出來。
Thumbnail
本文利用pyqt5,使用pyttsx3將QLineEdit(單行輸入框)的字串,轉成語音呈現出來。
Thumbnail
如何透過一個指令,一次將 mp3 轉換成 mp4? 如何將mp3轉成mp4? 如何將Podcast上傳到YouTube?
Thumbnail
如何透過一個指令,一次將 mp3 轉換成 mp4? 如何將mp3轉成mp4? 如何將Podcast上傳到YouTube?
Thumbnail
在開始前,請先至 GitHub 上 Clone 相關資源到環境裡。 $ git clone https://github.com/ml-explore/mlx-examples.git 完成後,進入資料夾 $ cd ./mlx-examples/whisper​ 裡面有以下資源: # wh
Thumbnail
在開始前,請先至 GitHub 上 Clone 相關資源到環境裡。 $ git clone https://github.com/ml-explore/mlx-examples.git 完成後,進入資料夾 $ cd ./mlx-examples/whisper​ 裡面有以下資源: # wh
Thumbnail
相信替影片配字幕是許多人心中的痛,本文帶你在三分鐘內能夠用你的電腦,寫出一個使用AI將聲音轉成字幕srt檔案的互動操作網頁,可以連接麥克風測試,也可以上傳聲音檔案或是MP3來測試。目前的多國語言版本,能自動辨別語言,不用特別指定,經實測,中英文混雜也能夠正確輸出。
Thumbnail
相信替影片配字幕是許多人心中的痛,本文帶你在三分鐘內能夠用你的電腦,寫出一個使用AI將聲音轉成字幕srt檔案的互動操作網頁,可以連接麥克風測試,也可以上傳聲音檔案或是MP3來測試。目前的多國語言版本,能自動辨別語言,不用特別指定,經實測,中英文混雜也能夠正確輸出。
Thumbnail
關於字幕檔我們常常會看到「.srt」、「.ass」、「.vtt」…等影片的字幕格式, 但你知道嗎? 這些字幕檔是很重要的一個寶貴資訊, 可以從中對段落的長度、文字進行提取, 此時就需要一個強大的工具來幫我們解析一下字幕檔, 就讓我們來看看怎麼用吧! 安裝 pip install pysubs2
Thumbnail
關於字幕檔我們常常會看到「.srt」、「.ass」、「.vtt」…等影片的字幕格式, 但你知道嗎? 這些字幕檔是很重要的一個寶貴資訊, 可以從中對段落的長度、文字進行提取, 此時就需要一個強大的工具來幫我們解析一下字幕檔, 就讓我們來看看怎麼用吧! 安裝 pip install pysubs2
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News