vocus logo

方格子 vocus

付費限定

三分鐘實作"多國語言"轉字幕網頁APP (Whisper-V3-Large)

更新 發佈閱讀 10 分鐘

相信替影片配字幕是許多人心中的痛,本文帶你在三分鐘內能夠用你的電腦,寫出一個使用AI將聲音轉成字幕srt檔案的互動操作網頁,可以連接麥克風測試,也可以上傳聲音檔案或是MP3來測試。

目前的多國語言版本,能自動辨別語言,不須額外微調,經實測,中英文混雜也能夠正確輸出。本文主要帶你跑通整個流程,想了解更多,可以參考以下的文章

實作完成圖片:

操作介面簡單俐落,可以麥克風錄音,也可以上傳聲音檔案

操作介面簡單俐落,可以麥克風錄音,也可以上傳聲音檔案

實作導出字幕檔範例:

本程式碼有額外把輸出轉成srt字幕檔案,方便使用者做微調與修改。

本程式碼有額外把輸出轉成srt字幕檔案,方便使用者做微調與修改。

完整流程:

  1. 安裝ffmpeg (windows / linux / mac)
  2. 安裝Anaconda (For python 初次使用者)
  3. 安裝git,並且設定好Git (For git 初次使用者)
  4. 打開Power shell依序輸入以下指令,從Github上面下載程式包,然後到程式目錄下,藉由requirements.txt 安裝好程式運作所需要的python套件
以行動支持創作者!付費即可解鎖
本篇內容共 4252 字、0 則留言,僅發佈於人工智慧宇宙你目前無法檢視以下內容,可能因為尚未登入,或沒有該房間的查看權限。
留言
avatar-img
無限智慧學院的沙龍
96會員
128內容數
帶你用上帝視角,針對市面上具有高度價值的影片/論文/書籍,用東方取象,與西方邏輯辯證的角度同時出發,跟著我一起來探討宇宙萬事萬物的本質,隨時隨地都可以來一場說走就走的思維旅行。作者在台積電 / 聯發科等科技產業有累計10年的資歷,近期對於人工智慧,東方易經,西方辯證邏輯,還有佛法向內求有深度興趣。
2024/01/15
三分鐘內實作取得您專屬的人工智慧西洋占星助理,隨時掌握自己完整的星座運勢,隨時都能來占卜一下,知道自己完整的運勢以後,也比較好提前規劃該如何面對,本範例使用專業的西洋占星術,提供逆行,特別是水膩的相關資訊,齊帶大家都能趨吉避凶,從中找到快樂。
Thumbnail
2024/01/15
三分鐘內實作取得您專屬的人工智慧西洋占星助理,隨時掌握自己完整的星座運勢,隨時都能來占卜一下,知道自己完整的運勢以後,也比較好提前規劃該如何面對,本範例使用專業的西洋占星術,提供逆行,特別是水膩的相關資訊,齊帶大家都能趨吉避凶,從中找到快樂。
Thumbnail
2023/11/21
本文帶你三分鐘內跑通"文字生圖片"的網頁APP,使用最頂尖生成技術,LCM-Lora-SDXL模型,能夠在短時間內生成符合文字描述的高解析圖片。屬於免費開源模型(License Link),請不要產生有害內容,進行合理的使用。
Thumbnail
2023/11/21
本文帶你三分鐘內跑通"文字生圖片"的網頁APP,使用最頂尖生成技術,LCM-Lora-SDXL模型,能夠在短時間內生成符合文字描述的高解析圖片。屬於免費開源模型(License Link),請不要產生有害內容,進行合理的使用。
Thumbnail
2023/11/14
本文帶你在3分鐘內跑通基本範例,用llamaIndex 串接Excel,經過爬蟲與Mistral 7B整理的資料,讓GPT4成為國際政治經濟大師,每天為您自動產生經濟分析報告。
Thumbnail
2023/11/14
本文帶你在3分鐘內跑通基本範例,用llamaIndex 串接Excel,經過爬蟲與Mistral 7B整理的資料,讓GPT4成為國際政治經濟大師,每天為您自動產生經濟分析報告。
Thumbnail
看更多
你可能也想看
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
本文深度解析賽勒布倫尼科夫的舞臺作品《傳奇:帕拉贊諾夫的十段殘篇》,如何以十段殘篇,結合帕拉贊諾夫的電影美學、象徵意象與當代政治流亡抗爭,探討藝術在儀式消失的現代社會如何承接意義,並展現不羈的自由靈魂。
Thumbnail
在開始前,請先至 GitHub 上 Clone 相關資源到環境裡。 $ git clone https://github.com/ml-explore/mlx-examples.git 完成後,進入資料夾 $ cd ./mlx-examples/whisper​ 裡面有以下資源: # wh
Thumbnail
在開始前,請先至 GitHub 上 Clone 相關資源到環境裡。 $ git clone https://github.com/ml-explore/mlx-examples.git 完成後,進入資料夾 $ cd ./mlx-examples/whisper​ 裡面有以下資源: # wh
Thumbnail
如果我們想要快速將兩部或多部影片合併成一部影片,那FFMPEG真的很好用 步驟一、確認工作資料夾 在上一篇文章有提到,我們需要將要處理的檔案都放進一個資料夾 而那個資料夾就是我們把CMD打開後的出現的資料夾 把我們要合併的影片010.mp4和020.mp4放進這個資料夾 步驟二、建立文字檔 同樣在這
Thumbnail
如果我們想要快速將兩部或多部影片合併成一部影片,那FFMPEG真的很好用 步驟一、確認工作資料夾 在上一篇文章有提到,我們需要將要處理的檔案都放進一個資料夾 而那個資料夾就是我們把CMD打開後的出現的資料夾 把我們要合併的影片010.mp4和020.mp4放進這個資料夾 步驟二、建立文字檔 同樣在這
Thumbnail
訊息的即時傳遞已然成為現代社會的趨勢了, 影音也是如此, 即時! 即時! 即時! 已經是目前使用者體驗的必要元素了, 在這邊我們要分享的主題是如何在python程式語言的情境下使用ffmpeg來將音檔串流的轉換格式, 為什麼會有這樣的需求呢? 因為我們處理音檔時可能會需要統一輸出的格式, 當然背後也
Thumbnail
訊息的即時傳遞已然成為現代社會的趨勢了, 影音也是如此, 即時! 即時! 即時! 已經是目前使用者體驗的必要元素了, 在這邊我們要分享的主題是如何在python程式語言的情境下使用ffmpeg來將音檔串流的轉換格式, 為什麼會有這樣的需求呢? 因為我們處理音檔時可能會需要統一輸出的格式, 當然背後也
Thumbnail
如何透過一個指令,一次將 mp3 轉換成 mp4? 如何將mp3轉成mp4? 如何將Podcast上傳到YouTube?
Thumbnail
如何透過一個指令,一次將 mp3 轉換成 mp4? 如何將mp3轉成mp4? 如何將Podcast上傳到YouTube?
Thumbnail
全新版本的《三便士歌劇》如何不落入「復刻經典」的巢臼,反而利用華麗的秀場視覺,引導觀眾在晚期資本主義的消費愉悅之中,而能驚覺「批判」本身亦可能被收編——而當絞繩升起,這場關於如何生存的黑色遊戲,又將帶領新時代的我們走向何種後現代的自我解構?
Thumbnail
全新版本的《三便士歌劇》如何不落入「復刻經典」的巢臼,反而利用華麗的秀場視覺,引導觀眾在晚期資本主義的消費愉悅之中,而能驚覺「批判」本身亦可能被收編——而當絞繩升起,這場關於如何生存的黑色遊戲,又將帶領新時代的我們走向何種後現代的自我解構?
Thumbnail
若說易卜生的《玩偶之家》為 19 世紀的女性,開啟了一扇離家的窄門,那麼《海妲.蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆,同為熟稔文本的演員,亦是深刻體察制度縫隙的當代女性,此文所看見的不僅僅是崩壞前夕的最後發聲,更是女人被迫置於冷酷的制度之下,步步陷入無以言說的困境。
Thumbnail
若說易卜生的《玩偶之家》為 19 世紀的女性,開啟了一扇離家的窄門,那麼《海妲.蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆,同為熟稔文本的演員,亦是深刻體察制度縫隙的當代女性,此文所看見的不僅僅是崩壞前夕的最後發聲,更是女人被迫置於冷酷的制度之下,步步陷入無以言說的困境。
Thumbnail
長期以來,西方美學以《維特魯威人》式的幾何比例定義「完美身體」,這種視覺標準無形中成為殖民擴張與種族分類的暴力工具。本文透過分析奈及利亞編舞家庫德斯.奧尼奎庫的舞作《轉轉生》,探討當代非洲舞蹈如何跳脫「標本式」的文化觀看。
Thumbnail
長期以來,西方美學以《維特魯威人》式的幾何比例定義「完美身體」,這種視覺標準無形中成為殖民擴張與種族分類的暴力工具。本文透過分析奈及利亞編舞家庫德斯.奧尼奎庫的舞作《轉轉生》,探討當代非洲舞蹈如何跳脫「標本式」的文化觀看。
Thumbnail
在離線環境需要安裝Python套件時就相當的麻煩,需要先下載好套件包,在打指令安裝,若套件數量一多時就會相當麻煩。 本文將介紹如何利用兩行指令快速的安裝整個資料夾的套件。
Thumbnail
在離線環境需要安裝Python套件時就相當的麻煩,需要先下載好套件包,在打指令安裝,若套件數量一多時就會相當麻煩。 本文將介紹如何利用兩行指令快速的安裝整個資料夾的套件。
Thumbnail
相信替影片配字幕是許多人心中的痛,本文帶你在三分鐘內能夠用你的電腦,寫出一個使用AI將聲音轉成字幕srt檔案的互動操作網頁,可以連接麥克風測試,也可以上傳聲音檔案或是MP3來測試。目前的多國語言版本,能自動辨別語言,不用特別指定,經實測,中英文混雜也能夠正確輸出。
Thumbnail
相信替影片配字幕是許多人心中的痛,本文帶你在三分鐘內能夠用你的電腦,寫出一個使用AI將聲音轉成字幕srt檔案的互動操作網頁,可以連接麥克風測試,也可以上傳聲音檔案或是MP3來測試。目前的多國語言版本,能自動辨別語言,不用特別指定,經實測,中英文混雜也能夠正確輸出。
Thumbnail
關於字幕檔我們常常會看到「.srt」、「.ass」、「.vtt」…等影片的字幕格式, 但你知道嗎? 這些字幕檔是很重要的一個寶貴資訊, 可以從中對段落的長度、文字進行提取, 此時就需要一個強大的工具來幫我們解析一下字幕檔, 就讓我們來看看怎麼用吧! 安裝 pip install pysubs2
Thumbnail
關於字幕檔我們常常會看到「.srt」、「.ass」、「.vtt」…等影片的字幕格式, 但你知道嗎? 這些字幕檔是很重要的一個寶貴資訊, 可以從中對段落的長度、文字進行提取, 此時就需要一個強大的工具來幫我們解析一下字幕檔, 就讓我們來看看怎麼用吧! 安裝 pip install pysubs2
Thumbnail
本文利用pyqt5,使用pyttsx3將QLineEdit(單行輸入框)的字串,轉成語音呈現出來。
Thumbnail
本文利用pyqt5,使用pyttsx3將QLineEdit(單行輸入框)的字串,轉成語音呈現出來。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News