前言
你試用過人工智能(AI)文字轉語音功能了嗎? 你能清楚分出你聽的聲音是真人朗讀或是AI在對你說話?
AI語音發展已經可高效地產出仿人聲語音,那麼,朗誦員、配音員的工作量是否會急遽減少呢?
現在爭議的問題點在於:業界人士發現有服務提供者混合市面上數種人聲錄音創造AI音頻,但沒有經過授權同意,侵害到原作者智慧財產權。
這個問題與AI生成圖片一樣,因為AI模型訓練的來源並沒有獲得授權,來源難以追查認證,以至於「被利用者」無法獲得期待相應的報酬,這是AI時代我們要對智慧財產權的重新思考。
即便 AI 產出的效率較高,真人朗誦或配音的語調還是較有情緒起伏、能夠傳遞情感,這是現階段AI無法取代的優勢。
近期法新社對於AI影響配音從業人員有一篇報導,摘譯其中資訊如下:
從業人員的危機意識
全職配音演員和專業旁白演員塔尼婭·伊比(Tanya Eby)已經有20年工作經驗,她在家中有一個錄音室。她表示在過去的六個月裡,她的工作量下降了一半。她的預約目前只到六月,而在正常年份,她的預約通常會持續到八月。
她的許多同事也回復了相近的業務量下滑狀況。她告訴法新社說,雖然可能存在其他因素,但合理推測AI正在影響配音員的工作。而且有一些不肖公司使用了在資料庫中的聲音,但沒有支付費用,將不同的聲音混合起來創造出獨立的聲音後,就說這不屬於任何人。
當然,法新社聯絡的所有有聲書公司都否認使用此類做法。
位於倫敦的DeepZen公司,提供用AI將文字轉錄為語音的服務,其價格具有優勢,將製作一本有聲書的成本降至傳統錄製的四分之一甚至更低。DeepZen使用了一個由幾位演員的聲音錄製而成的數據庫,執行長卡米斯·泰蘭(Kamis Taylan)表示他們對於使用的每一個聲音,都簽署了許可協議,並支付了錄製費用。
位於德州的新創公司Speechki的執行長迪馬·阿布拉莫夫(Dima Abramov)也表示,該公司在使用自己的錄音和現有資料庫中的聲音之前,必須簽署涵蓋使用權限的契約。
亞馬遜旗下的Audible公司發言人表示:「專業旁白一直是Audible收聽體驗的核心,且將始終如此。然而,隨著語音合成技術的改進,我們看到人類表演和語音合成生成的內容可以共存的未來。」
演員和有聲書旁白者埃米莉·埃萊特(Emily Ellet)是專業有聲書旁白者協會(Professional Audiobook Narrators Association, PANA)的創始人之一,她認為:「講故事的本質是教導人們如何成為人類。我們堅信,這種教導永遠不應該交給機器。」
你也有打客服聽到語音覺得不耐煩一肚子火,但是接到真人客服講了幾句話,你就一腔怒火被平息的經驗嗎? 或許我們就是需要跟真人說說話,把情緒傳導出去,而AI偏偏就是接不住。
Google也來參戰自動朗讀
我在上架Google圖書時,看到現在Google也推出了自動朗讀(autonarration)有聲書的服務。
目前提供
試聽及選擇將原先已上架的圖書免費轉錄成有聲書的服務,但只限定epub格式的電子書,而且目前尚未支援中文書。
Google目前現在提供6種語言服務:英語、葡萄牙語、法語、西班牙語、德語。
英語也可選擇美國口音、澳洲口音或英國口音,也能選擇性別及年齡。
期待Google也推出支援中文服務的一天,那就要趕快來試用一下將我的小說轉成有聲書。
文字轉語音AI工具:MURF.AI
MURF.AI是我試用過的線上文字轉語音AI工具,支援20國語言、120種人聲。將文本貼上後,就能試聽語音產出的結果。
英語有免費版試用,簡體中文(大陸口音)或廣東話就需要付費。
但確實生成的結果聽起來很平板,明顯可辨別是機器的聲音。
MURF.AI介面中可以逐段調整語音想要的語速、重音、加入停頓,甚至選擇情境,這都是免費版就提供的編輯功能。
如果聲音要真的調整到很像真人朗誦說話,需要花費相當多的調教時間。可能的確是請一位真人來幫忙錄音或許比較實際。
結語
AI語音生成這項應用我覺得可以廣泛用在不需要強調高品質情感的情境中,作為聽覺攝取訊息的來源,像是錄製產品說明文件、網路農場影片(已經有大量應用)。用AI語音生成技術可以快速轉錄以前沒有錄製過有聲書的紙本書,讓不便閱讀的人可以享受更多知識內容。
你有用過AI語音生成工具的經驗嗎?
歡迎跟我分享,讓我們一起交流學習。我相信AI的發展不是為了取代人類工作,而是讓人類的工作更有效率、開創更多可能性。
覺得文章實用的話,歡迎訂閱、追蹤專題、打賞,或是留言分享心得討論!我會持續更新。您的支持將會是我在被兩個幼娃惡整之餘的信心動力。
資料來源:https://www.digitaljournal.com/life/audio-book-narrators-say-ai-is-already-taking-away-business/article