本文參考自OpenAI的官方博客:"Navigating the Challenges and Opportunities of Synthetic Voices"。詳細內容
在人工智能領域,合成聲音技術正迅速發展,帶來前所未有的機遇與挑戰。透過深度學習模型,如OpenAI的Voice Engine,我們現在能夠根據短短15秒的音頻樣本生成接近原講者的自然語音。此技術的應用範圍極廣,從幫助非讀者學習、內容翻譯、到為失聲患者重建語音等,其潛力無限。
Voice Engine技術的開發始於2022年底,不僅已應用於現有的文字轉語音API中,也擴展至ChatGPT語音和朗讀功能。該技術能夠創造出具有情感且真實的聲音,提供比預設聲音更廣泛的語音範圍,讓合成聲音的應用更加多樣化。
合成聲音技術的發展也帶來了濫用的風險,特別是在選舉年和其他敏感時期。OpenAI與全球合作夥伴共同努力,確保合成聲音的負責任部署。這包括建立使用政策以禁止未經許可的個人或組織冒充、要求原講者明確同意及對合成聲音的起源進行標記等安全措施。
合成聲音技術的未來充滿希望,也存在挑戰。OpenAI呼籲社會各界一起加強對這一新興技術的認識,並共同探索如何有效地利用這項技術,同時保護公眾免受潛在的負面影響。