AI科技公司Character.AI(下稱c.ai)在上週發佈新功能Character Voice,將免費提供多個語音供用戶選擇,為自創的AI角色加上聲音,以創造更好的互動模式。這個以建立AI助手,提供AI人性化自然語言互動界面的美國科技平台,將通過Text-to-Speech這個AI技術提供用戶以自己聲音創建虛擬AI角色聲音的機會,也邀請用戶開放自己的聲音供其他的角色使用。目前服務僅支援英文,但未來除了更多的聲音,也會有更多語言可供使用。
無獨有偶,同樣在上週的GTC 2024中nVida也介紹了與Ubisoft巴黎工作室合作的NEO NPC專案。這個專案通過生成式AI訓練NPC,將遊戲設計的角色設定結合大語言模型,讓NPC能根據設定與玩家有更多更自由卻不偏離遊戲主題的互動。過去提到NPC,總是會想到非常功能化的重複可能與劇情不相關,或是需要達成任務才能開啟功能性對話內容。但在NEO NPC的計劃中,未來遊戲玩家有機會與NPC通過自然語言討論策略,甚至在聊天的過程中深度的了解角色故事。如果說自由探索構成了薩爾達身為經典的價值,那麼NEO NPC將可能通過NPC的進化,改寫未來遊戲的呈現形式。
其實TTS本身並不是什麼新鮮的功能,在現代生活中,不管是各項服務廣播叫號、ATM語音服務或是各種長短影音都常會聽到像是Google小姐或是大陸口音的語音包。其實遊戲產業也是早早投入AI生成的懷抱,利用AI產生概念圖,激發創意等等...那麼這次c.ai個功能更新,與Ubisoft的NPC計劃,到底有什麼重要的呢?
那麼如果你知道,OpenAI近期申請了「voice engine」和「digital voice assistants」這兩商標, 感覺起來會不會確實是有點風雨欲來的味道了?
科技的發展,有時跟隨摩爾定律或是技術人的想象,常會衝得太快或是衝錯方向,比如Google glass曾經一度衝擊市場,最後還是暫停,但不管是微軟的HoloLens,Oculus或是蘋果的Vision Pro都還是持續前仆後繼的挑戰未來。2018年由Google、Amazon和蘋果開始的智慧居家語音服務,雖然隨著出貨不盡理想,目前主要只剩Alexa獨霸北美市場,市場上討論熱度也不再。但隨著生成式AI帶來的新一波智慧助理圖片,自然語言的互動,聲音勢必是一個即將再起的戰場。
對於目前已和大語言模型協作的使用者來說,無疑解放雙手提升效率的數位助理,是未來協作最理想模式。而大語音模型及多模態的持續發展,也讓AI的助理功能越來越強大。先不論AI是否能取代真人,光是AI助理幫助工作者剩下低價值勞動的時間和精力,提升產出的價值這點,就足以讓使用者繼續支持AI的發展。
聽覺及聲音這個領域,漫威鋼鐵人的虛擬管家Jarvis能通過語音與東尼史塔克溝通,並且理解主人的嘲諷和玩笑,甚至先一步的執行任務這樣的想象。其實就與大家期待數位助理更理想的服務模式有關。回到c.ai本次的更新,過去平台提供的更偏向專業領域或人設的調教,讓原本的大語音模型,變成類似虛擬分身這樣有人設和知識範疇的角色這樣的呈現已然不足,或是說,大家已經太習慣及接受這樣的狀態而渴求更多。
進一步加上聽覺後,原本生成詩篇的問答機器人,就搖身一變成了虛擬詩人,活靈活現的能用聲音傳遞生成的作品,還能隨著你的反饋進行互動。那麼雖然未必就能成為Jarvis,但至少,在未來可預期我們將會像Ubisoft的NPC,遇見越來越多真假難辨的虛擬分身。或許,也會有一批不再需要「中之人」的Vtuber,24小時在線與粉絲互動,全年無休。而這些分身,也會像是改變遊戲設計一樣的,改變我們的生活。