Vtuber、NPC、Avatar和數位分身，AI的發展暗示了什麼？

2024/03/26閱讀時間約 3 分鐘

AI科技公司Character.AI（下稱c.ai）在上週發佈新功能Character Voice，將免費提供多個語音供用戶選擇，為自創的AI角色加上聲音，以創造更好的互動模式。這個以建立AI助手，提供AI人性化自然語言互動界面的美國科技平台，將通過Text-to-Speech這個AI技術提供用戶以自己聲音創建虛擬AI角色聲音的機會，也邀請用戶開放自己的聲音供其他的角色使用。目前服務僅支援英文，但未來除了更多的聲音，也會有更多語言可供使用。

無獨有偶，同樣在上週的GTC 2024中nVida也介紹了與Ubisoft巴黎工作室合作的NEO NPC專案。這個專案通過生成式AI訓練NPC，將遊戲設計的角色設定結合大語言模型，讓NPC能根據設定與玩家有更多更自由卻不偏離遊戲主題的互動。過去提到NPC，總是會想到非常功能化的重複可能與劇情不相關，或是需要達成任務才能開啟功能性對話內容。但在NEO NPC的計劃中，未來遊戲玩家有機會與NPC通過自然語言討論策略，甚至在聊天的過程中深度的了解角色故事。如果說自由探索構成了薩爾達身為經典的價值，那麼NEO NPC將可能通過NPC的進化，改寫未來遊戲的呈現形式。

其實TTS本身並不是什麼新鮮的功能，在現代生活中，不管是各項服務廣播叫號、ATM語音服務或是各種長短影音都常會聽到像是Google小姐或是大陸口音的語音包。其實遊戲產業也是早早投入AI生成的懷抱，利用AI產生概念圖，激發創意等等...那麼這次c.ai個功能更新，與Ubisoft的NPC計劃，到底有什麼重要的呢？

那麼如果你知道，OpenAI近期申請了「voice engine」和「digital voice assistants」這兩商標，感覺起來會不會確實是有點風雨欲來的味道了？

圖片來源：Ubisoft

科技的發展，有時跟隨摩爾定律或是技術人的想象，常會衝得太快或是衝錯方向，比如Google glass曾經一度衝擊市場，最後還是暫停，但不管是微軟的HoloLens，Oculus或是蘋果的Vision Pro都還是持續前仆後繼的挑戰未來。2018年由Google、Amazon和蘋果開始的智慧居家語音服務，雖然隨著出貨不盡理想，目前主要只剩Alexa獨霸北美市場，市場上討論熱度也不再。但隨著生成式AI帶來的新一波智慧助理圖片，自然語言的互動，聲音勢必是一個即將再起的戰場。

對於目前已和大語言模型協作的使用者來說，無疑解放雙手提升效率的數位助理，是未來協作最理想模式。而大語音模型及多模態的持續發展，也讓AI的助理功能越來越強大。先不論AI是否能取代真人，光是AI助理幫助工作者剩下低價值勞動的時間和精力，提升產出的價值這點，就足以讓使用者繼續支持AI的發展。

聽覺及聲音這個領域，漫威鋼鐵人的虛擬管家Jarvis能通過語音與東尼史塔克溝通，並且理解主人的嘲諷和玩笑，甚至先一步的執行任務這樣的想象。其實就與大家期待數位助理更理想的服務模式有關。回到c.ai本次的更新，過去平台提供的更偏向專業領域或人設的調教，讓原本的大語音模型，變成類似虛擬分身這樣有人設和知識範疇的角色這樣的呈現已然不足，或是說，大家已經太習慣及接受這樣的狀態而渴求更多。

進一步加上聽覺後，原本生成詩篇的問答機器人，就搖身一變成了虛擬詩人，活靈活現的能用聲音傳遞生成的作品，還能隨著你的反饋進行互動。那麼雖然未必就能成為Jarvis，但至少，在未來可預期我們將會像Ubisoft的NPC，遇見越來越多真假難辨的虛擬分身。或許，也會有一批不再需要「中之人」的Vtuber，24小時在線與粉絲互動，全年無休。而這些分身，也會像是改變遊戲設計一樣的，改變我們的生活。

GPT工作術｜與你一起補給工作的AI能量沙龍

61會員

106內容數

介紹AI趨勢、應用工具，為您補給滿滿の AI超能力！

留言0

查看全部

發表第一個留言支持創作者！

GPT工作術｜與你一起補給工作的AI能量沙龍的其他內容

保健食品？健康食品？傻傻分不清楚？

『健康食品』為法定名詞，『自「健康食品管理法」實行以來，需向衛生福利部申請查驗登記許可，才可以稱為「健康食品」。並且依據健康食品管理法之定義，「健康食品」係為具有實質科學證據之「保健功效」，並標示或廣告具該功效，非屬治療、矯正人類疾病之醫療效能為目的之食品』。

#食品 #小綠人 #保健食品

不用花時間配音啦！AI「文字轉語音」讓有聲內容製作更簡單高效！

文字MP3專業版是簡單且強大的工具，會編輯文字就能創造出專業級配音。簡單 ﹑容易上手，像使用Word，無需剪輯經驗，輕鬆完成調整語速﹑插入空秒﹑插入背景音樂或音效等方面的製作。提供多種語言和配音員選擇，包括純正的臺灣口音。這個工具能應用於各種情境，如教育訓練簡報、有聲書、Podcast等。

#Podcast #配音員 #成本

誼郎開源不是說假的！可再開發、可商用的Grok-1開源了，將改變什麼？

人工智慧（AI）發展一日千里，年初OpenAI的Sora，三月初Anthropic的Cloude3，都為未來科技的創想帶來震撼。Elon Musk的X AI公司將他們的大型語言模型Grok-1開源，不僅展現了對AI技術開放共享的承諾，也預示著行業未來可能也會有不同於資本競爭、算力對抗的新發展方向。

#OpenAI #模型 #GPT-4

食品廣告大不易，政府監管力度加強，行銷人必須知道的風險管理趨勢

違反食品安全管理法會有行政懲罰，種類包含了網站、廣播、電視廣告、網路社團等等，只要有出現誇大不實或涉及療效的標語，皆有可能會被檢舉，進而被食品藥物管理署(下稱食藥署)或當地衛生局進行查核。 2023全年違規食品廣告裁處金額接近3億元，相較2022年不論是件數或金額都約成長一倍。

#食品安全 #廣告 #風險

如何分辨台灣腔？為什麼需要在意台灣腔？

示範台灣「本土」腔調時，是不是會聯想到「台灣苟蟻」？究竟台灣人說話時有什麼樣的特點？台灣不僅以人文底蘊、美食文化和美麗風光聞名於世，其語言的獨特性也同樣讓人著迷。語調和聲音，是我們生活記憶的一部分，也是文化傳承的特性。隨著新移民及外來常住人口的持續增加，大陸SNS影響社會，「台灣腔」其實也正在轉變。

#語言 #特色 #文化