AI 語音工具 ElevenLabs 推出自家 Reader App 平台,允許作者發行 AI 生成有聲書,挑戰 Audible 等傳統市場。平台提供更高分潤,每 11 分鐘支付 $1.10 美元,目前限 美國與英文書籍,未來將擴展至 32 種語言。此外,ElevenLabs 計劃打造 有聲書市場,並提供 付費 AI 朗讀服務,降低製作成本,加速 AI 在音頻市場的應用。
Amazon 推出升級版 Alexa+,採用 生成式 AI 提升互動體驗。新版 Alexa 能根據 用戶帳戶資訊 回答個人化問題,譬如今年已閱讀書籍數量,並協助預訂餐廳、監控智慧家居。此外,Alexa+ 具備 情境感知,可依語氣與環境調整回應,展現更自然的 AI 助理能力。
AI 大語言模型 Anthropic 在 Twitch 直播 Claude 3.7 Sonnet 玩 《Pokémon Red》,展示 AI 推理能力。相比前代卡在起始場景,新版已成功挑戰 3 位道館館主,但仍遇障礙,例如誤認 NPC、無法繞過岩壁等。直播吸引千名觀眾,部分人耐心觀察 AI 思維過程,部分則因其「慢如呆呆獸」的步調感到挫折,凸顯 AI 在遊戲推理上的進步與挑戰。
Google Gemini 可能將推出 AI 影片生成功能,擴展其圖像生成能力,或將 Veo 2 整合至 Gemini App。代號 「Robin」 的功能已出現在 Google 應用程式代碼中,顯示該技術正在開發中。與此同時,Veo 2 已透過 Freepik 開放公測,顯示 Google 正加速 AI 影片技術商業化,未來 Gemini 或將提供訂閱制 AI 影片創作服務。