更新於 2024/11/26閱讀時間約 3 分鐘

11/26【看一眼 AI】NVIDIA 推出「全球最靈活的音效機器」AI 模型

⭐️ 11/26【看一眼 AI 】來了,帶你 1 分鐘掌握重點 AI 新聞。

raw-image
  • NVIDIA 推出全新 AI 音頻生成模型 Fugatto,被稱為「全球最靈活的音效機器」,結合多項創新功能。該模型具備「可組合藝術」(ComposableART)能力,可創造未經訓練的新效果,例如情緒化聲音或創新的樂器聲。 Fugatto 將對遊戲和電影產業帶來重大影響,但目前僅限研究用途,未來或將透過 NVIDIA 合作夥伴推出商業應用。


  • AI影片生成工具 Runway 推出全新 AI 圖像生成模型「Frames」,專注於提升風格化控制與視覺一致性,為創建自定義虛擬世界帶來新可能。該模型適用於生成一致性強的圖像與影片,並已開始逐步在 Gen-3 Alpha 和 Runway API 上提供使用。範例影片展示了從 80 年代特效妝容到日式雜誌風格的多樣應用,展現強大創意與精確表現力。
想每天收到最新AI新聞、與同好交流AI新知?快加入 [傑瑞AI讀書會]
  • AI 影片生成工具公司 Luma Labs 為其生成式 AI 平台 Dream Machine 推出重大升級,包括新圖像模型 Photon 和全新 AI 影片協作功能。 Photon 支援精準文本生成、更快的多圖像提示和角色創建,速度比同類模型快 800%。 Dream Machine 的更新還包含更直觀的用戶界面、自然語言理解功能,以及文本到影片的顯著改進,提供更強的創意協作體驗。

(圖片來源:Luma Labs/Photon AI image)


  • GitHub 推出「Spark」,一款無代碼平台,允許用戶通過簡單的 AI 文本提示快速創建應用程式。 Spark 聚焦於製作簡易應用(稱為「sparks」),使用多個模型如 Claude Sonnet 3.5 和 OpenAI 的 o1-Preview 提供更高效的開發體驗。目前平台僅限內部使用,創建的應用需透過 GitHub 帳號訪問,但其易用性和潛力值得關注。
想每天收到最新AI新聞、與同好交流AI新知?快加入 [傑瑞AI讀書會]
分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.