2026-03-31 AI news Notes

Chrouos

發佈於AI room

2026/04/28 更新2026/03/31 發佈閱讀 7 分鐘

Roblox 用 AI 即時翻譯 16 種語言，聊天延遲壓到約 100ms
做了一個統一的多語翻譯模型，一次支援 16 種語言、共 256 種翻譯方向

代價是模型會很大

Roblox 最初的模型大約有 10 億參數
再用 knowledge distillation 把模型壓縮到 6.5 億以下參數
並搭配 quantization 和 model compilation 進一步加速

系統會先查 翻譯快取，命中就直接回傳；
如果沒有命中，再用 dynamic batching 把多個請求一起送進 GPU

Roblox 推出 16 種語言版本的 AI 即時聊天翻譯 | Roblox

補充：Roblox 當時已在平台上線這項功能，適用於使用 TextChatService 的體驗。官方也提到，早期測試對聊天互動量、停留時間與遊玩品質都有正向影響。

Mistral 的 Voxtral TTS

是一個 4B 的文字轉語音模型，支援 9 種語言，能用很短的語音片段做聲音複製，並強調自然度與低延遲。

Mistral AI開源文字轉語音模型Voxtral TTS | iThome

補充：Voxtral TTS 建立在 Ministral 3B 上，支援 9 種語言與短語音提示做 voice cloning。開放權重版本提供固定聲線，完整可自訂聲音的能力則放在 Mistral AI Studio。

Meta 的 Avocado 系列進度不如預期

Meta 傳延後發佈全新 AI 模型 Avocado：性能落後 Gemini 3 | 鏈新聞 ABMedia

報導引述 NYT 與 Reuters，Avocado 並非失敗，而是介於 Gemini 2.5 和 Gemini 3 之間，所以 Meta 選擇延後發布

文中也提到 Meta 內部曾討論短期授權 Gemini 來支撐部分產品

Claude Code Channels

它讓使用者可以透過 Telegram 或 Discord，直接對既有的 Claude Code session 傳訊息派任務

Anthropic公布Claude Code Channels，開發人員可用Telegram、Discord和Claude溝通 | iThome

補充：它本質上是把外部訊息或 webhook 推進既有 Claude Code session 的事件通道。現階段仍是 research preview，需 Claude Code v2.1.80+，且目前不支援 Console 與 API key 驗證。

算力競爭已經變成國家級、產業級規模

Musk 的 Terafab 想做的不只是晶片，而是把 logic、memory、packaging、testing 都整合在一起，甚至延伸到太空中的 AI 衛星算力未來 AI 的瓶頸不只在模型，而在晶片供應、電力、封裝、散熱、部署位置。

OpenAI砍掉Sora，OpenAI 要把影片產品線（含 app、API）收掉

把算力與重心轉去下一個模型「Spud」，猜測：

算力有限，要集中火力在更核心模型
企業市場競爭變得更重要

Anthropic 推出研究預覽版，讓 Claude 可以直接操作桌面

把 AI 從「回答問題」往前推到「直接代操作」目前是 research preview

ARC-AGI-3 上線

主打測試 AI 是否能像人類一樣，在沒教學、沒特別訓練下，進入陌生互動環境並快速學會解題。結果文中列出的 frontier models 幾乎都不到 1%，例如 Gemini 3.1 Pro 0.37%、GPT-5.4 0.26%、Claude Opus 4.6 0.25%，但人類測試者是 100%

測的不是背過多少知識，能不能在新環境中即時適應

Anthropic 想教育使用者，AI 的價值不是只靠模型，而是靠上下文設計能力

未來職場差距可能不只是「有沒有用 AI」，而是「會不會正確地把任務脈絡交給 AI」。AI literacy 會慢慢變成新的工作能力門檻。

Apple 取得 Gemini 完整存取，可縮成離線 Siri 模型

強化 Apple 在 on-device AI 的能力
結果：代表 Apple 可能更積極補強 Siri 的 AI 競爭力。限制：缺少官方技術說明與產品時間表。

Google新演算法TurboQuant 標榜僅需六分之一存儲數量嚇趴記憶體 | 產業熱點 | 產業 | 經濟日報

LLM 記憶體用量縮減 20 倍！NVIDIA 超狂新技術 KVTC，靠「KV 快取」翻轉記憶體瓶頸 | TechNews 科技新報

TurboQuant: Redefining AI efficiency with extreme compression

Google 的 TurboQuant 主打把 LLM memory usage 降到原本的 1/6，並提升推論速度，重點在於壓縮 KV cache

補充：Google Research 原文更精確地說，TurboQuant 是一組向量量化方法，背後結合 PolarQuant 與 QJL，不只可壓 KV cache，也可用在 vector search。官方強調在多個 long-context benchmark 上，KV memory 可壓到約 1/6 甚至更低，同時維持幾乎無損精度，注意力計算速度最高可到 8x。

對照來看，NVIDIA 的 KVTC 比較像另一條路線：不改模型權重，借用類似 JPEG 的 transform coding 思路壓縮 KV cache，特別適合長上下文、多輪對話、agentic workflow 與 iterative RAG。

隨便紀錄，參考各個電子報，文筆請 ChatGPT 潤飾

含 AI 應用內容

留言

Chrouos 的空間

1會員

10內容數

隨筆紀錄

你可能也想看

模型日誌

[模型開箱]-HGWM 020 水星的魔女重裝型佐渥特

「長程飛行的武裝基座。」組裝複雜度：D 英文名稱：Zowort Heavy 登場作品：機動戰士鋼彈水星的魔女型號：F/D-20 類型：量產型MS 用途：通用作戰全高：18.2米重量：40.3噸塗裝：軍綠、灰、深藍所屬勢力：佩爾公司駕駛員：一般駕駛員模型類別：

#模型開箱#機動戰士鋼彈#HG系列模型

2026/03/30

模型日誌

[模型開箱]-HGWM 020 水星的魔女重裝型佐渥特

#模型開箱#機動戰士鋼彈#HG系列模型

2026/03/30

釀電影，啜一口電影的美好。

吃完飯後再談道德，除魅之後再復魅：巴里．柯斯基與柏林劇團的《三便士歌劇》

全新版本的《三便士歌劇》如何不落入「復刻經典」的巢臼，反而利用華麗的秀場視覺，引導觀眾在晚期資本主義的消費愉悅之中，而能驚覺「批判」本身亦可能被收編——而當絞繩升起，這場關於如何生存的黑色遊戲，又將帶領新時代的我們走向何種後現代的自我解構？

#2026北藝嚴選#BarrieKosky#BerlinerEnsemble

2026/03/10

釀電影，啜一口電影的美好。

吃完飯後再談道德，除魅之後再復魅：巴里．柯斯基與柏林劇團的《三便士歌劇》

#2026北藝嚴選#BarrieKosky#BerlinerEnsemble

2026/03/10

模型日誌

[模型開箱]-HGGB 002 Hi-ν鋼彈(GPB配色)

「拆了三台Hi-ν，努力還原三台可動浮游砲的製作模型。」組裝複雜度：B 英文名稱：Hi-ν Gundam GPB color 登場作品：模型戰士鋼彈模型製作家起始G 型號：RX-93-ν2 類型：新型新人類用泛用型專用機MS 用途：- 全高：20.0米重量：27.9噸塗裝：黑

#模型#鋼彈#開箱

2025/07/20

模型日誌

[模型開箱]-HGGB 002 Hi-ν鋼彈(GPB配色)

#模型#鋼彈#開箱

2025/07/20

TommyChueng的沙龍

Anthropic推出Claude 3新模型系列，優於同行在多項評估基準上表現

AI圈新出了一匹“黑马”。当地时间3月4日，人工智能初创企业Anthropic宣布推出Claude 3大模型系列。该系列包括三个型号，按照性能从弱到强分别是Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus。

#模型#人工智能#OpenAI

2024/03/05

TommyChueng的沙龍

Anthropic推出Claude 3新模型系列，優於同行在多項評估基準上表現

#模型#人工智能#OpenAI

2024/03/05

Amily的沙龍

在理解與拒絕之間：從多重身分觀看《海妲．蓋柏樂》

若說易卜生的《玩偶之家》為 19 世紀的女性，開啟了一扇離家的窄門，那麼《海妲．蓋柏樂》展現的便是門後的窒息世界。本篇文章由劇場演員 Amily 執筆，同為熟稔文本的演員，亦是深刻體察制度縫隙的當代女性，此文所看見的不僅僅是崩壞前夕的最後發聲，更是女人被迫置於冷酷的制度之下，步步陷入無以言說的困境。

#2026北藝嚴選#北藝嚴選#臺北表演藝術中心

2026/02/28