salon cover

夜星的沙龍

4內容數

或許這裡更接近作為一個個人知識庫,我通常運用大模型來協助整理我所感興趣的資訊,除了放在自己電腦中,或許進一步分享出來會更有趣.

精選內容
avatar-avatar
夜星
DeepSeek近期開源的FlashMLA,透過「以計算換顯存」的設計,實現端到端優化,成為長上下文、低延遲推理場景的專用加速方案。其顯著優勢在於突破Transformer模型的記憶體瓶頸,為千億參數級模型的邊緣部署提供可行性。
Thumbnail
擁有者
或許這裡更接近作為一個個人知識庫,我通常運用大模型來協助整理我所感興趣的資訊,除了放在自己電腦中,或許進一步分享出來會更有趣.
追蹤最新動態, 和同樣興趣愛好的人一起交流