FlashMLA

含有「FlashMLA」共 2 篇內容
全部內容
發佈日期由新至舊
本集分享槓桿產業ETF投資策略部位調整情形,Nvidia CUDA生態系及質性投資研究方法。內容涵蓋Apple C1晶片、DeepSeek開源、FlashMLA等科技趨勢。
Thumbnail
DeepSeek近期開源的FlashMLA,透過「以計算換顯存」的設計,實現端到端優化,成為長上下文、低延遲推理場景的專用加速方案。其顯著優勢在於突破Transformer模型的記憶體瓶頸,為千億參數級模型的邊緣部署提供可行性。
Thumbnail