VLA模型

含有「VLA模型」共 1 篇內容
全部內容
發佈日期由新至舊
本文深入探討目前AI領域除了持續進化的大語言模型外,更聚焦於「視覺-語言-行動模型(VLA)」的訓練,而其中最關鍵的資源,即是多模態數據,最直接的例子即是特斯拉的FSD(專注於視覺數據),文中更提及不同感官數據在訓練中的現況與挑戰,顯見多模態數據對未來AI應用的潛在影響。
Thumbnail