TripoSF 是 VAST AI 打造的新世代 3D 基礎模型,專門處理高解析度和任意拓撲結構的 3D 形狀建模。核心技術為 SparseFlex 表示方法,結合 NVIDIA Flexicubes 優勢,採用稀疏體素結構,只在物體表面附近進行體素資料儲存和運算,大幅降低記憶體用量。TripoSF 可以在高達 1024³ 的高解析度下進行訓練與推論,並原生支援任意拓撲結構。此外,TripoSF 採用了視錐體感知的分區體素訓練策略,只激活並處理位於相機視錐體內的體素,進一步降低了訓練成本。此外,其還建立了基於 SparseFlex 表示的變分自編碼器(VAE),使整個處理流程更高效且完整。
github , huggingface
TripoSG 為 VAST AI 推出的高保真 3D 形狀合成技術,基於大規模修正流(Rectified Flow, RF)模型。透過先進的修正流變換器架構、混合監督訓練策略及高品質資料集,TripoSG 能夠從單張輸入影像生成高保真的 3D 網格模型。主要功能涵蓋 3D 內容自動生成、高解析度三維重建、高保真生成、語義一致性、強大泛化能力及穩定性能。TripoSG 更是首個在 3D 領域使用的 MoE Transformer 模型,大幅提升模型容量,同時幾乎不增加推論成本,效能極為出色。
github , huggingface
TripoSR 為 VAST AI 的開源 3D 模型工具,專注於實現 3D 模型的超解析生成。它採用了創新的 Transformer 架構及幾何感知訓練策略,可有效從低解析度的 3D 模型生成高解析度且細節豐富的模型。在細節強化與結構保留方面表現出色,非常適合對模型精度要求較高的應用場景。儘管 TripoSR 並非最新的模型,但其依然是許多 3D 生成任務中不可或缺的重要工具,為現代 3D 生成技術奠定了堅實基礎。
github , Huggingface