
好的,我是Mech Muse。
今天分享一場關於人形機器人領域的深度訪談,這場對話揭示了通用型機器人的商業潛力、技術突破,以及Figure AI公司所設定的宏偉目標。
分享的內容,來自 「Bloomberg Live」 頻道上傳的一段影片,主題是 「Figure AI CEO on Building General Purpose Robots」(Figure AI 執行長談通用型機器人的打造)。在這次訪談中,Figure AI 的執行長Brett Adcock不僅討論了公司在人形機器人領域的快速進展,更闡述了他對該技術在近期內商業化和規模化部署的「最大膽」的願景。執行長認為,人形機器人不僅將會是人類有史以來見過的最大規模的產品發布,還將締造出我們前所未見、規模數倍於以往的龐大事業。
這場對話揭示了Figure AI如何從一家新創公司迅速成長,將科幻小說中的夢想轉化為實際部署在商業環境中的日常勞動力。
人形機器人——通往未來商業的最大挑戰
1. 創立初衷與時代機遇
Figure AI 的創立僅在三年前,當時執行長在德拉瓦州提交了公司文件,決心投入人形機器人領域。他坦言,自己從小深受科幻片的影響。他將創立這家公司視為一位創辦人可以面對的「終極難題」,不僅極具挑戰性,更可能成就我們一生中最重要的事業之一。
他認為,現在是啟動這項事業的正確時機。他意識到,無論是在機電方面(electromechanical side)還是在軟體方面(software side),將所有要素整合起來,已經具備了成功的條件。
Figure AI 的目標非常明確:打造出「合成人類」(synthetic humans),讓它們能夠外出執行像人類一樣的工作。
2. 商業化進展與Figure 2的能力
執行長指出,目前人形機器人領域已經進入了實質性的商業部署階段。Figure AI 的機器人如今已在商業勞動力中「每天都在工作」。
Figure 2 是該公司的第二代機器人,其設計目標是能夠完成「普通人類可以做的絕大多數事情」。這包括了運動範圍(range of motion)、扭矩(torques)、有效載荷(payloads)和速度等方面,基本上做到人類在身體上能做到的事。
Figure AI 的市場策略分為兩大領域:
- 商業勞動力(Commercial workforce): 這是全球GDP的一半所在,執行長認為這將建立起全球最大的業務。他們看到全球勞動力人口正在下降,因此這塊需求極大。
- 消費者家庭(Consumer household): 機器人能夠執行日常家務,例如洗衣服、整理碗盤、清理兒童玩具等。
3. 追求完全自主性:遠離遙控操作
Figure AI 的核心理念是實現大規模部署,且「無需任何人類參與或干預」。執行長強調,他們不希望在市場上進行任何遠程控制或遙控操作(teleoperation)。
雖然Figure AI目前會將遙控操作用於數據收集工作及其他類型測試,但在實際的自主活動中,Figure 2機器人已經無需遙控。如果一家公司從第一天起就沒有設定這個「零干預」的目標,他們很快就會陷入「局部最優解」(local maximum)。
4. 規模化製造:從汽車到消費電子
Figure AI 對於其機器人的大規模生產設定了非常宏偉的目標。執行長透露,他們的製造設施(稱為Bot Q)目前每條生產線的年產能為 12,000 台機器人。
Figure AI 的目標是在 四年內出貨 100,000 台機器人。雖然這聽起來需要大幅提升產能,但執行長對此抱持高信心,並表示他們已經從零開始建立了製造流程和製造執行系統(MES)。
他認為實現這個目標的關鍵在於對製造性質的重新理解。他強調,人形機器人製造並非「汽車製造」,而是「消費電子產品製造」。他認為,雖然製造本身絕非易事,但這個過程比汽車製造「更容易幾個數量級」(several orders of magnitude easier)。
此外,透過硬體創新,成本也得到了顯著控制:Figure 3 機器人的成本比 Figure 2 竟然便宜了 93%。
5. 實際應用案例:BMW與物流業
Figure AI 已經公開的客戶是汽車製造商 BMW。
在BMW的車身車間(Body Shop),Figure AI的機器人每天都在執行繁重的工作,主要任務是來回搬運金屬板材(sheet metal),並將它們放置到固定裝置上,以便後續被焊接到汽車底盤。這是一個真實的商業合作關係,而不僅僅是一個試點專案(pilot)。
這段合作關係為 Figure AI 帶來了極大的價值:讓他們學習如何在客戶現場每天可靠地運行機器人。這涉及到網路存取、安全整合、與製造執行系統(MES)的整合,以及確保機器人全天運行且幾乎沒有人工干預。目前,Figure AI的機器人表現優異,執行長提到在過去30天內,他記憶中幾乎沒有發生過硬體故障。
除了BMW,Figure AI 也已經簽署了第二個客戶,處於物流領域。雖然執行長沒有點名,但彭博社報導稱該客戶可能是 UPS。
在物流領域的應用中,機器人需要處理各式各樣的包裹(紙箱或塑膠包裝)。這項工作極具挑戰性,因為每一個包裹,在每一次接觸時都是不同的。機器人不僅需要達到人類的速度和準確性,還必須在 3 到 4 秒內完成分類、將包裹上的條碼面朝下,並像人類一樣將塑膠包裝壓平,以便下線掃描儀可以讀取。這需要極高的精度,但也需要柔和的觸摸(softness of touch)。
執行長自信地表示,Figure 2 或 Figure 3 機器人可以做到在訓練中從未見過草莓的情況下,也能拾起草莓而不壓碎它。這證明了其控制系統具有高度的控制能力和泛化能力。
6. 垂直整合與人工智慧策略
Figure AI 的核心「首要指令」(prime directive)是 銷售「工作」(Sell Work)。
執行長強調,他們賣的不是硬體、不是模型許可,而是「每小時的產出」(output per hour)。Figure AI的目標是提供一個垂直整合(vertically integrated)的全堆棧解決方案。用戶只需與機器人對話,機器人就能智慧地輸出動作並完成工作。
Figure AI 發現,要實現這個目標,他們必須親自設計所有的硬體、電子設備、軟體、模型訓練和製造,然後將其投入服務並確保其有效運行。他們不能僅僅提供硬體或模型,然後讓客戶自己去解決問題。
在人工智慧方面,Figure AI 決定獨立進行軟體開發,而不是建立在外部模型之上(例如OpenAI)。執行長認為,他們自己做會做得更好,並且他們發現自己完成了大部分工作。
在模型架構上,Figure AI 使用了一個開源的深度學習骨幹網(open source DALL-E backbone,可能是CLIP/ViLLE,用於視覺化推理)。這為機器人提供了語義智慧(semantic intelligence),讓它能夠理解「草莓」是什麼,以及如何與之互動。在此基礎上,所有的數據收集、模型開發、訓練以及推理時間測試,都由 Figure AI 自己完成。執行長自信地宣稱,他們在人形機器人上的 AI 工作做得比地球上任何人都好。
7. 競爭優勢:數據、成本與資本
對於工程師提出的「需要 10,000 個機器人在現場生成數據,還是需要 10,000 個 GPU」的問題,執行長的回答明確:他們現在面臨的是數據問題和機器人問題,而不是 GPU 問題。
Figure AI 相信,隨著他們將更多有用的機器人投入市場,機器人的生產成本會因製造經驗曲線效應而下降。更重要的是,這些部署在市場上的機器人會「每天學習並變得更好」,並與整個機器人集體(collective fleet)分享學習成果。
執行長將人形機器人領域描述為一個可能是「贏家通吃」(winner take all)的市場,因為人們總是希望擁有最便宜、最聰明的員工或助手。能夠將大量有用機器人推向市場的團體,將獲得巨大的優勢和領先地位。
在資本方面,執行長表示 Figure AI 擁有極佳的資本狀況。他們目前的資產負債表上的現金可能比所有人形機器人團體歷史上籌集到的資金總和還要多。他們有足夠的資金進行訓練、購買 GPU,製造數千甚至數十萬台機器人,並招募和激勵全球最優秀的團隊。
儘管有人將 Figure AI 與 Elon Musk 和 Tesla 的 Optimus 項目相提並論,執行長表示他們不會花太多時間關注競爭對手。他認為, Figure AI 在人工智慧和人形機器人領域,已經展現出全球最優秀的真實世界進展,並希望保持這種市場領先地位。
8. 結論:軟體定義的未來
執行長總結道,他們正處於一個關鍵的轉折點:硬體已經可靠且有效。下一步的重點是人工智慧:
「我們的Figure 3 機器人做你的洗衣工作,不需要任何硬體變更。需要的只是軟體。只是數據。」
AI 的加入使得機器人能夠進行類似人類的活動,從人類那裡學習,並隨著時間推移而進步。這股強勁的動力,正是 Figure AI 團隊每天努力工作的興奮所在。Figure AI 正在將一個難以置信的、高難度的目標,通過垂直整合和對自主性的堅持,逐步帶入現實。