在去年的特斯拉人工智慧日 AI Day 時,特斯拉正式宣布他們的人型機器人計畫,引發了外界的高度關注。特斯拉創辦人 Elon Musk 甚至說,他認為特斯拉的機器人計畫,未來的市場潛力可能會高於他們的電動車。而這個內部代號為 Optimus 的人型機器人原型機,在上個周末的 2022 年特斯拉 AI Day,正式現身在全世界觀眾的眼前,展示了過去一年來,特斯拉在這個領域研發的成果。
在這次的 AI Day 上,特斯拉的人型機器人 Tesla Bot 原型機 – 代號 Bumble C,在舞台上,進行了走路與簡單的肢體動作,並且也在影片中,展示了這台原型機,能夠在辦公室內搬運包裹、拿著灑水器澆花,以及在特斯拉工廠內搬運零件的一些測試。整體而言,特斯拉的人型機器人計畫,在不到一年的期間,的確開發出了一定程度的成果。
不過,在本次展示後,網路上也出現了不少的唱衰聲音,其中一個最常見的批評,就是特斯拉的機器人動作,比起知名的波士頓動力 Atlas 機器人流暢的動作,顯得遲緩很多,這些批評者以此為依據,認為特斯拉的機器人很不怎麼樣。而另一個常見的批評,則是環繞在人型機器人的本質上 – 在工廠已經有機器手臂機器人的狀況下,開發人型機器人真的有意義嗎?
在幾個月前,當時科技巨頭解碼第一百二十期「亞馬遜、特斯拉、NVIDIA 紛紛進場,機器人的時代就要來了嗎?」,針對於即將開始起飛的機器人領域,做了些探討。而其中也有簡略提到我對於人型機器人這個構型的想法。不過,在特斯拉展示出初步開發成果的此時,我覺得我們可以更深入來思考,究竟人型機器人是否是機器人未來一個重要的產品形式。
所以,本期的科技巨頭解碼,就來與大家討論,對於特斯拉人型機器人的這兩個主要批評是否合理,以及其盲點在哪裡。
廣告單元示範 – 本廣告欄位,可置入 150 字的文字廣告以及一個對外連結。透過競標科技巨頭解碼 NFT 系列每月限量一隻的洗腦機器人 Brain Washer NFT,就可以獲得對應月份科技巨頭解碼公開文章廣告板位的廣告權。Brain Washer NFT 即將於今年 2022 第四季正式推出。
與波士頓動力機器人的差異 – 大腦
針對於把特斯拉機器人與波士頓動力機器人放在一起比較的批評,我個人認為這樣的討論是毫無意義的。波士頓動力的機器人,與特斯拉的機器人,雖然同為人型機器人,但基本上卻可以說是完全不同的產品,服務於不同的目的。這兩者之間的差異,就像是勞力士與 Apple Watch 一樣,雖然同為手錶,但希望做到的事情是完全不一樣的。
基本上,波士頓動力的人型機器人 – 最新的版本是 Atlas,是一個針對機器人運動能力優化,用來研究機器人動力學的機器人。波士頓動力的機器人,原本是一個以研究為主的計畫,對於他們來說,這個機器人並不是以商業價值為目的開發的。在波士頓動力最新的機器人展示中,他們的機器人可以以非常流暢的動作進行跑酷 – 如果未來我們要舉辦機器人運動大賽,波士頓動力的機器人應該可以很輕易地拿下冠軍。
然而,如果不是比較運動能力,波士頓動力的機器人,恐怕就無太多的用武之地了 - 就像掃地機器人,除了去除地面灰塵以外,你要掃地機器人從事其他的工作是做不到的一樣。雖然波士頓動力內部的機器人專家,很努力調校出一台可以做出後空翻的機器人,但對於這台機器人的大腦,其演算法要能夠調整到去從事其他的工作,恐怕是件非常高難度的任務。雖然過去波士頓動力曾經展示過他們的機器人能夠拿起箱子,但那可能是更偏向事先預寫程式 (preprogrammed) 的作法,而機器人辨識箱子的方式,也是依靠二維條碼,而非以人工智慧進行視覺辨識。由於波士頓動力之前也並未發表過任何深度學習與神經網路的人工智慧研究成果,所以假設其機器人,並不具備一個真正的大腦,其實是合理的推論。
波士頓動力機器人雖然也展示過能搬箱子但應該是預先編程任務的做法
相對的,特斯拉的人型機器人,從一開始就很清楚知道它的存在意義 – 這個機器人,是為了幫助人類處理人類不想做的繁重勞力、或者是危險工作而被開發出來的。而對於服務這樣的存在目的,運動能力並不那麼重要,基本上能走路、能上下樓梯、能彎腰與搬東西,大致上就差不多了。真正重要的,是要有一個能夠理解任務與執行任務的大腦 – 這也是為何 Elon Musk 說他們的機器人最重要的一點是擁有一顆大腦的原因。
對一個要執行勞力工作的機器人來說,真正重要的技術是辨識執行環境,以及規劃任務後並且執行的能力。假設你希望一個工作用機器人幫你到倉庫拿一個椅子來,這個機器人必須首先能順利走到倉庫,然後在倉庫裡面辨識出哪個物品是你要的椅子,接下來有能力拿起椅子,並且順利的移動到你的面前。在這樣的流程中,幾個關鍵的能力包括了 - 「任務理解能力」、「自動導航能力」、「物品辨識能力」、以及「拿取物品運送回來的能力」 - 這四個能力之中,除了最後一點跟機器人動力學會有點關係,其他三點基本上都是電腦 – 或者是說機器人的大腦裡面的工作。也就是說,要能夠執行工作任務的機器人,其腦中所具備的人工智慧能力,才是核心的關鍵。
特斯拉機器人的大腦可以辨識物體並且知道如何使用與操作
而很有趣的是,在我們剛剛說的這個機器人大腦的能力上,幾乎高度與自動駕駛汽車的人工智慧能力重疊。這很可能也是為何特斯拉對於機器人發展方面有足夠自信的原因 – 辨識物體,判斷如何與物體互動,基本上就是自動駕駛人工智慧的最根本要素。對於特斯拉來說,他們可以說是將相同的系統,分別裝在自動駕駛汽車與機器人上。或許特斯拉的機器人,比起運動能力,永遠比不上波士頓動力,但他們其實也沒有理由要追上。因為對於特斯拉的人型機器人來說,是否擁有一個能正確理解、辨識、判斷與規畫工作的大腦,才是能不能執行好工作任務的關鍵。
在人類社會中,一個傑出的工匠,即使運動能力比不上籃球選手,也不會減損他的存在價值。在機器人世界,其實也是。
人型機器人是否是正確的研發方向
接下來,讓我們來討論第二個批評,也是更根本的問題 – 到底人型機器人,是不是一個值得被研發的機器人發展方向。
在科幻小說世界中的機器人,大多都是人型機器人 – 畢竟對於人類來說,人型機器人是最容易想像的機器人形式,是一種人類物種的想像延伸。然而,在產業界的實作中,很快就發現了 – 人型未必是機器人最適合的構型,在不同情境下,特定構型的機器人反而比人型機器人更加適合作業。
對我們一般人的生活體驗來說,最能理解的就是掃地機器人與自動洗碗機了。一台圓盤型的掃地機器人,其掃地的效率,絕對高於一個人型機器人拿著掃把與畚箕。而一台箱型的自動洗碗機,其洗碗能力也絕對比一個拿著抹布站在洗手台前的機器人更好。在特定任務上,如果有一台專門做該任務的機器人或自動機器,這種單一用途的機器設計,通常會比人型機器人更有效率。
而在工廠場域,最常見的例子就是所謂的機器手臂 Robotic Arm了。所謂的機器手臂機器人,顧名思義,就是整台機器人,其實就是一個大型的手臂,前端具備特定的功能,或者是抓取零組件,又或者是進行焊接,也有可能是進行組裝等工作。通常在高度自動化的工廠裡面,都會有大量的機器手臂,來從事一些高度重複性的作業。機器手臂通常是為了單一的任務優化,如把 A 零件與 B 零件組裝在一起,又或者是在某個零件上固定鑽出一個特定大小的孔,而由於任務單一,機器手臂在執行特定任務時的效率,通常遠勝於人類員工。
在倉庫場域,則是使用所謂的 AMR 自主移動機器人,配合特製的貨艙或貨架,來擔任倉庫內物件運輸的工作。以亞馬遜為例,他們的 AMR Proteus,就能夠配合特製的可移動貨架,在其倉庫裡面成為搬運物品的機器員工。事實上,在亞馬遜的倉儲內,他們是同時使用了機器手臂與 AMR,達成一個高度自動化的倉庫系統。
考慮了上述的案例,外界會對人型機器人的構型是否有必要性存在著疑問,是很可以理解的狀況。即使是我,在一開始聽到特斯拉想做人型機器人的時候,也曾經懷疑過,這樣的方向真的沒問題嗎?不過,當進一步深入思考這個問題之後,我開始發現,其實人型機器人的構型,並沒有一開始直覺的那麼不合理 – 事實上,我發現人型機器人,的確很有機會能夠有其市場,並且在人類的未來發展上,扮演相當重要的角色。
人型機器人構型的存在理由 – 通用性
支持人型機器人構型的第一個理由,在於其通用性。雖然在被界定好的特定任務上,專用的機器人 – 如機器手臂等絕對會有更好的執行能力與效率,但並不是所有的工作都有足夠的經濟效益,能夠支撐一台專用的機器人。舉例來說,在一個工廠中,可能有一個每天要被執行一千次的工作任務,這個任務如果花錢研發與購置專屬的機器手臂,經濟效益可能會很划算,因為執行的次數夠多,機器人被好好的物盡其用了。但是在同一個工廠之中,可能有另一個任務,每天只會執行五次,對於老闆來說,要為了這麼少的次數,設計與購入專用的機器人,其實一點都不划算,這台機器人,很可能 99% 的時間都處於閒置狀態,而以十年為期來說,很可能這個任務用人力處理所耗費的金錢,也遠低於購入特製化的機器手臂。對於這樣的任務,由於經濟效益不支持,最終在工廠內,還是會由人工來手動處理。
而人型機器人,正好可以補上這個位置,替人類勞工,處理這些經濟價值上無法有專屬特製機器人的工作。由於人型機器人的設計,基本上就是模擬所有人類身體所能處理的工作,所以理論上絕大多數人類員工能做的工作,人型機器人都有機會能夠處理。舉例來說,如果在沙發工廠裡面,每組沙發會需要兩個工人把沙發搬上卡車運到店面,假設今天有一個工人生病請假,其實他的位置可以由一個人型機器人,用一模一樣的動作與姿勢,與另一個真人勞工一起把沙發搬上卡車。又或者是有一台手推車上面載滿零件,要從工廠二樓搭電梯運到三樓,人型機器人也可以用雙手推著這台手推車,推到電梯裡面,按下一樓的按鈕,就如同一個真人員工一般,完成這種隨機性與變化性都高的任務。
如果說,專屬特定構型的機器人,是為了在特定任務上,產生比人類員工手動作業高上數十倍的效率的話,人型機器人顯然是為了另一種目的存在 – 替那些高度隨機化、無法有經濟規模製作專屬機器人的各種瑣碎任務,提供一個與人類員工差不多效率的替代品。
事實上,即使是在汽車生產這樣已經大量使用機器手臂,大量自動化的工廠裡面,都仍存在著很多仍須仰賴人工的作業。對於特斯拉來說,他們自己運作的超級工廠,裡面就是大量地使用各式各樣的機器手臂,而如果連他們內部都覺得人型機器人能補上其工廠的缺口的話,那就更別提其他自動化程度更低的工廠了。如果我們來思考一個簡化後的工廠內部運作 – 假設一家工廠內,有五個工作程序,每天會進行一千次,有十個工作程序,每天會進行一百次,還有一百個工作程序,每天會進行十次 – 對於那每天會進行一千次的五個工作任務,建置特定專用機器人可能是很合理也有經濟效益的,但對於每天執行一百次的任務,很可能就未必了,至於那些每天只會執行十次的任務,就絕對不值得打造專用的機器人。而人型機器人,因為其與人類員工的高度相容性,反而讓它具備了通用性,能夠執行後面的這兩類工作程序。
這其實很像我們電腦內的運算分工 – 每台電腦裏面,都擁有一顆能夠執行各種任務的 CPU,這是一個通用計算的處理器。然而,如果有特定任務執行量很大,那就值得打造一顆專屬的處理器,如顯示卡上的圖形處理器 GPU。固然 CPU 在圖形方面的處理效能,遠遠比不上 GPU,但一台電腦中,要執行的運算任務可能成千上萬種,不可能每一種計算都有一個專屬晶片,所以,除了被獨立出來的如圖型運算、浮點運算等任務以外,大多數的任務,還是依靠能執行通用任務的 CPU 來處理。
所以,即使人型機器人,無法具備如機器手臂或掃地機器人這樣針對特定任務的強化處理能力,但其通用性卻能夠讓它仍然具備高度的商業價值。
人型機器人構型的存在理由 – 即插即用的普遍可使用性
什麼是即插即用的普遍可使用性呢?簡單來說,就是任何人或者是工廠,買了這台機器人,真的能夠馬上對他們發揮價值的可用程度,而這可能是人型機器人,另一個贏過特定構型的專用機器人的優勢。
在一些最先進的自動化工廠或是智慧家庭之中,整個環境是高度整合的,是由許多智慧機器來做協同處理。也就是說,A 機器人的工作,是把任務交給 B 機器人,而 B 機器人處理完後,接下會由 C 機器人進行後續處理作業。舉個例子來說,亞馬遜的倉儲內,會由機器手臂把貨物放到置物箱中,再由 AMR 自主移動機器人將貨架移到要出貨的區域。而在一個智慧家庭之中,你必須同時要有智慧音箱、智慧燈炮、以及無線網路,才能夠在客廳講一句話就把書房的燈打開,缺一不可。也就是說,在一個最理想的智能環境中,每個設備與機器人,都需要能夠互連,能夠互相溝通,才能夠達成完美的運作。
然而,很不幸的是,上述的理想狀況,只發生在不到百分之一的工廠,以及可能是萬分之一的家庭。絕大多數工廠與家庭的智慧化程度,其實都距離這樣的理想狀態很遠。而對於這些應用場景來說,如果要全面數位化智慧化,很可能是一筆投資不起的巨大金額 – 假設你是一間獨立經營的超商,你很難能夠像亞馬遜那樣投資一整個智慧倉庫。
而假設你把一台最先進的專用特定構型的機器人,交給了這些工廠,事實上反而會淪為無用武之地,因為所有配合這台機器人運作的環境,這些工廠是沒有的,而工廠也不可能額外多花一大筆錢去建置這個環境。但對於這些工廠,人型的機器人反而是可以即插即用的,因為這些人型機器人,可以直接融入人類員工可以工作的環境,直接開始作業,而不需要環境來配合他們。
或許舉個居家的例子大家可以更容易了解 - 假設你在家上班,希望能夠有個機器人,能夠幫你從冰箱把可樂送到你的書房工作區 – 一個最理想的智慧家庭環境應該是,你透過手機或智能音箱發出命令,而一個四輪的小型載貨機器人(類似亞馬遜的 Astro),先跑到智能冰箱旁,用無線通訊告訴智能冰箱它需要可樂,而智能冰箱的人工智能辨識出哪個罐狀物體是可樂後,透過出貨口投放到小機器人的載貨區。小機器人接下來就行走家中的路線,順利到了書房門口。而由於你在書房開著冷氣,所以門其實是關閉的 – 沒關係,因為這也是個智能門,所以小載貨機器人,透過無線通訊,請門自動打開後,機器人就順利把可樂送到你的面前。
在上述的情境中,你需要同時具備一個智能冰箱、一個載貨機器人、以及一個智能開關的門,才能夠打造一個能順利完成任務的整體環境。如果你少了智能冰箱,這個小機器人跑到冰箱前,卻會不知道怎麼拿到可樂。而如果你少了智能開關的門,這個小機器人就會卡在書房門口,無法完成任務。而如果你希望一次拿五罐可樂,但小機器人的載貨倉只能放兩罐,那小機器人需要來回三趟才能夠完成任務。
但如果你是擁有了一台人型機器人,狀況其實就會不同了。這台機器人可以自己走到冰箱前,打開冰箱,用機器人的攝影機與人工智慧,辨識哪一個物體是可樂。然後它可以自己拿出可樂,關上冰箱門,走到你的書房前,自己把門打開,把可樂送到你的面前。而如果你想要一口氣拿個五罐可樂,這個人型機器人也有能力自己拿了一個袋子,幫你把五罐可樂都裝在袋子中拿給你。你不需要擁有一個智能的冰箱,也不需要擁有一個智能開關的門,不需要設定整體的環境,就能夠讓這個機器人完成任務。
基本上,人型機器人,因為它的構型基本上就是人型,並且能夠執行真人能執行的大多數任務,所以即使你的工廠其他部分完全沒有智慧化,這台機器人也能夠直接進去產線,替代真人員工的工作,而不會遇到困難。如果你是家傳統的營造商,每天需要用人工搬運數百包水泥,你想要把這部分的工作減少人力,你會想辦法在每個營造基地都打造成高度自動與智慧化,還是直接買幾台人型機器人當苦力就好呢?
除了通用性以外,人人都很容易就開始使用的即插即用性,是另一個人型機器人值得存在的重大存在價值。
兩萬美元的價格可能嗎
在本次的 AI Day,馬斯克宣稱,未來他希望特斯拉的人型機器人,能夠用兩萬美金的價格推出到市面上。這樣的價格地帶,當然是很驚人的,因為其他的人型機器人研發專案,其機器人成本都遠高於這個數字。事實上,就算特斯拉的人型機器人,一台賣到十萬美金,很可能都會在市場上掀起相當大的銷售熱潮,畢竟,一個工廠真人勞工,在美國一年的雇主成本,可能是超過五萬美元的,也就是說,一台人型機器人,只要能夠穩穩用兩年以上,就絕對是個划算的投資 (以上還沒有考慮到其實機器人可以無止盡加班的利用效率)。若未來特斯拉的人型機器人真的能夠壓到兩萬美元左右的價位,我相信美國的每個工廠、每個倉庫、每個需要實體勞動的地方,都會買個幾台特斯拉機器人,負責幫忙做那些人類不想做的工作。
至於兩萬美元的價格,特斯拉到底做不做得到,就讓我們繼續看下去吧。但考慮到特斯拉在生產上的紀錄,我覺得沒有特別看壞的理由。
文章寫到這邊,看著我辦公室裡面堆滿著電商購物拆箱後剩下來的大小紙箱,我不禁想著,如果這個時候我有一台 Tesla Optimus,這台可以即插即用的機器人就可以幫我把這十幾個紙箱搬到地下室回收區,而我的時間就可以拿來打電動或追劇了,真好。
本期科技巨頭解碼的商業思考
很多批評特斯拉人型機器人比不上機器手臂而沒有用途的人,其實完全忽略了特斯拉自己有好幾個大量使用機器手臂的超級工廠的這個事實。馬斯克一開始就說得很清楚,特斯拉的人型機器人,第一個目標就是在特斯拉的工廠內被大量使用。如果人型機器人真的在他們的工廠上無法大量部署發揮生產力,而只能擔任玩具角色,特斯拉的產品團隊難道會愚蠢到無法發現嗎?除非你認為特斯拉是間超級愚蠢的公司,而且所有開發特斯拉機器人的團隊都是笨蛋,否則這是一個極度不合理的假設。
而當我們的特定看法,出現了一個非常有力的反向論證時,正是考驗我們能不能重新檢驗自己的思考邏輯的時候。當然,我們可以單純的接受特斯拉與他的機器人開發團隊都是蠢蛋的這個答案,但捫心自問,你內心真的相信這件事嗎?