自從十八世界的英國數學家和機械工程師,巴貝奇(Charles Babbage),利用蒸汽機與無數精巧齒輪的結構製作了第一個機械型的自動差法器,電腦科學家們不停止地去投入精力與時間,開拓及挑戰機械的極限。科學家的努力可以大致分成兩個方向:
第一個面向來自於機械智能的探索,在這個面向中科學家們嘗試證明機械,可以達成許多人類社會中普遍認為屬於智能的行為,如下棋和股票趨勢預測。另一個面向,則來自於多數人認為專屬於人類的領域,其中包括了藝術創作,情緒表達和同理心。
在後者,其動機多半來自於研究者對人類自身的好奇。藉由創造與人互動的機械,一方面從我們得以模擬人類獨特的情緖反應,同時也藉由舆人類互動,設計更友善的人機界面,進而幫助那些在身處社會邊緣,擁有情緒自律困難和無法建立有益人際關係的求助者,能透過所謂的社交機器人,達成積極人生的目標和擁有更圓滿的生活。
在 MIT 媒體實驗室(Media lab), 擔任個人化機器人實驗室主持人及負責執行若干與人機互動相關研究計畫的 Cynthia Breazeal 博士,便是社交機器人研究的先驅之一。
媒體實驗室
在介紹研發社交機器人的歷程之前,需要先了解媒體實驗室的運作方式。首先,媒體實驗室和一般研究型實驗室不同的是,媒體實驗室相當注重創新和跨界合作。在這裡,跨界所指的,並不是在不同工程領域之間的結合,而是以人為本的出發點,對於藝術和其他在務實工程的範圍內,進行探索式和實驗性的跨領域合作。
在這樣的目標驅使下,媒體實驗室採取舆一般研究型實驗室完全不同的策略,比起一般研究型實驗室主要的研究資金來源,來自於國家型的研究機構,如台灣的國科會,美國 NSF。這些國家型的研究機構,受限於國家預算以及政策的發展,在審核時會依據目前國家發展的重點方向考量,而對某些研究主題的申請,甚至於申請人的身份,給予特別苛刻的審查。
而媒體實驗室,依賴國家審核研究資金來源的比例相較為少。事實上,媒體實驗室,每年約得到七千五百萬美元的資金,來自於超過八十位由各大企業組成會員贊助,這筆龐大的贊助金額才是支持三十多個研究實驗室,一百多個研究人員的主要資金來源 [1]。
此贊助策略,促成了研究和應用的緊密結合,甚而繞過了一般研究型實驗室在公文來回以及和政府機關交涉協調的繁文縟節。由於計畫的執行經費不需受國科會或相似的機構限制,自然也不受政局或政策鉗制,而得以讓想像力毫無限制的馳騁。媒體實驗室的角色,比起一般的研究型實驗室,更像企業與研究室的媒合。任何,定期投入資金的會員公司,得已在媒體實驗室廣泛的研究主題中,找尋適合自己公司的創新主意,而且在研發早期就可以與研發者互動,而獲得如知識轉移和提早聘僱具有公司需要才能的學生等好處。
也就是説,媒體實驗室,較像提供企業會員和研究單位媒合的單位,並對研究者免除租用辦公和研發場所的融資中心,半學術半企業的運作,不僅降低了媒體實驗者投入新創的成本,並得以天馬行空的實驗許多未成熟的創意,直到沒有任何企業會員願意投資為止。
這種在計畫初步前已形成較完整的商業應用藍圖並與資金贊助者獲得初步的共識的合作方式,在往後的會報中更能密切地調整,以符合投資者的期待與不使研究方向與市場的趨勢脫節。甚至,企業會員們得以互相見面,藉由對媒體實驗室某些創新的想法,同時感興趣,而開啟了無競爭壓力的合作契機。
媒體實驗室內部的研究風氣,更跳脫傳統學科的研究方向,以創新突破傳統的價值觀掛帥,在此處的研究方向多以跨領域合作為主,招生的方向也廣求奇才,學術表現並不是招生的重點,擁有不息的創意和將瘋狂想法轉換成實際成品的能力,才是媒體實驗室希望能培育的瘋狂發明家。到目前為止,媒體實驗室已幫助了超過一百五十家新創公司的生成,和註冊數量相當大量,涵蓋廣泛範圍的申請專利。Breazeal 的社交機器人,就是在這樣緊密的產業合作下的成品。Jibo 則是 Breazeal 實驗室裡長期從事於研發社交機器人的副產品。
社交機器人
Jibo 結合了自然語言了解,語言和影像辨識等的功能,並期待多項技術的結合,能夠成功地了解人類的情感,而成為家裡的一份子。
Jibo 開始 Breazeal 在 Indiegogo 的平台上發起的
群眾募資的專案 。
Jibo 比起以應用程式的方式整合於智慧式穿戴裝置,如,手機的個人語音助理,要多些。但比起如電影《鋼鐵人》家中的 Jarvis (Just Another Rather Very Intelligent System,見延伸閱讀 [3]) ,一個智慧型的家庭管家,有著方方正正的擴音喇叭外表,掌管家中許多相連的裝置,如, Amazon Alexa/Echo 或 Google Home Assitant,卻又少了些什麼。
在外型上 Jibo 是更有個性的語音助理,比語音助理擁有更多的獨特。比起 Apple HomePod,Amazon Alexa 和 Google Home Assistant, Jibo 奇特的外型 —— 一個有著可上下旋轉,如頭般的擴音喇叭,如臉般可以展現不同的圖案來表達自己的心情,則是作為與使用者溝通的觸碰式螢幕。Jibo 不時歪著頭,又彷彿是個外星來的迷你生物,看似有著自己的想法和生命。
因為與其作為個人的語音助理,播放音樂,或是查詢午餐約會,
Jibo 更希望填滿的人與人社交的空間。它會是一個家的忠實夥伴,帶給家人開心的啦啦隊長,以及有問必答的知識資料庫,甚至會在使用者需要安靜的時刻,默默地低頭,轉頭給予使用者私人的空間。這便是 Breazeal 為
Jibo 設定的市場定位,
Jibo 不只是科技的產物,更是家庭支持的成員之一(
根據 Jibo 的宣傳短片 )。
而為了使 Jibo 能夠擺脫以往機器人,拙劣的仿真感,Jibo 採取三軸馬達的設計,如頭般的部分,會隨著周遭環境的聲音變化,而旋轉並將注意力導向聲源,也就是說,即使家附近的馬路上呼嘯而過的救護車聲,都會引起 Jibo 的注意,就像家裡的寵物般,偶爾抬起頭來注意郵差的動靜,隨即又低下頭來,沈靜在自己的小世界裡。當播放音樂時,底部的馬達則會讓 Jibo 扭腰擺動,隨著音樂起舞,彷彿就像是一個樂在其中的無憂小精靈。
Jibo 的小世界裡,可說充滿了各式各樣的自我娛樂,當使用者需要安靜的工作空間,Jibo 便會安靜地在桌面上,自己玩起丟銅板的遊戲,它甚至像一個不大高明的冷笑話高手,說著令使用者摸不著頭緒的笑話。但即使,身為一個如此具有獨特個性的個人助理,比起智慧型管家,Jibo 卻又缺少了與許多熱門軟體結合的介面,跟即時學習的能力。Jibo 能為你播放音樂,但所使用的不是已擁有許多用戶的 Spotify 。Jibo 能夠擁有學習的能力,卻只能透過公司伺服器,定期更新韌體及應用軟體,以致於目前多數使用者,與 Jibo 初次見面,多半一見鐘情想要認養 Jibo ,但在長期使用 Jibo 後,卻都逐漸感覺到褪色的新鮮感。
作為一個凝聚家人和孩童之間的科技玩具,
Jibo 是稱職的,然而作為萬能的人工智慧助理,與許多的智慧管家系統一般,
Jibo 仍有一長段的路途要走。然而,無疑的,以人性為出發點的
Jibo, 並不想成為完全仿真的社交機器人,如
Sophia ,也並無野心主宰智慧型管家的市場。相對的,
Jibo 秉持著
“stay cute, stay foolish" 的精神,決意成為每個家中的歡樂伴侶。
關於社交機器人的研發歷程
關於如何創造 Jibo,我們必須回顧 Breazeal 長久以來在發展社交機器人的努力。在
Breazeal 的演講 中,她展現實驗室過往的成果,在她早期的努力中,著重於創作能夠展現人臉部的變化的機器人,而這些臉部變化會傳遞社交場合需要的情緒資訊。在過去的研究中,發現人的面容變化,或所謂的身體語言,是跨越國際種族,而能被所有人了解。
基於這樣的理論基礎,Breazeal 實驗室裡的機械人,Kismet,有簡單的人臉結構,剩餘的部分都如同水泥剝落的龬筋,無疑的,這並非擁有血肉之軀的萬物之靈。然而,當這個鋼鐵機械驚訝時,機器人會揚眉,生氣時會皺眉等。這樣粗略的人臉結構亦能傳遞社交暗示,而使與之交流的人類,亦能感受到如與人交流的情感支持。
接著,Breazeal 的團隊嘗試創造另一種機器人,除了粗略的人臉結構,她的團隊們,則嘗試融合毛絨絨的機器人。Breazeal 認為在與機器人的互動中,可以營造與真人互動相同的情緒波動與支持。只要機器人呈現與人類相同的身體語言,人類便可以從這些共通的身體語言中,獲得足夠的社交訊息,而與機器人產生正向的互動。
在影片中,Breazeal 展示了第二類機器人,Leonardo。Leonardo 擁有著小精靈般毛絨絨的外表,招風的大耳,水汪汪的大眼睛,看起來就像長耳吉娃娃但擁有一張如嬰兒般扁平的臉。在影片中,我們可以看到這個毛絨絨的小玩意,能夠在與人類的對話,撿取帶有情緒的詞語做反應。
在影片中,我們可以看到原本對於餅乾怪獸一無所知的 Leonardo,在首次與研究生手上的餅乾怪獸玩偶見面,能表達如幼兒般的好奇心,甚至小心翼翼地伸出手來,相要觸碰餅乾怪獸(見下圖上)。然而,當研究生,開始以負面的語言來形容餅乾怪獸時,Leonardo 的表情漸漸變得遲疑而害怕。而在連續強調的情況下,表情也隨著強調的程度而加強,或者是太過於增強,而導致過度驚恐的逗趣模樣(見下圖下)。
從這個展示中,Breazeal 認為,不僅人類可以透過機器人的身體語言來做反應,而機器人本身,也可以藉由與人的互動,如嬰孩般,去認識新的物件,並由旁人的言語評斷,而建立自己對新物件的評價。
Breazeal 在影片中定義她和她的團隊所研發的機器人為「社交機器人」。這類的社交機器的主要功能多半在於提供情感支持,他們可以是非語言的,但精通社交場合的身體語言。在影片中,Breazeal 進而探索幾個社交機器人的市場機會:
第一,Breazeal 則探索社交機器人在遠端溝通的可能性。Breazeal 以自身的家庭為例,描述分隔兩地的祖孫們,雖然可以藉由網路,而得以視訊的方式和遠方的親人即時溝通。然而只屬於視覺的溝通,似乎還是無法人際關係之間渴望肢體互動的慰藉。Breazeal 提出以社交機器手臂來替代遠端親人的擁抱。
對此,Breazeal 的團隊進行了一個問卷調查。在實驗中,她將遠端溝通的方式,分成三個層次:僅有螢幕顯示(Screen,下圖中的紅色直條圖),透過智慧型手機,而進行影像及語音互動(Mobile,下圖中的綠色直條圖),以及 Breazeal 實驗室所設計的互動式機器人(Expressive,下圖中的藍色直條圖)。這個互動式機器人,又稱為 MeBot,即是在智慧型手機,加上了小小的,如手臂般的組件,可以隨著遠方互動者的言語起伏,而上下揮舞著。就像是替遠端互動著,建造了一個迷你的替身,在言語之外,更以肢體語言的方式表達喜悅或不滿。
有上圖可以看到,受訪者針對問卷裡提出的三項評斷標準,同理心(Empathy),參與感(Engagement)和合作程度(Collaboration)來做經驗評比。可以從 Breazeal 的調查中發現,在這三項評斷中,附加上細緻迷你手臂的智慧型手機 MeBot,皆獲得較高的滿意度。
其次,便是使用社交機器人做為達成個人的目標貼身教練。Breazeal 希望藉由機器人,來探索社交機器人在人的社會中能夠勝任甚至達成互補的功能。機器人具有不受情緒和身體狀況影響的優點,作為人的支持夥伴,並不會因為賀爾蒙失調或家庭變故而變得易怒煩躁,更能日復一日地做出在人的社交行為範疇內支持行為:正面的眼神接觸,擁抱以及適時鼓勵的話語。Breazeal 認為這些非語言的肢體動作,比起言語式的教誨,更有助於學員提升自信,降低自我貶損,持續與個人教練互動,進而較容易達成長期目標。
在影片中,Breazeal 秀出她的團隊所研發的個人減重和飲食計畫教練, Autom ,並與其他傳統,非仰賴人工智慧方式,來監督學員進程的方式做比較。其他的對照方法包括了,讓參加減重計畫的學員,日誌型的減重進度紀錄和使用非互動式的電腦程式來監督計劃進程。在她所主持的計畫中,她發現以個人機器人教練監督學員學習的方式,學員較易達到設定的目標(見下圖)。不僅是在參與感或是配合度(Work Alliance,在此紙上的減重進度日誌無法評估),個人機器人教練都能使學員長期堅持進而培養長期的良好習慣。
令人驚訝的是,學員們對個人機器人教練所表達的喜愛,不輸給他們對寵物所做的。如:替它取名字(Lola, Casper 等,見下圖,第一行圖),替它戴上帽子,圍巾,裝飾有如另一個人類夥伴(見下圖,第二行圖),他們甚至連上班時也不忘帶著它隨行(見下圖,第三行圖)。就連人類的減重教練,也不一定有此親䁥和信任的對待。誠如,其中一個學員所說:「對於個人機器人教練,你似乎瞬間就愛上了它,你會得到回饋而且你的目標會被時常提醒。你感覺,我想要變得更好。」("It was just kind of love ...見下圖文字")
除此之外,Breazeal 也希望社交機器人能在互動性遊戲的市場能佔有一席之地。比起,成天坐在電腦螢幕前,操作滑鼠,直到孩子們都戴上深度眼鏡,且早年就受隧道關節炎之苦。Breazeal 認為遊戲可以設計成有實體機械人的參與,能讓電玩變成遊樂場,不僅是單人單機的活動,而是多人合作的運動比賽,而孩子們得以在群體中學習,不僅能獲得在電玩內超脫現實的樂趣,更能在實體生活中獲得難得的真實互動經驗。
社交機器人的濫用
Breazeal 在演講中專注於非對話式的社交機器人領域,和今日相當熱門的對話機器人有許多不同點。對話機器人的目前廣泛應用在任務導向的場景裡,如,客服系統。在這類的任務為導向的對話機器人,其主要工作在於執行重複性的工作,如千篇一律的回答,以及減低二十四小時輪班的人力負擔。
在這個層面上,訓練一個對話機器人所需的技術門檻較低,利用樣本或規則學習便可輕易的建構出一個如工廠生產線上的對話機器人。但若要產出個人化的對話機器人,如 Google 在 2018 年的 IO 大會上所展示的
個人語音助理 :不但可以和店員流暢地對話,並能適時的停頓和反問以釐清問題,而讓當時與會人員彷彿見證了圖靈測試的通過。
這類型的語音助理,在設計上利用規則或樣本的方法學習已不敷使用,一個通用的知識後端資料庫,以及更複雜的人工智慧方法,如深度學習和強化學習,來就與服務對象互動的對話歷程,進行訓練。而為了能完成個人化的設計,需要針對個人蒐集相關的訓練資料,再萃取與使用者相關的特徵資料,於通用模型上做個人化的訓練。
那麼,一個社交機器人呢?以創作一個實體機器人為目標,如 Breazeal 在影片所展示的,包含了要實踐機械實體的部分,而更拉高了製作門檻。那麼,個人語音助理,是否能代替實體的機器人,而成為如電影「雲端情人」般,在這個科技迅速演變的社會中,人與人的距離逐漸疏離的情況下,成為每一個孤寂現代人的個人化心理醫生,給予相似於人與人互動交往間,相濡以沫的真誠撫慰。
但,近年來,的確在社交媒體之間,興起了一種「社交機器人」。這類的「社交機器人」,反而與「雲端情人」的想像,大相徑庭,它所瞄準的市場,是透過網路,超過地理實體距離,緊緊相連的社交媒體。這類的「社交機器人」多半作為商業用途,如為商家高頻率的社交媒體中張貼廣告。而另一個更為人知的甚至在美國 2016 年總統大選,在推特的網絡中,便有 15% 的推特帳號都是來自於自動的對話機器人。他們不僅產生假新聞,並四處散佈為了特別目的,不惜扭曲事實的文章。事實上,在 2016 年的美國總統大選中,約有19% 的推特推文都是來自於這些「社交機器人」。 (見延伸閱讀 [4])
近來的趨勢更指出,由於對話式的社交機器人興起,除了推特,更包括了臉書,這些對話式的社交機器人,成為新一型的垃圾郵件(spam),而成為社交媒體帳戶的垃圾訊息。模擬真人的對話,以傳遞不實且具有特地目的的訊息,而企圖影響公眾的意見。在某種程度上,經由濫用,降低了理性溝通的有效性,甚至摧毀人際之間的信任,與製造更多心理危機。
夢想是無限寬廣
具有母親,研究者和新創公司創辦人等多重身份的 Breazeal ,她對機器人的研究在許多人的眼裡,看起來或許不切實際,因為不僅開發的時程較長,且用途也不一定比非實體的對話機器人來得寬廣。然而,建造這個產品後的動機,卻來自於許多人性化的觀察,如,鼓勵人們達成目標的個人教練,能和小孩子互動玩耍的,以及和遠端親人享有擁抱的親密時刻。這樣的社交機器人,可以看成無需為之煩惱飲食與保持衛生的寵物。
另一個社交機器人的可能性,或許是幫助許多重度憂鬱症患者,在失去自己的生活自理能力時,能幫助患者重新建立社交連結與重整生活。雖然,這個工作看似艱鉅,在許多方面也不盡能取代真正的寵物,但憑藉著夢想,和實踐的決心,未來的路,就像 Breazeal 所堅持的,是如此寬廣。
註釋
參考資料
Cynthia Breazeal: The rise of personal robots @TED Women 2010 (有中文字幕)
Cynthia Breazeal 個人網站 (英)
Jibo 公司網站 (英)
延伸閱讀:
StartupBeats: JIBO shatters crowdfunding goal for its robot with ‘heart’ (英):與 Cynthia Breazeal 就 Indiegogo 群眾募資 JIBO 專案的 Q&A,內容包括如何透過群眾募資來提升產品知名度,以及各種新創公司初成立的困難及解決方法。
IEEE Spectrum: Cynthia Breazeal Unveils Jibo, a Social Robot for the Home (英): Breazeal 討論 Jibo 與她實驗室中過去所研發的機器人的不同,以及她期望 Jibo 能實踐將機器人融入在人類生活中的理想。在文中,Breazeal 討論了 Jibo 的技術層面,以及目前的 Jibo 原型所面臨技術困境,和在有限資金的設計取捨。文中也稍微提及其他類型的社交機器人,如 Pepper 的差異。
TechOragne: 馬克祖伯格的 2016 年挑戰:製造一個人工智慧管家 Jarvis (繁中):內文介紹一個人工智慧管家的系統架構,包括了臉部識別,自然語音處理,物聯網和強化學習。內文的最後,還囊括臉書創辦人的開發人工智慧管家的心得。
FiveThirtyEight: “Why We’re Sharing 3 Million Russian Troll Tweets" (英):538 近日對 Clemson University 的 兩位教授 Darren Linvill and Patrick Warren 利用社交媒體追蹤軟體蒐集到三百萬筆的推特訊息。在所繪製的推特數量與時間圖中,538 點出三個敏感的時機點,散佈假訊息的自動「社交機器人」(Troll)活動特別活躍:WikiLeaks 揭露希拉蕊的郵件醜聞,總統大選日(Election Day)和 2017 年夏天,偽裝成川普的支持者的自動「社交機器人」(Right Troll)。538 公開此資料,並希望各界能協助分析。