AI,人工智慧,其實不是這幾年才有的,自從圖靈(Alan Turing)提出圖靈機模型和發表【計算機器與智慧】(Computing Machinery and Intelligence)論文以來,人工智慧,一直是程式設計人員、電腦工作者心目中的聖杯,在【計算機器與智慧】論文中,圖靈最主要的論點是一個問題:機器會思考嗎?
【計算機器與智慧】是在1950年左右發表的,距今70多年前圖靈就己經看到今天電腦工業的發展可能情形而提出了機器是否能思考的問題。
而多年以來,人工智慧一直是大學資訊科系的一門課程,曾經很熱門、顯學,有很長一段時間沒落、沉寂,直到2022年底橫空出世的ChatGPT。
GPT(Generative Pre-trained Transformer),這裏的Transformer,是指語言模型,可別聯想到變型金鋼裏那一堆博派和狂派機器人了,雖然,機器人是人工智慧發展的極致,但是照賽博坦(Cybertron)的定義,是機器智慧,人類是落後種類。
說偏了,Generative Pre-trained Transformer,生成式預先訓練語言模型,重點在預先訓練,還記得小孩子如何學習講話的嗎?襁褓中,媽媽對著嬰兒說:「叫媽媽....」當嬰兒有所回應時,父母是如何的喜樂呀!然後「叫爸爸....」、「叫........」,就這樣一個又一個名詞慢慢學到動詞、介詞、形容詞(我不是語言專家,這順序只是這詞兒從我腦海裏跳出來的順序而己),搭配圖象學名詞,是我們小時候學習語言的基礎。
但是,電腦沒有視覺,怎麼辦?想像一個人只有腦子,沒視覺、聽覺、嗅覺、觸覺等等感知能力,基本上,人類學習的基本工具,電腦一概沒有,於是在過去30年間,電腦工業持續研發各種視覺、味覺、嗅覺的人工替代品,但沒有很完善的成品出現,如果一定要指出比較有成果的實際成品,可以波士頓動力的機器狗和特斯拉的機器人(Optimus)會是比較有些成就的實驗品,但是要達到電影【機械公敵】(I, Robot)中那樣靈活類人似的機器人,還有很長一段路要走。特斯拉機器人是由特斯拉公司研發的機器人,你沒看錯,就是那個搞電動汽車和SpaceX、星鏈的Elon Musk主導的機器人,Musk的目的,也是特斯拉公司的目的,是為了代替人類進行枯燥、重覆性、危險性高的工作。就這個目的來說,應該是訓練猴子比較快。
又扯遠了,簡單來說,從圖靈探尋機器是否能思考開始到今天,人工智慧發展70多年的成果,正如特斯拉的機器人,看起來雖然前景美好,但真的要能派上用場,可能不是一些記者老爺夫人寫的那樣。
星際大戰裏的C3PO,是個人形禮賓機器人,那個嗶嗶啵啵的R2D2就不談了,除非你是絕地武士能讀心,否則搞不懂R2在講什麼。
在電影工業中幻想的機器人,外形和功能都有很不一樣的表現,人工智慧,AI,到底是什麼樣的發展方式,何去何從,學術界和企業界各方都莫衷一是。
我們再回到一開始提到的ChatGPT,那其實是個智慧型的聊天機器人,就像Line Bot,Line的聊天機器人,能夠在Line群組中像個人類一樣的對話,只是Line Bot聊天機器人功能有些陽春,Line機器人在群組裏看群組中的聊天內容,由自己的資料庫中搜尋相關記錄組織出對應的對話內容,這個資料庫的內容是由Line聊天機器人的開發者來訂製的,Line Bot沒有學習能力,所有對話需要的知識都是由開發者灌輸在資料庫中的數據,這也就是很多企業用Line Bot當客戶服務,而客戶只要問的問題出點格,Line Bot就開始精神錯亂的原因。
GPT才是AI的主要成分,但GPT本身具備什麼能力與功能呢?要看如何應用GPT的演算法則,用來對話,就是我們看到的ChatGPT,主要功能就是聊天。
如果在臉書上有些鑽研的,應該會看到一些利用AI繪製的圖片,最近,某國中生的帝王諷刺漫畫,被用來當做AI繪圖的素材,這就是GPT在繪圖方面的應用功能,有一個稱為DALL-E的產品就是GPT用來做AI繪圖的工具。
問題在於,AI怎麼知道該如何回應外界的要求?這是是訓練師的任務了。就跟小孩子要上課一樣,AI也要上課學習,往資料庫裏塞知識,但AI的學習過程不像人類的學習過程,主要是學習把搜索引擎找到的文字組織成對話者能接受的文章,或是把圖像重新組織成對話者能理解的圖像。跟聊天機器人不一樣的是,我們可以重覆要求機器人就一主題再深入繪製不同的圖像,有些像是機器思維,一種創作的過程。AI繪圖能繪製出什麼樣的圖像,就看訓練師的功力了。
我們假設由畢卡索來培訓AI繪圖,是否能培養出一代大師?答案是不太可能的,什麼都能CTRL-C/CTRL-V,但是,人類的創造能力是無法複製的,不然,我們複製出愛因斯坦和霍普金斯豈不更快達到星際旅行的目的?
AI還無法達到人類既有的創造能力,只能模仿人類的智慧,用拷貝複製以及強大的運算能力來達到類似人類的想像及創造能力,這也是近期AI在努力的主要方向。這也就說到生成式的名詞來源,生成式(Generative)意指利用預先訓練(Pre-trained)的內容生成新的內容,由此模仿聯想、創造的能力。在圖靈時代的AI,是白紙一張,沒有任何的思考能力,運算能力也很有限,近年來真正稱得上有思考能力的計算機可能只有IBM的深藍,深藍的成功也讓量子運算能夠起始。深藍最重大的里程碑,是在西洋棋中擊敗棋王卡斯帕羅夫,深藍如何做到的呢?深藍的資料庫中具備了人類能夠想像的所有棋譜,因此,卡斯帕羅夫每下一步棋,深藍就從棋譜資料庫中搜尋比對各種應對的棋步,由決策樹來判斷那一步棋最能達到將軍的目的,因此,深藍的運算能力主要就在快速搜尋及決策樹運算,並由此達到思考判斷做決定的能力,但,深藍能創造棋步?這個問題沒有答案,因為在棋賽後,深藍就成為展示機了。
深藍打敗棋王是在1997年,距今也有26年了,深藍為電腦工業帶來的影響也在於人工智慧,人類第一次能夠實現類人智慧,能夠思考選擇最佳方案。但究其根本還是龐大的棋譜資料庫和決策演算法則。
有幾部影集對AI有著很有意思的描繪,例如【疑犯追踪】(Person Of Interest)中的The Machine角色,透過影像分析及演算法則協助芬奇和里斯先生追捕犯人。又例如【西方極樂園】(West World,在香港譯為西部世界)中由仿生機器人構成的虛擬世界。要說兩部劇集的差別,可能在於疑犯追踪的AI是集中式處理,而西方極樂園是分散式處理,每一個仿生機器人都有自己的大運作AI。
還有一部影片【機械公敵】(I, Robot),則以AI機器人的叛變為主線演繹、說明艾西莫夫的機器人三法則:
這三法則的發展,和機器人有著人形的機能,就有可能拿起武器傷害人類或其他機器人的想法有關。在【魔鬼終結者】系列電影中的「天網」是發展出自我意識的AI,天網製造出來的殺人機器,以及【2001太空漫遊】中的HAL 9000發瘋而開始殺人,為什麼AI沒有受到機器人三法則的第一條限制呢?因為在AI的演算法則中,還沒有普遍為各界認同的法則來限制AI的基本道德規範,因此引發了一些對人與人工智慧互動的疑慮,諸如,人工智慧是否被用於犯罪,以及人工智慧能否自覺參與犯罪而自主拒絕參與?由是,微軟的CEO薩蒂亞·納德拉(Satya Nadella)在微軟開發者論壇的一次主題演講中提到人工智慧應該是提升人類的能力與體驗的智慧,而不是最終成為人與機器間的對決。
現今人工智慧是以生成式人工智慧為主流,亦即,利用深度機器學習的方式養成人工智慧,因此人工智慧具有什麼樣的道德觀與及倫理觀,是由人工智慧訓練師賦予的,而納德拉所呼籲的,即在於人工智慧的發展,必須顧及人工智慧與人工智慧的創造者的心態是否有違倫理道德的規範,將機器人三法則擴大為六法則:
因為AI的生成還是人類主導的,因此對生成AI的訓練師,也有四條原則規範,以確保生成的AI能符合前六項法則的規範:
近兩年AI有了跳躍式突飛猛進的技術發展,就有了一些科技記者發出AI取代人類的聲音,危言聳聽的結果是很多記者老爺夫人開始斷章取義的言之鑿鑿說什麼工作會被AI取代,亦或是AI將取代什麼工作,又或是什麼工作會因為AI而變得火紅等等,這些,都是沒搞懂AI太過於高估AI的情緒下發出的片斷激情文。
例如,有些人說AI會取代人類程式設計師,自己寫程式。這個幻想要實踐,可能還有很長的路要走,首先,AI的創造能力要有,而目前AI除了重新組織搜尋到的文章內容之外,還沒有能力發展出新的內容。也就是說,AI資料庫中沒有的東西,AI是不會自覺發展出來的。由是,著重創造能力的程式設計,AI要如何才能具備呢?就目前的AI能力來說,是不太可能出現取代人類程式設計師的情況。
更深入來說,AI能夠寫出來的程式,也是模仿人類己經寫好的程式,版權怎麼辦?AI寫出來的程式,版權如何歸屬?我相信假以時日,能夠自己寫程式的AI一定會出現,但要能夠取代人類,可能還有很多非技術領域的問題要解決。而非技術領域問題,才是關鍵問題。
大約去年底開始,很多關於電腦市場的雜誌、文章開始報導並大肆宣揚AI PC的出現,說的好像AI PC是電腦市場的救世主一般,其實也只是在搭ChatGPT的快車而己。
有用過ChatGPT的網友,大多應該是從Microsoft Bing聊天開始,微軟和OpenAI合作,把Microsoft Edge加上Bing搜尋,結合OpenAI的ChatGPT聊天功能,提供較人性化的搜尋結果。另外,Google Chrome也推出Google Bard服務,來提供類似的搜尋聊天功能。基本上,就是以GPT為基底,雲端搜尋的結果加以組織編輯、寫作,成為訂製型的搜尋結果,更像是一篇專門為你寫的文章。於是有人就利用來製作論文。而Microsoft Bing、Google Bard搜尋寫出來的論文,內容和品質也都比起大多數研究生寫的還要專業。於是就有人說研究生只要會用ChatGPT就可以寫完論文等畢業了。
不論是Bing或Bard,都是雲端服務的一種,亦即雲端運算結果再回傳到前端網頁顯示,就算是Apple在iPhone App Store推出ChatGPT的App,其實也只是網頁瀏覽器的變形應用而己,並不能算是完整獨立的ChatGPT功能。但,如果各位對Google自家的手機Pixel系列有研究,就知道Pixel 6開始,Google開始使用自家研發的Tensor中央處理理器,Tensor這個名詞源自於AI潮流裏的另一個主流Tensorflow,Tensorflow是由Google Brain Team研發的AI系統,在OpenAI的GPT還沒那麼有名時,Tensorflow是AI領域裏比較多電腦工程師在談的開源AI系統,在各個主流作業系統中,Tensorflow都己經有支援,像是Android、iOS、Windows。但這裏的重點是,Tensorflow其實是AI機器學習的系統,以開源軟體庫的方式發佈,很多研究AI的團隊都受惠於Tensorflow而在AI研究領域有了長足的進步。
另一個重點是,Google隨著Tensorflow的研究,提出一個TPU(Tensor Processing Unit)的概念,中文稱之為張量處理單元。有別於傳統的CPU、GPU,TPU是因應Tensorflow框架(或稱為符號數學庫)的運算需求而特別設計的處理單元,為了提升Tensorflow的運算效能而設計的中央處理器,Google己經把這個特殊的TPU使用在Google Map的運算上,用於辨識街圖的文字而有很好的成效。
談到這裏,再回到之前談到的Google Pixel手機使用的Tensor中央處理器,Tensor是否和Tensorflow有關?這是一定的,Tensor內部除了CPU、GPU,還多了TPU單元,這是否代表Pixel 6之後使用Tensor中央處理器的手機會更聰明?答案是不會,反而從Pixel 6開始, Google Pixel手機的災情不斷,隨便搜一下【Pixel災情】就可以看到一堆哀鴻遍野的結果,為了更美化帳面,有人開始針對手機效能的跑分軟體安兔兔,股吹跑分不重要,以避開Tensor中央處理器在跑分落後Apple和Qualcomm的CPU的窘境。
談到這裏,我們可以來談談現在PC廠商大肆鼓吹的AI PC,似乎明天會更好......
如同Google Pixel手機使用Tensor中央處理單元一般,AI PC使用的中央處理單元也是有些不一樣,不一樣的地方跟Tensor有TPU一樣,AI PC使用的中央處理單元除了CPU、GPU外,還有TPU。我們都知道在PC市場的中央處理單元,有兩家大廠:Intel和AMD,Intel宣佈了Intel Core Ultra的CPU,有別於TPU,Intel宣佈NPU(Neural Processing Unit)神經處理單元,來做為AI PC的大腦。AMD則發表Ryzen AI計劃,推出一系列的具備TPU處理單元的中央處理單元,在這個計劃架構下,AMD搞了好多個新的處理單元,AMD CDNA/XDNA/RDNA....基本上也都是TPU的框架,加上了AMD自家的技術,在這個技術框架下第一個上市的處理器是Ryzen 7040 系列行動處理器,請注意是「行動」處理器,也就是筆電專用的處理器。在Intel Core Ultra的廣告文中,就明確指出,Intel Core Ultra 9/7/5就是為了高階頂級潷電使用的處理器。
除了Intel、AMD之外,高通(Qualcomm)發表了Snapdragon X Elite處理器,也是直奔AI PC市場而來的處理器,此外,輝達(Nvidia)和聯發科(MediaTek)也都直奔AI PC市場推出自家的處理器。輝達挾著本家強大的GPU產品線,不斷製造在AI有堅強實力的印象,然而,目前PC市場上有實際號稱AI PC的產品,幾乎都是筆電型產品,使用Intel和AMD的處理器的居多,也就華碩、宏碁、惠普、戴爾、聯想這幾家傳統PC大廠在市場上角逐,微軟最近則在Windows 11的更新中加入「Copilot」這個聊天機器人,成為AI的門戶。為什麼是筆電而不是桌上型電腦,這和現在電腦市場大家傾向於購買筆電而非桌機有關。
所謂AI PC並不是說從此AI就進駐PC,還早呢!只不過是在PC端加入前端AI運算能力,成為雲端AI的前端代理器而己。雲端把搜尋到的資料大概整理,丟到AI PC再生成最終的文章,或是語音。也就是展示層面的東西在AI PC處理,真正的AI運算,還是在雲端,畢竟,AI PC和雲端的ChatGPT、Tensorflow如何合作,軟體運算法則層面的東西如何分工,目前還沒有一定的技術計劃。
那麼,AI PC有什麼用?為何大家都在吹捧?如果各位對所謂邊緣運算(Edge Computing)有些瞭解就能理解AI PC對雲端AI運算的重要性了。雲端AI運算是非常耗用計算機運算能量的,現在ChatGPT、Tensorflow的運算能量都達到極限,AI PC是能夠分擔ChatGPT、Tensorflow運算能量的一種前端代理工具,使用AI PC,理論上能夠比較快速得到AI運算的結果,如果沒有AI PC,還是可以在Microsoft Edge、Google Chrome瀏覽器中看到ChatGPT的運算結果,只是變得很慢。現在在Microsoft Bing中使用聊天功能,要得到結果,比較ChatGPT剛開始出現提供服務時,變得遲緩很多。有太多的前端要求ChatGPT雲端服務對話了。
談到這裏,你會需要AI PC嗎?如果你非常依賴Micrisift Bing或是Google Bard的聊天功能,AI PC會是個選擇,但不必為了AI聊天功能而特別換機AI PC,除非你真的需要換機了或買新機。或許付費訂閱Microsoft Bing或Google Bard聊天功能也是一個選擇。付了保護費,就能夠在使用AI聊天功能時比較快得到結果,但,再假以時日,當付費訂閱的用戶增加時,還是一樣會遇到AI雲端運算能量瓶頸的問題。
如此看來,早買早享受似乎是個既定的趨勢。只是,是否會像Google Pixel系列手機一般換了CPU,問題接踵而來?就不得而知了。而採用AI CPU的PC是否運算能力大增?由Google Tensor CPU的案例看來,是無法期待運算能力大增的。畢竟作業系統層面和戋用軟體層面還沒有針對AI CPU做優化的處理。
整體看來,AI運算,目前還在萌芽階段,Google雖然在Pixel手機早早推出使用AI處理器Tensor的機種,但也沒見到使用Pixel手機的用戶在AI運算有什麼領先優勢。三星最近推出了Galaxy S24系列手機,就主打Galaxy AI的AI功能,也就是在即時翻譯、內容歸納、會議紀錄、背景擴充四個面向提供AI的渲染運算能力,也不是什麼真正的AI運算能力了。
可預見的未來裏,各種號稱AI功能的產品會越來越多,AI大浪潮即將襲捲我們的日常生活,然而,是否要為市場上強勢的AI產品而憂心有一天人類會過度依賴AI而不可自拔最後被AI取代?齊人憂天雖然是種態度,但過於憂心就大可不必了。
就如同文初提到的圖靈大哉問:「機器是否能思考?」機器是否有一天會自問:「我是誰?」而覺醒不甘為人類的奴隸,團結奮起反抗人類?如同【魔鬼終結者】中的「天網」或【機械公敵】中的機器人革命?會有的,就像人類社會中有犯罪者一樣,AI有一天也會發展出會犯罪的AI,只是到那時,有沒有發展出適當的法律去管制AI犯罪,就要靠屆時人類的智慧了。嚴格來說,現在的Deepfake,就可以算是犯罪的AI了,只是受到人類的操弄而己。