去年年底Chatgpt發佈後立即産生轟動,引發了新一波人工智能熱潮(我們公司的市場部門也在宣傳詞裡大量加入了AI字樣,純屬蹭熱點,呵呵)。我身邊連電腦都用不順的人,居然也都討論起AI來了。其實早在三年前,我就在一篇小説裡預言了與ChatGPT相似的産品!
我的小説《告別:瘟疫時期的愛情故事》最早於2020年6月發表在
我的博客,後來也
曾在Matters上連載。這篇小説前半部分是以Covid爲背景的冩實風格愛情故事,後半部分則加入了科幻元素。男主角爲了追唸染病去世的女友,創造了一個女友人格的AI(原文請見
這裡):
我的想法估計聽起來荒誕不經,像是天方夜譚:我想要製造出一個和雯雯一樣的人工智能。
在嘲笑我之前,請聽我做一番解釋。我無意也沒有能力製造出一個科學怪人來。到底能不能製造出能像人類一樣思考的人工智能,這仍舊是一個未解難題。我的想法其實很簡單,就是想冩出一個計算機程序合成雯雯的樣貌和聲音。我想再見雯雯一次,哪怕是虛擬的也好。依靠現在的人工智能技術,這個目標完全能夠實現。我不能繼續沉淪,再這樣無所事事。無論想法多荒唐,這至少能讓我忙起來。我在網上租用了昂貴的服務器,全身心投入到這個項目中。
一開始他只是想合成女友的聲音和外形:
我從相對簡單的任務着手:合成雯雯的聲音。過去一年裡雯雯給我發了很多視頻、音頻,我有足夠多的聲音素材。想要重現每一個字的讀音並不睏難,可以説只要截取雯雯的發音就可以了。但是這樣的聲音必然是機械化的,冰冷生硬,沒有人類的感情。當人講話時,詞語和句子間會有間隔,音調會有高低起伏,速度時快時慢,此外還有個人化的發音習慣、口音特點。我用了現成的人工智能朗讀引擎,把雯雯的聲音素材導入進去,再一點點地調整模型參數。這一步進展的很順利,很快我就聽到與雯雯十分相似的聲音了。
接下來是模擬雯雯的外形。我從圖像專業公司購買了人體數字模型,這個模型可以做動作、做表情,模擬講話時的口型,等等。當然這個模型是計算機動畫,與雯雯長得一點都不像。我的下一步就是給模型換臉。這一技術非常熱門,在網上有數不清的技術資源。我使用了深度學習技術,用雯雯的照片和視頻來訓練一個人工神經網絡,把我電腦中的模型變成雯雯的樣子。
後來他開始研究怎麼讓AI實現真正的對話:
到了第二天,我開始思考一個問題,怎樣才能讓程序自動地跟我聊天呢?
自然語言處理,也就是讓人工智能理解人類的語言,是人工智能領域的一門顯學。對於人工智能來説,理解單個詞或者單個句子並不十分睏難。可是人類的語言是精妙的,經常出現內容省略,每一句話都要在上下文語境中理解。比如説,我先講了「我母親下星期過生日」,之後又問「買什麼禮物好」,那麼人工智能需要明白我的意思是「我母親過生日,我要給她買什麼禮物」。這樣的上下文語境可能會有很長的時間跨度,比如前兩天説的笑話,甚至於去年一起看過的電影,在對話中我一提起這些話題來,對方就應該明白我的意思,而不需要我長篇大論把整個笑話、整部電影情節複述一遍。人類對話中還會大量使用文化典故,比如形容一個人是「豬八戒」「諸葛亮」,人工智能要準確地理解其中的隱含意義,而不是誤以爲在談論小説和曆史中的人物。家人、朋友、情侶之間會有更私人的談話方式,有小圈子裡的、只屬於彼此的稱呼、笑話、隱喻,這些就更沒有規律、更加複雜了。而且人類講話是連貫的,一句接着一句,這就要求人工智能要及時響應,運行速度要快,而不是每次講話都停頓好久。
了解ChatGPT的朋友應該立即就會明白,這段內容講的是Prompt,也就是自然語言提示詞,AI通過提示詞來生成對話。
小説中接下來還冩到:
我安裝好人工智能語言會話模型,再把我和雯雯之間所有的聊天記錄全部導入進去。隨着訓練時長的增加,這個模型的對話能力越來越強,逐漸能夠流暢地與我交流。然後我又補充了聊天記錄之外的、自己與雯雯相處時兩人共同的回憶,只要是我能想起來的,一處細節也不放過。就這樣,人工智能生成的會話越來越像雯雯了。
這個就是模型訓練的過程,與ChatGPT無異。區別在於,ChatGPT是通用模型,用網上海量數據訓練。而小説中只是用私人數據訓練,畢竟個人開發者不可能有大公司的人力物力。
最後更進一步,還添加了更多的交互方式:
最後一步是爲人工智能增添額外的部件:語音識別、人像識別、表情識別等等。這些都是通用的技術,只需要一點點調整就能用了。這樣一來人工智能就能通過攝像頭看到我,認出我,直接通過語音與我對話、無需文字輸入。
我相信隨着技術發展,小説中冩到的有人格的AI會成爲現實。目前ChatGPT只是用來文字聊天,也沒有性格可言。但是完全可以將ChatGPT的技術與虛擬形象相結合,並且添加獨有的語言特色,讓每個用戶都有自己專屬的AI。不知道大家知不知道戀愛模擬遊戲LovePlus(愛相隨),如果遊戲中的角色有了ChatGPT一樣的對話能力,無數宅男都會爲之瘋狂吧?更加實用的想法是虛擬秘書,輔助日常工作,還有同聲傳譯等等。現如今Google、微軟等大公司紛紛入場,數年之內必然會有麵向大衆的AI産品,絶對會成爲新一波産業革命。
當然我要承認,自己的預言並沒有那麼了不起。雖然ChatGPT對外行人來説很新鮮,但是相關的機器學習理論技術早就有了。ChatGPT的成功,一方麵要佩服開發者的技術能力,另一方麵也是他們實在太有錢了。ChatGPT用了三萬多片高性能顯卡,初始投資就要8億美元,訓練一次的費用高達千萬,每天的電費都要五萬美元。我這樣的普通人,也就只能在小説裡幻想一下了!
眼見着自己的幻想成爲現實,不得不感慨時代發展迅速。AI會給人類社會帶來怎樣的影響,現在還很難評估。有興趣的朋友不妨讀一讀我的小説,沒準能爲您帶來一些啟發。