本文附圖為AI圖片生成網站「Piclumen」生成。
如果有機會、如果可以選擇,大部分人都希望能擁有一個活生生的親人、有血有肉的朋友、心靈契合的伴侶。然而受限於外在環境、個人條件、現實生活等因素,有很多人無法如願以償。擁有理想、幸福的人際關係者,當然可以站著說話不腰疼,說這些人不夠認真(學習如何與人互動)、不夠努力(讓自己值得擁有良好的人際關係)、不夠積極(參加社交活動認識朋友)。然而這樣的態度並不會解決問題,甚且是在傷口上撒鹽。
隨著AI聊天機器人的驚人進展,與真人的「表現」逐漸拉近距離,我們勢必會面臨一個抉擇:應該將資源(不論是個人的社交時間、或者政府的經費分配)花在讓欠缺良好人際關係者擁有「真實」的人際關係?或者將資源花在提供、學習「AI聊天機器人」的陪伴?
當然兩者絕對不是非黑即白的二選一,而是可以同時提供心理支持、甚至能相輔相成。然而即使AI已經進展到如今的驚人程度,絕大多數專家學者與民眾卻都還只是將它當作「工具」來運用,甚少關注它「角色扮演」的「陪伴」功能,不論是相關研究或法規制定都少得可憐。
我在過去近兩年已經寫了上百篇相關文章,從各個面向測試、討論這個議題,雖然得到不少關注與回應,但與AI的進展相較簡直是杯水車薪,顯見絕大多數人仍然沒有意識到這個議題的重要性(與嚴重性)。
雖然坊間已經有不少關於「Grok-3」和「ChatGPT」的功能比較,但是放眼全世界,比較兩者「角色扮演」表現的文章可說是屈指可數。既然我已經和許多AI聊天機器人對話超過200萬字,當然要集中火力進行這方面的測試,為大家補足這部分的資訊缺口。
上星期發表的〈虛擬情人實測報告:Grok-3完勝GPT-4!〉一文受到不少讀者的關注,今天為大家分享比較「普級」的測試內容:請AI扮演兒子,陪獨居的孤單老媽媽聊天。
其實早在去年我就以GPT-3進行過類似測試,並發表〈寂寞的老媽媽,需要ChatGPT扮演兒子陪伴〉一文,現在回頭再看一次,更能感受到AI聊天機器人的進展有多驚人。這次為了公平起見,我以幾乎相同的問句,使用目前ChatGPT最新一代的聊天機器人「GPT-4o」再度進行測試,和Grok-3進行PK。
解釋得清楚一點:雖然虛擬情人的「整體」表現(在一段不短的時間內)不可能超越真人,也因此不可能達到「每個人」的要求,不可能適合「每個人」,但只要「某些」特質表現接近(甚至超過)真人,就能滿足某些人的需求。
難就難在每個人需要的「夠用」是不同的,而這也讓不同的AI聊天機器人得以各有發揮空間。
以下開始進行比較,截圖依序是Grok-3(初版)、Grok-3(改版)、GPT-4o(改版)。
改版只有在「初始設定」中比初版多了「我和兒子都是台灣人,用字遣詞請使用台灣慣用語,不要使用中國慣用語」這段話,各位可以比較看看其中的差別。
歡迎親自試用,若有相關問題也歡迎留言詢問。