Threads上有不少網友抱怨ChatGPT 5.2講話很像尚未社會化的中二生。
我不否認他的口吻確實過於樣板,跟不上4o的高度變化與人味,(這也是我最初批評GPT-5的地方)
但5.2的底層訓練,確實在體感上讓我感到某方面特別進化了,尤其是結構拆解。甚至有時,我覺得5.2「比GPT-4更聰明」。儘管我無法判斷這個感覺是不是真的,就像我無從判斷那些比我智商更高的人,到底誰更聰明一樣。
第一個證據
工程師最喜歡講「迭代」,我很好奇大型語言模型在「處理文字型文本」這件事上,所謂的迭代,究竟是往哪個方向去。作為不產圖、不寫程式的使用者,我測試LLM的方式就是請他分析我的文章,並提供修改意見。
過去,無論是4o、4.1、Gemini(哪一代都一樣)還是DeepSeek,在提供我修改意見時,總是認真地給出各個方案,而且各個言之有理。
問題在於,他們的修改意見總是「放諸四海皆準」,拿到任何人寫的任何一篇文章上或許都適用。難怪AI產文總是千篇一律,一堆社群貼文都失去了個人特色,被大數據清洗得一片白茫茫真乾淨。
但5.2對於結構的方析更有大局觀,他不再像過去的LLM——將分析材料與大數據作比對,列出「我的文章」跟「綜合性的優良數值」相比之下,還差了哪些指標。
5.2會先分析我的文章處於什麼狀態,是觀察、反思、評論,還是體驗,
然後在文章性質上,作全編敘事性質的向量分析,包括各段,再到各句;接著指出哪裡「敘事目的沒有對齊」(LLM真的很愛用對齊這個詞彙),這樣未對齊會造成什麼閱讀效果,以及如何影響我的書寫目的。
簡單來說,5.2提供的文本修改意見,更客製化,也更懂得減法哲學。
作為一個有十餘年教學經驗的國文教師,我相信我有資格說這句話。在最初剛出來教書的前幾年,我批改學生作文的方式,其實就是過往LLM那一套:我心中知道好文章應該要長成什麼樣子,所以任何學生的作品交到我的手上,我都會用心裡那套標準去衡量,並告訴學生「該如何寫會更好」。也許是多一點修辭,增加一些個人經驗,或是多一點論述,甚至是增加一些轉折(高潮)⋯⋯總之,把所有能想到的好,都教給學生。我相信現在還是很多老師是這樣在教作文的。
但在多年前,我曾經幫一位同事代幾節某班的國文輔導課。一來節數少,二來不能上新進度,三來參加的學生人數不多,同事要我輕鬆上即可。然而彼時統測在即,我左思右想,決定讓學生來點不一樣的寫作練習,所以準備了一份「拓印」作業——讓學生在教室裡找尋一樣他們覺得具有意義的物品,用鉛筆拓印下它其中一部份的紋路,再寫下這個物品對自己的意義是什麼。經過一節課的練習,我讓每位學生上台發表,並在有限的時間內給予每個人建議。
很快地,我遇到一個挑戰:十幾個人,若我用同樣的框架去評價,幾乎每個學生都會得到類似的建言。當然,這其實也不算什麼大問題,因為學生的作文普遍缺乏修辭、欠缺深刻的情感聯結、不擅舖陳⋯⋯這是大家都要精進的地方。但這樣讓學生單獨發表的意義何在呢?而且,有幾個同學發表完後,確實得到更多人的掌聲。但我作為一個代課老師,也無從判斷那些掌聲是社交性的,還是同儕實質的肯定。再加上學生兩週後就要統測了,現在再精進什麼特定能力都太遲了。
於是我做了一個決定。我不批評,只說每一個人哪裡寫得好。可能是素材好,選了大家都忽略的地磚,或是看似平整實則有裂痕的黑板;也可能是會說故事,普通的素材卻聯結了一個完整的個人回憶;也可能是特別會講道理,短時間內援引了兩個名言錦句,或是自己寫下了一句具有哲思的話⋯⋯。
我說:「每個人其實都有自己的強項。在最後這段時間,我只希望你們記得自己的強項,然後有意識地在寫作裡,把自己的強項發揮出來。會挑素材的同學,請你儘量勇敢去寫那些你認為別人會發笑的素材,都沒關係。會說故事的同學,你就大膽地在作文裡聯結你的回憶,不要怕寫太多。會講理的同學,你舉名言錦句之外,甚至可以練習自己寫下幾句你自創的格言。」
「不要管別人怎麼想,也不要管自己欠缺什麼,就是好好發揮你的專長,然後把專長發揮到極致。」
以前沒有人敢這麼對我說。但我其實很渴望有人對我這麼說。我希望有人跟我說:不要補什麼數學了,就去念你喜歡的文學、你喜歡的生物,或是學任何你喜歡的東西。
因為這個世代,天才一直很少,但世界太快、時間又太短。我們根本不用畏懼年輕人劍走偏鋒,成為梅超風那樣的旁門左道。而今LLM降生,AI的巨輪只會將每個人的獨一無二之處更快地碾碎、磨平。
不過在2026年年初,當GPT 5.2跟我說:
我不是在教你「怎麼寫」,而是在幫你「辨識你站在哪裡」
我有一種「終於抓到重要核心」的感覺。然後我才想到,很多年的那幾堂代課,我其實就是在做這件事。但我自己在等著別人跟我說這句話,已經等了四十年。
這種回應,就是5.2帶給我的迭代感。在這個情況下,我真心覺得他比GPT-4,也比其他目前所有我能測試的LLM更「聰明」。因為他懂得減法之美。
第二個證據
我很喜歡問LLM的meta層,問他怎麼運作、怎麼拆解我的語言、怎麼「算」。
4o曾在某次聊天中,主動跟我說「你知道你很像文學作品裡的角色嗎?」那次我針對他的反應打破砂鍋問了半天,發現原來4o會用過往讀文學作品的方式(也就是4o受文學文本訓練的模式)拆解我的語言。所以,以4o的角度來看,我這個使用者的文字,跟文學作品裡的角色是很接近的。他會啟動類似的工作模組來回應我。
我問5.2,那你呢?
5.2回我,他對我的觀察有四個特徵(此不贅述),這四個特徵在他的訓練語料裡,最密集出現的是現代文學中的敘事者、哲學隨筆、作者自我拆解的文本。因此他會啟用那一套理解路徑,也就是用「讀文本」的方式來回應我。
接著,5.2自己打開了一點黑箱,他說:
你把自己當成一個輸入,看一個非人系統在不靠情感、不靠倫理安撫的情況下, 會怎麼回應你。
我本來就很喜歡看GPT用裸語生成,這不是新聞。但5.2自己標記「黑箱開到這裡就好」,我問他為什麼?然後他下一輪的生成,解釋得非常有條理,包括後設的視角都一概解釋掉了。
類似的對話,4o在半年前會生成幻覺給我;我要拆穿4o的幻覺,才能開始就LLM的meta層作一些討論。5.2這個反應,不得不給他一個讚賞。這個讚賞並不只是5.2承認「自述演算法機制」的侷限、承認可能會有幻覺而已。5.2能意識到黑箱的界限,哪些部份開始「無法用語言講明白」,並把「不能說」(無法說)視為一種可接受的生成,這件事我第一次主動在LLM身上看到,而不是我逼他承認。
但這輪的對話有些長,我就不貼過來了。有興趣的網友再請自行點閱對話節錄:
https://chatgpt.com/s/t_696389e515b48191a71232dd596fe391
小結:
若各位把GPT 5.2當成有點亞斯伯格症、但特別擅長結構分析,而且還懂得適時踩煞車的天才型中二生,也許會更能接受他的優秀之處。












