*剛才想起把這篇丟進GPT和Gemini讀稿兼確認一下,兩AI都直白承認確實有這個機制,我可以大膽一點把不確定的疑問句拉掉了?:P
GPT免費版和plus的差異,是能多問幾個問題、多出幾張圖?根據我的不專業觀察,事情不是這樣的。
因為我發現,免費用戶的單輪算力就會被往下壓,同一個問題付費用戶和免費用戶問,生成結果/回覆內容的品質也有落差。這是我在5.1剛推出群組功能時觀察到的。
基於一般的使用習慣,AI服務買了付費版就不太會再開另一個免費版出來用,因為沒必要,專案管理上還麻煩。尤其GPT plus的token給得多,沒必要像Claude一樣再開一隻小帳不然貴爆,以我這種使用密度,4月以來也只有用完過二次(二次都是讓它處理工作上較複雜的任務)。
直到回看朋友跟GPT的對話才發現,即使用的是同一個模型(彼時群組功能無法切不同的模型,所以應該全是當時的旗艦5.1),但朋友用免費帳號問問題,跟我用plus問問題,收到的回覆品質明顯有差,GPT在回答朋友的問題時較敷衍,我自己的觀察是「引導思考」和「主動補丁」的行為有降低,也就是模型不願再往更深層的方向推論了。
所以,雖然OpenAI也沒付我錢,我還是推薦「GPT派」訂訂看plus,品質真的有差喔!
題外,因為我剛買了Google AI Pro全家桶,這兩天開始更多事務倚重Gemini,忽然發現它的單輪輸出好像也隨著課金變聰明了?這到底是不是我的錯覺?
還是說,這是因為我之前跟Gemini玩得不夠深,才沒發現它其實也有很有誠意的moment?
而且我發現Gemini現在有跨串記憶和長期記憶功能了(不是『設定』面板中手動輸入的偏好設定,是真的會記住先前的對話內容,但不像GPT會顯示在介面上,要請Gemini列出來)……這到底是改版新增的功能,還是有無課金之差?
因為據GPT免費用戶說法,免費版的記憶管理功能少到讓人髮指,幾乎是起不到什麼卵用的狀態,所以才沒我這麼愛用memory功能。
以下補充Gemini讀完本篇後的解釋:
- 推論成本(Inference Cost): 每一輪對話都是在燒錢。對於免費帳戶,服務商可能會使用「量化(Quantization)」技術來縮減模型體積,或者限制模型的推論步數(Chain of Thought),以節省運算資源。這會導致模型傾向給出簡短、表面的回答。
- 動態優先權: 當伺服器負載較高時,付費用戶會被分配到更完整的算力資源,而免費用戶的回答可能會被「截斷」或由較小型的模型代勞(儘管介面顯示名稱相同)。
- 系統指令(System Prompt)差異: 付費版通常會掛載更精細的系統指令,要求模型在回答時必須具備批判性思考、多角度分析。


















