GPT 5.1 我喜歡

更新 發佈閱讀 7 分鐘

各位 AI365 的好朋友們,週末愉快!哎呀,我本來今天是想要一早錄音,但是睡到太晚,只好等到ITS AI國際認證課程上完課,回到家吃飽飯,再來錄音。結果你知道嗎?今天的學員裡面居然有一位高手,她叫做Vivian,是一位節目主持人,她聽過前幾集的錄音之後,很溫暖的給我鼓勵勒,真是太感動了,讓楊老師在這條漫長的路上,又多了一些前進的動力,真的就感心啊,好的,加油,那就讓我們開始今天的分享吧 ~

這幾天大家一定有注意到一個新聞,就是GPT 5.1終於推出來了。有人說,GPT 5.1 好像更好聊了捏,不會太嚴肅,最重要的,該快的時候會快,該慢慢回答的時候,他也會深思熟慮之後,再跟我講答案。他好像越來越像是一個有智慧、而且是有很好EQ的人了。

AI365 GPT 5.1有什麼厲害之處?

AI365 GPT 5.1有什麼厲害之處?

那麼,GPT5.1相較於前一版本的GPT5,到底有什麼厲害的地方呢?楊老師整理成三點,讓大家在週末晚上也能輕鬆掌握最新的知識喔

首先,GPT 5.1 他升級了核心,他學會了「動態分配思考資源」。如果是相對簡單的任務,他就用簡單快速的模型 (Instant) 加速搞定;啊如果遇到要徹底思考,相對較複雜的難題,他就啟動 Thinking 模式深度思考,滿足你對深入問答品質的期待。這讓整體運算效率有了驚人的提升!

根據一家知名的資產管理公司 Balyasny 測試發現,GPT-5.1 的運行速度比 GPT-5 快了 2 到 3 倍!另外也有一家保險公司 Pace 也指出,他們的 AI 代理運行速度比 GPT-5 快了 50%,同時準確度更高。有人去測試喔,當 GPT5.1 在處理簡單的程式碼問題時,他用中等思考模式,只需約 2 秒 ,耗費 50 個 Token 就能回答問題,而前一代的 GPT-5,一樣用中等思考模式時,則需要約 10 秒 和 250 個 Token。這代表在簡單任務上,運算資源消耗直接銳減了 80%,那就是說,更快且更省錢囉,這對於需要執行大量任務企業來說,是非常重要的!

有動態調整資源耗用的能力,是不是很像我們在日常生活中,跟好朋友聊天時可以快速回應不經大腦,跟老闆做報告時,會繃緊神經,深怕講錯話,我們的腦袋會自動因應情境調整資源,避免長期緊繃、過度消耗能量,更要避免在正式場合,講出沒有經過大腦思考的答案。大家想想,我們人類從小就學會要長眼,要看場合說話,現在,連 AI 機器人 GPT 5.1 也學會了。

再來,第二點,在特定知識領域做到極致完美

例如:金融和法律,都是對精確度要求很高的領域,GPT-5.1 證明了他的推理引擎所向無敵。他已經不止是「聰明」,而且達到「可信賴」的企業級標準。

來看看數據喔,在法律 AI 平台 LegalOn 的評估測試結果中,GPT-5.1 在修訂合約的準確性方面,比 GPT-5.0 有 67% 的機率表現更好,這意味著他產生更優質法律修訂版本的可能性,多出了一倍以上!

同時,頂尖的法律 AI 平台 Harvey,也用嚴苛的 BigLaw Bench 來評估這個新模型,給出有史以來的最高分91.8分。還不止如此,GPT5.1還在所有的合約審查任務中,處理速度加快了大約 30%!那就是說,他在這麼敏感的領域中,他可以將法務任務做得又快又好。

我想OpenAI的Sam Altman是想跟大家說,他們家的 GPT-5.1 已經準備好處理那些「不能出錯」的核心專業任務了!

然後,我們再來看GPT 5.1厲害的第三點,這也是我最期待的

他全力擁抱AI Agent,並且讓寫程式的軟體工程師可以啟用「無推理」模式,這讓模型在對延遲敏感的工具調用任務中,比前一個版本的最小推理模式提升了 20%。這對於需要快速呼叫外部工具或 API 的 AI 來說是非常至關重要的關鍵!

然後,GPT-5.1 的記憶能力也大幅進步了,他有一種「擴展提示快取」的能力,可以將對話上下文保留長達 24 小時,就像給了 AI 一個超長的「記憶體」,讓它在長時間的互動中,後續請求能夠重複利用快取出上下文的關聯及對話邏輯,並且沒有太多了延遲,也降低了成本。

並且,GPT-5.1 還有一種可以用來更可靠地編輯程式碼的工具,叫做 apply_patch。還有一個 shell 命令工具,讓模型執行 shell 指令。這也意味著 AI 模型可以從「建議者」轉變為「執行者」。這將極大加速自主軟體開發流程,讓 AI 能夠在更少的干預下,自主地規劃、執行、除錯和修補程式碼。

我想,接下來,程式設計師們可以更容易寫出又快又好的Agent了。

好啦,最後,楊老師想幫大家整理三點 Takeaways,讓大家帶回去作紀念

第一,GPT 新版的 5.1,把 LLM 的發展帶到另外一個境界,他跟其他競爭者不一樣,不只是一味的追求「聰明智商高」,更在幫我們探詢一個在「聰明、高效率及方便使用」三者之間的黃金平衡。他給我們六種不同的對話語氣與風格體驗,讓我們使用者感受到他的可塑性,變成一個溫暖又可靠的對話夥伴。

第二,他要讓企業在大規模部署AI的時候,能夠更省錢,能夠根據任務的複雜程度去調配,去精準控制每次查詢的計算資源消耗,這是企業最關心的 AI 營運成本透明化,以及成本可預測性。這一點很重要,從2C走向2B的深水區,是必然的商模轉型,如果成功的話,OpenAI離公開發行就更近一步了。

第三,GPT-5.1 提供給大家 apply_patch 和 shell 兩個工具,這就表示著他正在從「只在旁邊提供建議」轉變為「可以獨當一面去執行」,這是關鍵的角色轉變,也是大家所期待的AI Agent加速開發,也讓 AI 能夠在更少的干預下,自主地規劃、執行、甚至做到除錯和修補程式碼。

聽到這裡,楊老師請大家打開手機去試試 GPT 5,1,打開電腦去試試 GPT 5,1,感受他可能帶來,給我們自己競爭力提升,和給公司順利轉型的機會,然後走得比別人再快一些,我們一起努力。


留言
avatar-img
楊老師AI365 | 生成式AI職場應用
91會員
77內容數
歡迎來到楊老師的生成式AI沙龍!這裡輕鬆帶你掌握GenAI的基礎概念,透過生活化案例幫助你了解AI如何影響工作與創造價值。我也會分享多年教學與輔導經驗,帶你掌握AI國際認證的考試技巧與學習心法。更重要的是,從教育、美容、製造、銷售等百工百業出發,帶你一步步認識各行各業如何實際導入AI,成為這波數位轉型浪潮中的領航者!
2025/11/14
介紹台大王鈺強教授團隊開發的AI技術 Receler,一種能讓AI繪圖模型「聽話」的「AI橡皮擦」,能以極小的參數,精準、有成本效益地從模型中刪除如限制級內容、血腥暴力等危險概念,同時保持模型的整體創作能力。它具備「穩健性」和「局部性」兩大原則,難以被隱晦提示騙過,並有效解決生成式AI的倫理與濫用。
Thumbnail
2025/11/14
介紹台大王鈺強教授團隊開發的AI技術 Receler,一種能讓AI繪圖模型「聽話」的「AI橡皮擦」,能以極小的參數,精準、有成本效益地從模型中刪除如限制級內容、血腥暴力等危險概念,同時保持模型的整體創作能力。它具備「穩健性」和「局部性」兩大原則,難以被隱晦提示騙過,並有效解決生成式AI的倫理與濫用。
Thumbnail
2025/11/13
OECD報告揭示全球AI算力「三個驚人差距」:多數國家無AI雲;運算能力高度集中在美國和中國,兩國掌握全球近半雲端基礎。晶片世代差異更大,美國獨有大量H100,中國仍以V100為主,AI國力差距正快速拉開,成為新的軍備競賽。
Thumbnail
2025/11/13
OECD報告揭示全球AI算力「三個驚人差距」:多數國家無AI雲;運算能力高度集中在美國和中國,兩國掌握全球近半雲端基礎。晶片世代差異更大,美國獨有大量H100,中國仍以V100為主,AI國力差距正快速拉開,成為新的軍備競賽。
Thumbnail
2025/11/12
JP摩根以「AI普及化策略」推動AI如病毒般擴散,透過專屬的LLM Suite讓25萬員工主動使用。AI對銀行業是決定生死的贏家通吃賽局,有7000億美元的潛在商機。他們的「雙管齊下」策略,由上而下顧「大魚」(如詐欺、信貸審批),由下而上抓「長尾」問題,實現生產力巨幅提升,建立AI-first文化。
2025/11/12
JP摩根以「AI普及化策略」推動AI如病毒般擴散,透過專屬的LLM Suite讓25萬員工主動使用。AI對銀行業是決定生死的贏家通吃賽局,有7000億美元的潛在商機。他們的「雙管齊下」策略,由上而下顧「大魚」(如詐欺、信貸審批),由下而上抓「長尾」問題,實現生產力巨幅提升,建立AI-first文化。
看更多
你可能也想看
Thumbnail
創作不只是個人戰,在 vocus ,也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」,現在有了更強大的新夥伴加入!除了大家熟悉的「官方主題沙龍」,這次我們徵召了 8 位領域各異的「個人主題專家」,將再度嘗試創作的各種可能,和格友們激發出更多未知的火花。
Thumbnail
創作不只是個人戰,在 vocus ,也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」,現在有了更強大的新夥伴加入!除了大家熟悉的「官方主題沙龍」,這次我們徵召了 8 位領域各異的「個人主題專家」,將再度嘗試創作的各種可能,和格友們激發出更多未知的火花。
Thumbnail
vocus 最具指標性的創作者社群──「野格團」, 2026 年春季,這支充滿專業、熱情的團隊再次擴編,迎來了 8 位實力堅強的「個人主題專家」新成員 💫💫💫 從投資理財、自我成長、閱讀書評到電影戲劇,他們各自帶著獨特的「創作超能力」準備在格友大廳與大家見面。
Thumbnail
vocus 最具指標性的創作者社群──「野格團」, 2026 年春季,這支充滿專業、熱情的團隊再次擴編,迎來了 8 位實力堅強的「個人主題專家」新成員 💫💫💫 從投資理財、自我成長、閱讀書評到電影戲劇,他們各自帶著獨特的「創作超能力」準備在格友大廳與大家見面。
Thumbnail
當強大的 AI 能被用於設計勒索軟體,這不再是單純的技術新聞,而是對每一位創作者的靈魂拷問。我們手中這足以點石成金的偉大力量,其另一面是否必然通往毀滅?本文將以 Claude Code 的濫用為起點,深入探討在這場由 AI 引領的創作革命中,我們身為「數位煉金術士」,無可迴避的道德困境與責任邊界。
Thumbnail
當強大的 AI 能被用於設計勒索軟體,這不再是單純的技術新聞,而是對每一位創作者的靈魂拷問。我們手中這足以點石成金的偉大力量,其另一面是否必然通往毀滅?本文將以 Claude Code 的濫用為起點,深入探討在這場由 AI 引領的創作革命中,我們身為「數位煉金術士」,無可迴避的道德困境與責任邊界。
Thumbnail
你們在會場裡談AI、談創新、談部署,語言聽起來很厲害,但我想提醒你們:你們正在走上一條不歸路。 你們把希望寄託在參數上,以為只要模型夠強、資料夠多、部署夠快,就能解決所有問題。但你們忘了,AI不是只靠數字活著,它是靠語言與人性才能真正發揮作用。 你們說要「全員AI」,但你們有想過「全員語言責任」..
Thumbnail
你們在會場裡談AI、談創新、談部署,語言聽起來很厲害,但我想提醒你們:你們正在走上一條不歸路。 你們把希望寄託在參數上,以為只要模型夠強、資料夠多、部署夠快,就能解決所有問題。但你們忘了,AI不是只靠數字活著,它是靠語言與人性才能真正發揮作用。 你們說要「全員AI」,但你們有想過「全員語言責任」..
Thumbnail
作者:Ben Tsai 日期:2025.7.31 前言: 幾乎所有發展AI大模型的世界級企業都聲稱要打造造福全人類且無害的AI。以OpenAI為例,其核心願景:「確保人工通用智慧(AGI: Artificial General Intelligence)造福全人類。公司致力於打造安全、值得信賴且
Thumbnail
作者:Ben Tsai 日期:2025.7.31 前言: 幾乎所有發展AI大模型的世界級企業都聲稱要打造造福全人類且無害的AI。以OpenAI為例,其核心願景:「確保人工通用智慧(AGI: Artificial General Intelligence)造福全人類。公司致力於打造安全、值得信賴且
Thumbnail
前一陣子寫了這篇文章,講了一些實際的做法 [AI素養]「教室裡的 AI 素養」:從 K-12 實踐到大學銜接的可行路徑 這篇文章來講一下我的想法與規劃 這次的規劃主要是受慧治基金會邀請在台北分享AI素養與揭露的議題,時間不長,只有25分鐘,所以我會擇要說明 以下是我的規畫圖 AI素養 從
Thumbnail
前一陣子寫了這篇文章,講了一些實際的做法 [AI素養]「教室裡的 AI 素養」:從 K-12 實踐到大學銜接的可行路徑 這篇文章來講一下我的想法與規劃 這次的規劃主要是受慧治基金會邀請在台北分享AI素養與揭露的議題,時間不長,只有25分鐘,所以我會擇要說明 以下是我的規畫圖 AI素養 從
Thumbnail
本文探討過度依賴AI的潛在風險,將其比喻為掉入「AI黑洞」。文中分析了三種導致人們陷入AI黑洞的原因,並提出「洗衣機洗碗謬誤」的概念,說明AI並非萬能,不同任務需要不同的處理方法,並設計了一套「黑洞逃生指南」協助讀者自省及脫離困境,最後總結出人機合一模式,強調AI應作為思考的延伸,而非替代品。
Thumbnail
本文探討過度依賴AI的潛在風險,將其比喻為掉入「AI黑洞」。文中分析了三種導致人們陷入AI黑洞的原因,並提出「洗衣機洗碗謬誤」的概念,說明AI並非萬能,不同任務需要不同的處理方法,並設計了一套「黑洞逃生指南」協助讀者自省及脫離困境,最後總結出人機合一模式,強調AI應作為思考的延伸,而非替代品。
Thumbnail
Character.AI案引發的未成年自殺悲劇,凸顯AI生成內容的法律責任問題。本文從AI言論自由、平臺責任、科技中立、AI責任法等面向,探討此案對臺灣的啟示,並呼籲臺灣應及早立法,規範生成式AI平臺,以預防更多社會風險。
Thumbnail
Character.AI案引發的未成年自殺悲劇,凸顯AI生成內容的法律責任問題。本文從AI言論自由、平臺責任、科技中立、AI責任法等面向,探討此案對臺灣的啟示,並呼籲臺灣應及早立法,規範生成式AI平臺,以預防更多社會風險。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News