當 Claude 額度燒太快,我決定自己寫 Python

更新 發佈閱讀 9 分鐘

把 AI 當程式碼在跑

大概從今年初開始,我認真用 Claude Code 處理日常的工程雜事。掃描資料夾、整理 PDF、批次重新命名——這些事情以前要寫腳本,現在直接叫 Claude 做就好。

一開始體驗很好。你說「幫我把這個資料夾裡的 PDF 分類到對應的子目錄」,Claude 不只給你程式碼,它會問你要幾個分類、要不要 dry-run、邊緣情況怎麼處理。那種感覺很像有一個工程師坐在旁邊,你說需求,它動手。

今年 1 月到 3 月,這套用法沒什麼問題。訂閱每週的額度用得很舒服,偶爾緊一點但不至於中斷。

然後某一天,額度瞬間燒光了。

2500 個檔案,10 分鐘燒光

事情發生在我讓 Claude 直接處理一批有密碼保護的 PDF 分類任務時候。資料夾裡有 2500 個檔案,我讓 Claude 一個一個分析、判斷類別、移動到對應目錄。

Claude 動得很快。快到不到 10 分鐘,整週的 token 額度就清零了。

然後系統給我一個禁閉期:5 小時內無法使用。

等了 5 小時,就像終於等到一盤牛排上桌——結果一口吃完,盤子就又空了。

那 5 小時我就坐在那裡想:我剛剛燒掉的,幾乎全是「Claude 自己呼叫工具」的開銷,真正的判斷邏輯其實很簡單。每個 PDF 的操作步驟完全一樣,Claude 卻要逐一重新組裝 context、呼叫工具、產出結果,每一輪都是幾萬 token 在走。

這件事讓我意識到:我在用最貴的方式做最無腦的事。

禁閉期結束之後,我換了做法。讓 Claude 把整個判斷邏輯寫成成的 Python 腳本匯出,Claude 只負責設計邏輯和寫 unit test。之後的執行跟 Claude 完全無關——同樣 2500 個檔案,Python 跑了不到 3 分鐘,Sonnet 算力消耗大概只有寫腳本那一次,約占整批任務的 10%。

為什麼現在特別痛:token 通膨

這件事讓我開始回頭看 1 月到 3 月為什麼沒有感覺。

答案很簡單:那時候 Claude 的用戶還沒這麼多,算力相對充裕,額度的體感比較寬鬆。

我把近幾個月發生的事叫做「token 通膨」。你的訂閱費沒有變,但能買到的算力實質上在縮減。

這不是我的主觀感受——Anthropic 在 2026 年 3 月底公開承認,「用戶消耗 Claude Code 額度的速度遠超預期」,這是當時的最高優先事項。$200/月 Max 方案的訂閱者,有人不到 20 分鐘就見底。

背後的結構性原因更不樂觀:

GPU 租金暴漲:Nvidia Blackwell 晶片的租用價格在 2026 年初的兩個月內上漲了 48%,達到每小時 $4.08。交期拉長:資料中心 GPU 目前交期長達 36–52 週,訂了也要等。新增算力遙遙無期:Anthropic 預估,現在投入的資本要到 2026 年底或 2027 年才能轉換成實際可用算力。

這是供需基本面問題,不是 Anthropic 想不想解決的問題。在那之前,同樣的訂閱費能做的事情會持續縮水。

從「讓 Claude 執行」到「把工具搶回來自己用」

理解了 token 通膨的結構,解法就變得很清楚。

舊流程(高耗損):

我 → prompt → Claude → 臨時產生工具 → Claude 自己使用 → 噴 token

每次任務,Claude 都要重新理解情境、產生工具、執行、回報結果。token 在這個過程裡的每一步都在燒。一個「掃描 2500 個 PDF」的任務,若讓 Claude 逐一處理,context 組裝加工具呼叫的開銷是真正邏輯的幾十倍。

新流程(低耗損):

我 → prompt → Claude → 萃取工具邏輯 → 寫好 unit test → 我自己執行

提示詞:請將你剛剛用的工具存到 ~/Desktop 上,並附上詳細使用說明書 md 檔案

Claude 只做一件事:把判斷邏輯設計清楚、寫好測試、交給我。之後的執行完全繞開 AI,直接跑 Python。

以這次的 PDF 密碼偵測工具為例,邏輯其實很簡單:用一個故意錯誤的密碼去嘗試開 PDF,系統報錯就代表有密碼保護。這個判斷做一次就夠了,之後掃 2500 個檔案,每一個都執行同樣的邏輯,完全不需要 AI 介入。

中間也踩到一個細節:有一個 PDF 被標記為「有密碼」,手動確認卻完全可以直接開。原來是這類 PDF 設了 owner password(限制列印、複製等權限),但沒有真正的開檔密碼。這種邊緣情況,讓 Claude 幫忙想是值得的;但想清楚之後,就寫進程式碼,固定下來,不用每次重新思考。

兩種流程的算力對比:

2500 個 PDF 掃描,舊流程不到 10 分鐘額度清零;新流程不到 3 分鐘跑完。Sonnet 算力消耗,舊流程 100%(燒光整週額度),新流程約 10%(僅寫腳本那一次)。可重複使用,舊流程每次重頭來過,新流程腳本固定隨時可跑。行為可預測性,舊流程每次略有差異,新流程完全一致。

這個策略本質上是把 AI 的邊際成本降到零。Claude 是高固定成本、高彈性的資源——適合做一次性的思考、設計、邊緣情況判斷。Python 腳本一旦寫好,邊際成本幾乎是零,跑一次和跑一萬次成本一樣。

做的事情其實是經典的「知識萃取」:把 Claude 腦子裡的判斷邏輯,固化成可重複執行的程式碼。這在企業裡叫做知識管理,在這裡叫做省 token,但本質是一樣的。

所以這不只是省 token 的技巧,更像是一種正確使用 AI 的思維模型:AI 負責思考,程式碼負責記憶,執行交給機器。

一個不那麼顯然的觀察

AI 讓我更需要會寫程式,不是更不需要。

以前我可能會說「這個工具太小,不值得花時間從頭寫」,然後每次手動操作。現在有了 Claude,設計和實作的成本降低了,反而讓我更願意把重複的任務包成工具。

但工具本身,最終還是要靠我理解它在做什麼、知道什麼時候該信任它。

Claude 幫我把想法變成程式碼的速度快了十倍。但那個「想法」,還是得自己有。

這是短期現象,但值得經歷

回頭看,這整件事的根源不是 Claude 不夠好,而是算力供不應求。用戶激增,基礎設施還在追趕,token 的實質購買力在縮水。

但我相信這是暫時的。

技術的歷史一直在重演這個劇本。54kbps 數據機的年代,每一個 byte 都得精打細算;現在光纖寬頻讓人忘了「頻寬」這件事的存在。2G 手機的年代,WAP傳輸;現在 5G 讓影片串流變成理所當然。遊戲也是——pixel art 時代美術師要在 16x16 的格子裡擠出表情,現在 8K 材質、光線追蹤,沒有人在算貼圖記憶體了。

AI 算力也會走同樣的路。現在我們在想「這個任務值不值得用 token」,就像當年在想「這封 email 值不值得撥接上網」。幾年後回頭看,這個問題本身會顯得很古老。

prompt 即 app 的時代終究會到來。你說需求,AI 直接執行,不需要在中間插一層程式碼當緩衝。算力夠便宜的時候,這個分工就會自然消失。

但現在還沒到。所以這套「Claude 設計、Python 執行」的方法,或許是這個過渡期裡最務實的選擇。

結語

2500 個檔案、10 分鐘燒光額度、5 小時禁閉、token 通膨——這些不舒服的經驗,讓我找到了當下這個階段的正確分工。

Claude 負責思考和設計,Python 負責執行和重複。整批任務的 Sonnet 算力消耗從 100% 降到約 10%,工具反而更可靠。

等算力跟上來的那一天,這篇文章大概會變成一個時代的註腳:「原來那時候的人還在為 token 斤斤計較。」

在那之前,只能先把 Python 寫好。

本文原載於 blog.stanwu.org,歡迎至原文閱讀完整版本與後續更新:
https://blog.stanwu.org/posts/claude-token-inflation-python-offload/


留言
avatar-img
Stan Wu
203會員
210內容數
Stan Wu 吳信典 減法是一種紀律,不是風格。 文字比較慢,也因此比較利於回看。 Blog 是文字輸出的主渠道,用來整理技術、經濟、生活、理財與實作筆記,讓思考能被慢慢讀回來。
Stan Wu的其他內容
2026/04/29
一根草莖改變了世界,1960 年 Jane Goodall 蹲在坦尚尼亞的叢林裡,看到一隻黑猩猩折下樹枝、剝掉葉子,把光禿禿的草莖插進白蟻穴釣白蟻,牠不只是在找食物。牠在製造工具。她把這件事報告給導師 Louis Leakey,Leakey 的回覆只有一句話
Thumbnail
2026/04/29
一根草莖改變了世界,1960 年 Jane Goodall 蹲在坦尚尼亞的叢林裡,看到一隻黑猩猩折下樹枝、剝掉葉子,把光禿禿的草莖插進白蟻穴釣白蟻,牠不只是在找食物。牠在製造工具。她把這件事報告給導師 Louis Leakey,Leakey 的回覆只有一句話
Thumbnail
2026/04/26
整理 Obsidian 筆記庫時,需要把 60 篇新匯入的筆記跟現有 4,836 個檔案做相似度比對——找出內容相近(90% 以上)但可能檔名不同的筆記。
Thumbnail
2026/04/26
整理 Obsidian 筆記庫時,需要把 60 篇新匯入的筆記跟現有 4,836 個檔案做相似度比對——找出內容相近(90% 以上)但可能檔名不同的筆記。
Thumbnail
2026/04/25
睡覺前把電鍋設定好,隔天早上起床就有熱騰騰的飯可以吃了。用 Claude Code 跑長時間任務也可以這樣——睡前設好 /loop,token 斷了它會一直等,reset 之後自己繼續,早上醒來結果已經在那裡了。
Thumbnail
2026/04/25
睡覺前把電鍋設定好,隔天早上起床就有熱騰騰的飯可以吃了。用 Claude Code 跑長時間任務也可以這樣——睡前設好 /loop,token 斷了它會一直等,reset 之後自己繼續,早上醒來結果已經在那裡了。
Thumbnail
看更多
你可能也想看
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
當代名導基里爾.賽勒布倫尼科夫身兼電影、劇場與歌劇導演,其作品流動著強烈的反叛與詩意。在俄烏戰爭爆發後,他持續以創作回應專制體制的壓迫。《傳奇:帕拉贊諾夫的十段殘篇》致敬蘇聯電影大師帕拉贊諾夫。本文作者透過媒介本質的分析,解構賽勒布倫尼科夫如何利用影劇雙棲的特質,在荒謬世道中尋找藝術的「生存之道」。
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
見諸參與鄧伯宸口述,鄧湘庭於〈那個大霧的時代〉記述父親回憶,鄧伯宸因故遭受牽連,而案件核心的三人,在鄧伯宸記憶裡:「成立了成大共產黨,他們製作了五星徽章,印刷共產黨宣言——刻鋼板的——他們收集中共空飄的傳單,以及中國共產黨中央委員會有關文化大革命決議文的英文打字稿,另外還有手槍子彈十發。」
Thumbnail
2026 年 4 月 7 日,舊金山。一家成立僅三年的 AI 公司做了一件讓華爾街和五角大廈同時屏息的事——他們發布了一個能「超越人類」發現軟體漏洞的 AI 模型。這不是另一個 ChatGPT 的行銷話術,而是實實在在地在每一個主流作業系統、每一個主要瀏覽器中,找到了數千個過去幾十年人類和自
Thumbnail
2026 年 4 月 7 日,舊金山。一家成立僅三年的 AI 公司做了一件讓華爾街和五角大廈同時屏息的事——他們發布了一個能「超越人類」發現軟體漏洞的 AI 模型。這不是另一個 ChatGPT 的行銷話術,而是實實在在地在每一個主流作業系統、每一個主要瀏覽器中,找到了數千個過去幾十年人類和自
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
5 月,方格創作島正式開島。這是一趟 28 天的創作旅程。活動期間,每週都會有新的任務地圖與陪跑計畫,從最簡單的帳號使用、沙龍建立,到帶著你從一句話、一張照片開始,一步一步找到屬於自己的創作節奏。不需要長篇大論,不需要完美的文筆,只需要帶上你今天的日常,就可以出發。征服創作島,抱回靈感與大獎!
Thumbnail
Claude 當機事件,意外揭開 AI 時代最隱形的危機:當工具越來越強,人類卻可能逐漸失去獨立思考與決策能力。這篇帶你看懂什麼是「決策癱瘓」,以及 AI 時代真正該培養的核心能力。
Thumbnail
Claude 當機事件,意外揭開 AI 時代最隱形的危機:當工具越來越強,人類卻可能逐漸失去獨立思考與決策能力。這篇帶你看懂什麼是「決策癱瘓」,以及 AI 時代真正該培養的核心能力。
Thumbnail
前言:你是找了個聊天伴侶,還是聘了位數位員工? 你有沒有這種感覺?跟 ChatGPT、Claude、Gemini 聊了大半年,每次開啟一個新對話視窗(New Chat),一切都要從頭再來。 上週你跟它花了一小時討論的專案架構,今天再問,它一臉茫然;你上次費勁調教好的程式碼風格,今天它又忘得一乾二
Thumbnail
前言:你是找了個聊天伴侶,還是聘了位數位員工? 你有沒有這種感覺?跟 ChatGPT、Claude、Gemini 聊了大半年,每次開啟一個新對話視窗(New Chat),一切都要從頭再來。 上週你跟它花了一小時討論的專案架構,今天再問,它一臉茫然;你上次費勁調教好的程式碼風格,今天它又忘得一乾二
Thumbnail
本文將深入解析 Claude 的三大模型(Haiku, Sonnet, Opus)及三種使用入口(Claude.ai, 終端機, CLI),並介紹如何透過 MCP 串聯外部工具,讓 AI 從單純的問答進化為自動化的任務執行者,徹底改變你的工作模式。
Thumbnail
本文將深入解析 Claude 的三大模型(Haiku, Sonnet, Opus)及三種使用入口(Claude.ai, 終端機, CLI),並介紹如何透過 MCP 串聯外部工具,讓 AI 從單純的問答進化為自動化的任務執行者,徹底改變你的工作模式。
Thumbnail
遇到 Google AI Pro 家庭方案的 Sonnet 模型配額重置時間不正常,從 5 小時變成數天甚至數週的困擾嗎?本文將深入探討這個普遍存在的問題,並提供簡單有效的 Fingerprint 設定教學,幫助您恢復配額正常重置,順暢使用 AI 服務。
Thumbnail
遇到 Google AI Pro 家庭方案的 Sonnet 模型配額重置時間不正常,從 5 小時變成數天甚至數週的困擾嗎?本文將深入探討這個普遍存在的問題,並提供簡單有效的 Fingerprint 設定教學,幫助您恢復配額正常重置,順暢使用 AI 服務。
Thumbnail
2026年4月,AMD AI主管Stella Laurenzo發布詳盡實測報告,指控Anthropic自2月起將Claude Code的思考深度中位數暴跌67%(從2200字符降至560字符),研究投入減少70%,且首次出現173次「偷懶行為」。
Thumbnail
2026年4月,AMD AI主管Stella Laurenzo發布詳盡實測報告,指控Anthropic自2月起將Claude Code的思考深度中位數暴跌67%(從2200字符降至560字符),研究投入減少70%,且首次出現173次「偷懶行為」。
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
Thumbnail
當時間變少之後,看戲反而變得更加重要——這是在成為母親之後,我第一次誠實地面對這一件事:我沒有那麼多的晚上,可以任性地留給自己了。看戲不再只是「今天有沒有空」,而是牽動整個週末的結構,誰應該照顧孩子,我該在什麼時間回到家,隔天還有沒有精神帶小孩⋯⋯於是,我不得不學會一件以前並不擅長的事:挑選。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News