前兩天試用了一下本地LLM GEMMA4 E4B,搭配vs code上然後寫程式。
用了現在正流行的AI AGENT來跑。套件我裝的是Cline,然後加上LM studio掛載模型。
一開始不得要領,設定裝完以後在側邊欄打字,跟使用GEMINI VIBE CODING差不多。
講需求討論以後開始實作。
比較驚豔的是它能夠真的產生檔案,看著它直接在你的VS CODE上面直接寫資料,一個DOCKER COMPOSE,一個是requirements.txt,除了智商和內容物比較差了一點,感覺沒什麼好要求的了。
GPU使用率驚人,設定的好幾乎在模型工作回答作業的時候滿載100%,但是CPU使用率卻不高。
反正這種的不再1M上下文回文範圍,只有128K左右的,加減用。
Prompt下的夠精準,就夠了。
完成了檔案以後它還能自己就進去看,因為在同一個環境也給它授權,比起GEMINI還要複製貼上然後用一堆上下文還有每日PRO扣打需求,這種方式確實好多了。
API問不用錢的,燒的是自己的GPU運算電費。
我大概能了解為什麼一堆人用了CLAUDE CODE的AGENT模式以後,就再也回不去了。
但是以我的電腦來說跑26B就太勉強,況且網路上看人家真的買了NVIDIA DGX SPARK,一台10-16萬,雖說記憶體128G,但跑起本地的模型還是沒有每個月花600塊的GEMINI實用。
10萬的話,夠買GEMINI PRO版本或是claude code pro16年了。
還不用燒自己的電費,燒別人家的。
只是用上以後,換自己的智商真的變低了。
原本review code 就已經沒再詳細review了,現在更是只注重架構和一致化,來達成符合PROMPT需求最佳化作業。
那我真不知道工程師還怎麼需要去學程式語言,其實就學怎麼AI架構師就好。
從做中學,已經可以每天學習兩到三個新的語言來全端涵蓋。
不知道好事還壞事!?
















