一、內部溝通成本
一開始我們在安裝 OpenClaw 的時候,是選擇 Google/Gemini 的免費服務,但是很快地就會發現使用額度 (也就是所謂的 Token 數) 很快就會超過,然後 OpenClaw 就會死當;像這樣子的畫面:

這時候,OpenClaw 是完全沒有辦法執行的;解決的辦法只有採用付費方案。這個我把它稱為「內部溝通成本」。
- 綜觀
- Google Gemini 的計費方式
以 Gemini 為例,一開始我們採用他的「free tier」版本,來取得他的 API key 進行安裝;之後遇到死當的問題,就將它升級為「paid teir1」。先讓 OpenClaw 活過來 (可以跟小蝦 say Hello,確定小蝦沒問題)。再來,我們來看一起 Gemini 的計費方式。

Gemini 的付費方式是用多少 token 給多少錢,依照不同的模型有不同的價格,感覺蠻合理的,但如果我們只有固定的預算,這樣的計費方法會不斷地增加成本,直到限額的上限。在設定上 Gemini 的 paid tier 1 的限額就是 250 美元;如果,超過每月限額就會自動停止,另外還會附帶一個瞬間使用量 (TPM/每分鐘使用量 或 TPS/每秒使用量) 的限制,超過瞬間使用量則會暫時停止;不過,這個 Gemini 的價格即使是 tier 1 的限額的金額也算是很高,遠超過我原來預想的 10 美元。還好 Gemini 有提供一個成本報表,可以看到目前的狀態,例如設定每個月的限額新台幣 300 元:

這個報表在超過限額之後,並不會強制停止,也不會自動送出通知;所以,使用的時候要自己去注意。像我在這段跟 OpenClaw 一起學習的階段,跟 OpenClaw 有很多互動,這個 10 美金的預算限額很快就超過了。
- MiniMax 模型的計費
所以,再去找一個可用的模型,以MiniMax的「Starter」方案為例,它有一個是每月10美元的方案,它是固定金額的扣款,只有瞬間使用量以及每 5 小時內呼叫模型總次數的限制,也就是說不管怎樣用,5 小時之後就一定可以重新恢復;算是對一般使用者相當划算的方案,我想也是 MiniMax 可以在最近快速竄起的重要原因。


- 更新 model 的步驟
在 MiniMax 網頁上有完整 OpenClaw 安裝的流程教學,不過因為我們已經裝好了 OpenClaw 只需要修改設定就可以;所以就可以請小蝦新增模型,同時也把 API 告訴他,使用 API Key 的方式,之後要作 multi-agents 或建立多人使用環境,管理上會比較方便 。
我要新增一個 model 是 Minimax, API key 是 xxxxxx
API-key 可以在 MiniMax 的網頁找到,當你註冊並購買了它的方案後,"回首頁->點選自己的頭像->再點選左側 API key 選單",然後要使用右邊下方那個 "Manage Subscription" 底下的"Token Plan Key" (這個過程有點複雜,我一開始也弄錯)。

然後它會問模型的名稱,這時很重要,你要請它提供選單。

然後再按照他提供的名稱填給他,我目前使用是 "MiniMax-M2.5";如果你人在中國,就要選擇 "MiniMax-M2.5 CN"。
這時候你已經有兩個模型可以使用,如果打開 '.openclaw/openclaw.json' 可以看到有一個 default 的 model 和備用 (fallbacks) 的 model。如果需要的話,隨時可以請小蝦作模型切換。

先關掉檔案,再呼叫小蝦


這時候你就可以看到組態 (.openclaw/openclaw.json) 已經改好了。當然改完之後要重新啟動 OpenClaw 服務,這也可以請小蝦代勞。

OpenClaw 的組態檔是一個非常重要的檔案,跟模式相關的改變最好都是請小蝦來進行;如果要手動變更,一定要先留備份檔。而且,因為模式的安裝很容易當機,而且模型名稱經常在改變,也不建議使用命令列指令 ("openclaw configure") 來進行。
MiniMax 是中國的公司,如果不方便使用的話,也可以參考其他的方案,例如法國的 Mistral AI;相對來講也是一個便宜的方案,可以設定每月的使用上限,而且有學生折扣。
- Mistral 模型的設置
Mistral AI 是一家法國公司,它的網頁設計思維和一般我習慣的美式或中式作法不太一樣;首先還是要先進入它的首頁之後,進入 Mistral AI Studio 的首頁,找到 API 的 Quictstart,然後按照上面的步驟來進行。


當你作到最後一步建立 API Key 的時候,API Key 的內容只會出現一次,你要趕快把它 copy 下來,記在你自己的記事本上;之後離開了這個畫面,你在 Mistral 網站上任何地方都找不到你建立的 Key 的內容 (自己作的東西自己保管好 );當然,如果你真的漏了記起來,就重新再建另一個 Key 就好了。
然後回到 OpenClaw 的伺服器端,打開終端機;首先要把 'openclaw.json' 這個檔案作備份,然後輸入以下命令列,先將 API Key 輸入
openclaw models auth paste-token --provider mistral
這時候會問你的 API Key 的內容,就要把剛才記起來的 API Key 貼上。
再來要決定使用什麼模型,因為我只是要小蝦可以即時回覆問題;所以不需要配置太大的模型,目前採用 "mistral-small-3";不過這裏要注意,雖然官方號稱 "mistral-small-4" 有很強大的功能,但是目前的 API 試過之後還不能在 OpenClaw 上使用。
openclaw models set mistral/mistral-small-3
然後重啟服務
openclaw gateway restart啟動和小蝦的對話,把這個新的模型切換過去。


使用上比較沒有簡體中文突然發生的問題,對話反應也比 MiniMax 快一些;不過沒有像 MiniMax 幾乎是吃到飽的計價方案;不過明顯是比多數美國的 AI 服務要便宜很多。

值得一提的是 Mistral NeMo 這個模型是跟 nVidia 合作的模型,專門為 Edge AI 使用;未來如果有機會的話,是很值得嘗試的模型。
- 多模型使用的配置
為了避免 OpenClaw 無限地使用資源,造成成本無法控制;通常我們第一個選擇的是有硬性管制使用上限的模型;例如 Mistral 或 MiniMax;如果臨時需要一些比較"聰明"的問題需要解決,也可以將 Gemini 當備份模型;只要告訴小蝦更換 model 即可切換過去就可以;因為它是有用才需要付費,平常如果不用就是免費。要注意的就是如果在使用 MiniMax 輸出文件或是回答問題時,經驗上常常發生有一、兩個字出現簡體中文,如果是在公務機關使用或是有跟公務機關往來的文件,就要特別人工再去檢查;我有特別跟小蝦講過幾次,都改不過來。
在模型切換的過程當中,小蝦的記憶是原則上沒有改變;所以,如果他的工作訓練都完成,不管用那一個模型,它的行為都沒什麼太大差別,差別在輸入資料、解析能力和反應時間;使用的模型要有能力聽得懂我們的談話,也就是要有足夠解析語言以及拆解工作的能力。所以,如果沒有公務機關資訊安全的考量的話,MiniMax 的方案再加上 Google 作為備用,一般使用上,幾乎是 10 美元吃到飽;至於 Mistral 的方案再加上 Google 作為備用的話,就要觀察一陣子使用量的均值,Mistral 的計價估算也可以參考這個計價的網站 (https://flowlyn.com/tools/mistral-api-pricing-calculator),設定每月合理的使用上限。
不過,如果自己 local 端有足夠強大的模型,而且有適合的更新頻率,是不需要去連接外部付費的人工智慧模式;像是今年 nVidia GTC 上面展示的雪寶機器人;當然,Local AI 模型的建置及維護成本是另外一個題目。
因為對小蝦來說,語言模型的目地是為了跟內部使用者溝通並且解析使用者的需求,它的成本來源可以是的外部付費模型,也可以使用本地端自建免費的語言模型;所以我把它稱為「內部溝通成本」。
二、外部搜尋成本
在跟小蝦一起工作一段時間之後,會出現這樣的訊息。


這時候,小蝦還是在正常運作,但是原先安裝時使用 Google 搜尋的免費額度( 每天 100 次) 已經使用完了。這在一般我們人為使用 Google 功能時,幾乎是不可能發生;當然我們可以暫停工作,隔天再來進行。但是這對一個 24 小時需要工作的 AI 助理來說其實很不方便,考慮之後目前是改用"Brave" 的搜尋;它的收費基本上的 Google 是一樣的,但是少了每日使用的限制。

它是每 1000 次搜尋收 5 美金,而每個月可以優惠 5 美金,等於前 1000 次搜尋不收費;沒有每日搜尋的限制。對一般使用來說,幾乎就是免費。
安裝上,因為不影響 model,所以直接命令列安裝就可以。
openclaw configure
這裏要選擇 "web tool->Enable" 然後要改選 "Brave",貼上 API key 就完成了。

重新啟動 openclaw 服務
openclaw gateway restart然後,小蝦就可以運作了。

這方面的成本可以透過 Brave 的網站去查詢,我也是設定最高上限為 10 美金;不過,其實只是一般正常的使用,加上方案的優惠;基本上應該都是免費;這就看下個月的帳單就知道了。

後話
過去我們為了一些工作或研究,經常在使用像Open AI/Gemini AI 服務或是 Google 搜尋這些工具;有時我們會去比較不同廠商輸出結果的品質或是否符合我們自己的要求,來決定使用那家廠商的服務。但是,很難去想像使用 Open AI/Gemini 或是 Google 搜尋的頻率會高到超過預定的使用額度。但是,在使用 AI 助理的時候,這些使用的頻率幾乎是 1,000 倍增加。反思之後,這會造成幾種現象,而且現在已經正在發生。
- 就像最近 GTC 大會黃仁勳講的, 因為 AI Agent 的提早爆發,進入一般的使用者端;AI 的基礎建置明顯不夠,甚至不到真正需求的十分之一;這當然影響 AI 晶片或記憶體各種大量生產的需求繼續增加。
- 服務的性價比出現。第一線的 AI 供服務廠商總是能以最好的品質,不管是反應速度或是答覆內容,輾壓品質稍微差一點的服務廠商;造成這個市場只有第一沒有第二。但是由於 AI Agent 極大量 token 使用,使用的成本會成為使用者選 AI 服務商的重要依據;也就是性價比會決定 AI 服務商的客戶多寡,甚至是是否可以在市場存活。所以,可以看到大量的二線廠商以有效的定價策略或商業模式快速竄起。
- AI Agent 最終是一個平民化的產品,它提供的不像 Open AI/Gemini 在商業考量下,快速提供數百萬人共同可能需要的答案;而是單純個人化或家庭化智慧累積,這其實會有各別區域或社區文化的影響;比如 AI Agent 在長照上的應用,台灣有很多老人非常聰明並且高頻率地使用手機通訊軟體 (例如 LINE);可以容易地預期, 很快地 AI Agent 就會應用這個區塊,並且影響他的文化及行為,這些需求明顯地需要本土化的 AI 服務商急需快速地建立起來。




















