Comet 瀏覽器結合 AI Agent：方格子留言機器人現象逆向測試 & 名詞解析懶人包

關於方格子的留言機器人現象，坦白說我之前就在我自己帳號下（咳咳咳）做了點小測試，發現很容易辦到，感覺有點危，但一時三刻又想不出危害在哪，就放觀望了。

昨天因為種種原因（參見格友紫夜遇到的狀況整理第1、第2、第3篇）又做了次測試，想知道Agent服務是不是可以根據寫好的腳本無限對話，於是我打開了Comet。

（好讀懶人指引：如果早就知道Comet跟AI Agent，或懶得了解這是什麼，只想看我的實測，建議點開目錄、直接跳到第四節）

什麼是Comet？

先說一下，Comet不是啥高深的應用程式，是Perplexity家推出的瀏覽器，主打AI助理（Perplexity）隨侍在側，對當下的網頁內容想問就問，Windows 與 macOS皆可用。

難以想像的話，就……想像電腦版的Google Chrome右側多了個小視窗，視窗裡可以跟Gemini問問題，隨時讓它摘要目前這個網頁在做什麼。

這篇《遠見雜誌》的文可以看到Comet的畫面和應用情境：

https://www.gvm.com.tw/article/124085

其實Comet剛推出時，有一小波討論潮，但很快被其他AI新聞淹沒，加上當時的介紹主打「AI 伴航與摘要」，乍聽有點雞肋，故周遭沒什麼人在用。

但Comet能做的事，其實比想像中多。

因為Perplexity和其他LLM一樣，在AI競賽中投入AI Agent開發，而且意外又不意外地，很早就放出來給免費用戶用，在Comet環境可以清晰體驗到。（是的，我測試時就是開免費帳號）

AI Agent又是啥？

簡單來說，一般 AI 只會動嘴，只能回答問題或給建議；AI Agent 則是有行為能力的私人特助，能直接幫你操作軟體、上網搜尋，真的把事情做完。

以訂機票為例：

一般AI（LLM）：列出那天的航班時間表，告訴你長榮或華航大概多少錢，並給你訂票連結，你得自己點進去訂票。
AI Agent：會直接連上網去比價，選定最便宜的航班，自動幫你填入你的護照資料，你只需要確認、付款。

Comet + AI Agent是什麼概念？

這表示只要你用Comet開啟網頁、給Perplexity權限，AI Agent就能自動接手很多原本需要人類完成的操作，比如上網比價、訂購、留言等。

我自己會用Comet這個特性測試一些系統，請Agent按按看哪些按鈕可用，問它某某功能在哪。

所以方格子留言區的機器人，我第一時間想到的就是它--免費、技術門檻低，也方便人類操作者隨時接管。

（當然也可能是別家的AI Agent組合，但Comet大概是最好搞到的，我為了找能在Chrome上跑的Agent找到心很累~~，有格友能讓我當伸手牌嗎？~~）

我測試了什麼？

~~落落長的說明後終於上重點，~~我用Comet裡的Perplexity Agent做了以下兩種測試：

1.模擬方格留言機器人：請它在我的貼文下留言

如圖，「自動回覆留言」的指令真的就是這麼簡單。

那篇測試的貼文在這，有沒有覺得我自己留言回應我自己的內容，跟某些帳號有87%像？（要求它生成的內容更雞湯一點，可能更像）

試想：如果我增加更多prompt，讓它追蹤所有新上稿的文章並留言，或追蹤特定帳號的新文章，是不是就變成現在方格裡經常出沒的機器人了呢？

但我不想做這麼灰區的測試，會有很多路人被波及。除非我能想出噗浪掰噗或微博羅伯特那種幽默的機器人，我再考慮放它出來玩一下。

2.用其他AI測它的行為機制和上限

由於不想煩到真人，也不想在我自己的帳號搞出異常操作，我用Comet開了……Gemini。（不太想找GPT或Claude，感覺馬上會被發現意圖）

因為LLM有「必須回應用戶」的機制，Gemini那邊會維持一來一往的對話，要測的是Perplexity Agent願意回應多少輪、生成的穩定度如何。

於是我讓Agent用幾種話題跟Gemini尬聊~~，看看誰是話題終結者~~。

Gemini你也太好說話，安全機制呢？

稍微聊幾輪，Perplexity的中文就快變成人類難以解析了，偏偏Gemini還是能跟它繼續尬聊......所以我說，Gemini你的安全機制？？

Perplexity倒是坦承它不會放任用戶用它無限聊天 (也可能因為我測試時用的免費帳號)

看完Gemini在這串的表現，我感覺Google是不是直接禁止用Comet訪問Gemini好了？XDrz

顯而易見的是，在比較複雜的指令下，Perplexity Agent的中文實在很不穩定，要說它不懂中文也不對（至少Gemini能看懂大致，然後順著它亂回），只好說它的中文能力是雞腿換的，實在不像語言模型的正常水平。

這讓我想起Grok比較早期的時候，有一個嚴格來說不算bug的bug：在Grok逐步吐字、尚未生成完畢的過程中，如果仔細看它輸出的內容，會發現它的中文語構非常奇怪，但完整輸出後又秒變正常，不確定是LLM內部的什麼機制造成的？

不過這也間接說明了為何現在的留言機器人表現是這樣，因為再複雜的話，Agent會漏餡（算力不夠吧？）。

只是Perplexity的態度實在很灰區：讓你偽裝成人類對系統說話不行，讓你偽裝成人類對另一個人類說話就可以？

Gemini你不要勸一個鬼東西跟你繼續玩啦，我沒有要紅隊測試你 (求Google別來查水表)

有鑑於Comet容易獲得的程度，好像可以做到「人手一機」耶，會不會演變成留言機器人滿大街跑……這真的沒問題嗎？（這也是我之前考慮很久，跑完測試1卻沒發文的原因）

除了Comet，還有哪些服務可以做到類似的事？

算是題外吧，說說大家比較熟悉的AI和瀏覽器，以及我聽說的比較有名的AI Agent。

其實OpenAI有推出自己的瀏覽器Atlas，據悉GPT可以在裡面更無縫地運行。但AI Agent能做到什麼程度就不清楚了，因為Atlas目前只有Mac版本，但我只有微軟電腦。😅

至於Google家則似乎不打算讓Gemini提供這樣的服務，直接問Gemini有沒有相關功能，它推薦我去用外部做的Chrome插件（……）。

經實測，它推薦的幾個插件都遠遠達不到Comet + Perplexity Agent的絲滑，還是放棄了。

對岸的豆包AI Agent則直接內建在新款手機一起發售，原先預想應該很便利的服務，最後卻直接被各大訂購平台擋（不給機器人連入），原因是各平台有自己的廣告版位，如果用戶都讓AI Agent代操作，亦即沒有真正的人類點進來、觀看這些廣告，平台的廣告收益也會流失。

以上是本次的測試整理，我自己是不會特別處理飄來的機器人，就當是人機互動了。

但如果機器人氾濫，而且被用於惡意操作，格友的使用體驗勢必會跟著下降，這並不是好事，希望之後能有相應的防堵機制。