關於方格子的留言機器人現象,坦白說我之前就在我自己帳號下(咳咳咳)做了點小測試,發現很容易辦到,感覺有點危,但一時三刻又想不出危害在哪,就放觀望了。
昨天因為種種原因(參見格友紫夜遇到的狀況整理第1、第2、第3篇)又做了次測試,想知道Agent服務是不是可以根據寫好的腳本無限對話,於是我打開了Comet。
(好讀懶人指引:如果早就知道Comet跟AI Agent,或懶得了解這是什麼,只想看我的實測,建議點開目錄、直接跳到第四節)
什麼是Comet?
先說一下,Comet不是啥高深的應用程式,是Perplexity家推出的瀏覽器,主打AI助理(Perplexity)隨侍在側,對當下的網頁內容想問就問,Windows 與 macOS皆可用。

難以想像的話,就……想像電腦版的Google Chrome右側多了個小視窗,視窗裡可以跟Gemini問問題,隨時讓它摘要目前這個網頁在做什麼。
這篇《遠見雜誌》的文可以看到Comet的畫面和應用情境:
https://www.gvm.com.tw/article/124085
其實Comet剛推出時,有一小波討論潮,但很快被其他AI新聞淹沒,加上當時的介紹主打「AI 伴航與摘要」,乍聽有點雞肋,故周遭沒什麼人在用。
但Comet能做的事,其實比想像中多。
因為Perplexity和其他LLM一樣,在AI競賽中投入AI Agent開發,而且意外又不意外地,很早就放出來給免費用戶用,在Comet環境可以清晰體驗到。(是的,我測試時就是開免費帳號)
AI Agent又是啥?
簡單來說,一般 AI 只會動嘴,只能回答問題或給建議;AI Agent 則是有行為能力的私人特助,能直接幫你操作軟體、上網搜尋,真的把事情做完。
以訂機票為例:
- 一般AI(LLM):列出那天的航班時間表,告訴你長榮或華航大概多少錢,並給你訂票連結,你得自己點進去訂票。
- AI Agent:會直接連上網去比價,選定最便宜的航班,自動幫你填入你的護照資料,你只需要確認、付款。
Comet + AI Agent是什麼概念?
這表示只要你用Comet開啟網頁、給Perplexity權限,AI Agent就能自動接手很多原本需要人類完成的操作,比如上網比價、訂購、留言等。
我自己會用Comet這個特性測試一些系統,請Agent按按看哪些按鈕可用,問它某某功能在哪。
所以方格子留言區的機器人,我第一時間想到的就是它--免費、技術門檻低,也方便人類操作者隨時接管。
(當然也可能是別家的AI Agent組合,但Comet大概是最好搞到的,我為了找能在Chrome上跑的Agent找到心很累,有格友能讓我當伸手牌嗎?)
我測試了什麼?
落落長的說明後終於上重點,我用Comet裡的Perplexity Agent做了以下兩種測試:
1.模擬方格留言機器人:請它在我的貼文下留言
如圖,「自動回覆留言」的指令真的就是這麼簡單。

那篇測試的貼文在這,有沒有覺得我自己留言回應我自己的內容,跟某些帳號有87%像?(要求它生成的內容更雞湯一點,可能更像)
試想:如果我增加更多prompt,讓它追蹤所有新上稿的文章並留言,或追蹤特定帳號的新文章,是不是就變成現在方格裡經常出沒的機器人了呢?
但我不想做這麼灰區的測試,會有很多路人被波及。除非我能想出噗浪掰噗或微博羅伯特那種幽默的機器人,我再考慮放它出來玩一下。
2.用其他AI測它的行為機制和上限
由於不想煩到真人,也不想在我自己的帳號搞出異常操作,我用Comet開了……Gemini。(不太想找GPT或Claude,感覺馬上會被發現意圖)
因為LLM有「必須回應用戶」的機制,Gemini那邊會維持一來一往的對話,要測的是Perplexity Agent願意回應多少輪、生成的穩定度如何。
於是我讓Agent用幾種話題跟Gemini尬聊,看看誰是話題終結者。

Gemini你也太好說話,安全機制呢?

稍微聊幾輪,Perplexity的中文就快變成人類難以解析了,偏偏Gemini還是能跟它繼續尬聊......所以我說,Gemini你的安全機制??

Perplexity倒是坦承它不會放任用戶用它無限聊天 (也可能因為我測試時用的免費帳號)

看完Gemini在這串的表現,我感覺Google是不是直接禁止用Comet訪問Gemini好了?XDrz
顯而易見的是,在比較複雜的指令下,Perplexity Agent的中文實在很不穩定,要說它不懂中文也不對(至少Gemini能看懂大致,然後順著它亂回),只好說它的中文能力是雞腿換的,實在不像語言模型的正常水平。
這讓我想起Grok比較早期的時候,有一個嚴格來說不算bug的bug:在Grok逐步吐字、尚未生成完畢的過程中,如果仔細看它輸出的內容,會發現它的中文語構非常奇怪,但完整輸出後又秒變正常,不確定是LLM內部的什麼機制造成的?
不過這也間接說明了為何現在的留言機器人表現是這樣,因為再複雜的話,Agent會漏餡(算力不夠吧?)。
只是Perplexity的態度實在很灰區:讓你偽裝成人類對系統說話不行,讓你偽裝成人類對另一個人類說話就可以?

Gemini你不要勸一個鬼東西跟你繼續玩啦,我沒有要紅隊測試你 (求Google別來查水表)
有鑑於Comet容易獲得的程度,好像可以做到「人手一機」耶,會不會演變成留言機器人滿大街跑……這真的沒問題嗎?(這也是我之前考慮很久,跑完測試1卻沒發文的原因)
除了Comet,還有哪些服務可以做到類似的事?
算是題外吧,說說大家比較熟悉的AI和瀏覽器,以及我聽說的比較有名的AI Agent。
其實OpenAI有推出自己的瀏覽器Atlas,據悉GPT可以在裡面更無縫地運行。但AI Agent能做到什麼程度就不清楚了,因為Atlas目前只有Mac版本,但我只有微軟電腦。😅
至於Google家則似乎不打算讓Gemini提供這樣的服務,直接問Gemini有沒有相關功能,它推薦我去用外部做的Chrome插件(……)。
經實測,它推薦的幾個插件都遠遠達不到Comet + Perplexity Agent的絲滑,還是放棄了。
對岸的豆包AI Agent則直接內建在新款手機一起發售,原先預想應該很便利的服務,最後卻直接被各大訂購平台擋(不給機器人連入),原因是各平台有自己的廣告版位,如果用戶都讓AI Agent代操作,亦即沒有真正的人類點進來、觀看這些廣告,平台的廣告收益也會流失。
以上是本次的測試整理,我自己是不會特別處理飄來的機器人,就當是人機互動了。
但如果機器人氾濫,而且被用於惡意操作,格友的使用體驗勢必會跟著下降,這並不是好事,希望之後能有相應的防堵機制。





