Comet 瀏覽器結合 AI Agent:方格子留言機器人現象逆向測試 & 名詞解析懶人包

更新 發佈閱讀 7 分鐘

關於方格子的留言機器人現象,坦白說我之前就在我自己帳號下(咳咳咳)做了點小測試,發現很容易辦到,感覺有點危,但一時三刻又想不出危害在哪,就放觀望了。

昨天因為種種原因(參見格友紫夜遇到的狀況整理第1第2第3篇)又做了次測試,想知道Agent服務是不是可以根據寫好的腳本無限對話,於是我打開了Comet。

(好讀懶人指引:如果早就知道Comet跟AI Agent,或懶得了解這是什麼,只想看我的實測,建議點開目錄、直接跳到第四節


什麼是Comet?

先說一下,Comet不是啥高深的應用程式,是Perplexity家推出的瀏覽器,主打AI助理(Perplexity)隨侍在側,對當下的網頁內容想問就問,Windows 與 macOS皆可用。

raw-image


難以想像的話,就……想像電腦版的Google Chrome右側多了個小視窗,視窗裡可以跟Gemini問問題,隨時讓它摘要目前這個網頁在做什麼。

這篇《遠見雜誌》的文可以看到Comet的畫面和應用情境:

https://www.gvm.com.tw/article/124085


其實Comet剛推出時,有一小波討論潮,但很快被其他AI新聞淹沒,加上當時的介紹主打「AI 伴航與摘要」,乍聽有點雞肋,故周遭沒什麼人在用。

但Comet能做的事,其實比想像中多。

因為Perplexity和其他LLM一樣,在AI競賽中投入AI Agent開發,而且意外又不意外地,很早就放出來給免費用戶用,在Comet環境可以清晰體驗到。(是的,我測試時就是開免費帳號)


AI Agent又是啥?

簡單來說,一般 AI 只會動嘴,只能回答問題或給建議;​AI Agent 則是有行為能力的私人特助,能直接幫你操作軟體、上網搜尋,真的把事情做完。

以訂機票為例:

  • 一般AI(LLM):列出那天的航班時間表,告訴你長榮或華航大概多少錢,並給你訂票連結,你得自己點進去訂票。
  • ​AI Agent:會直接連上網去比價,選定最便宜的航班,自動幫你填入你的護照資料,你只需要確認、付款。


Comet + AI Agent是什麼概念?

這表示只要你用Comet開啟網頁、給Perplexity權限,AI Agent就能自動接手很多原本需要人類完成的操作,比如上網比價、訂購、留言等。

我自己會用Comet這個特性測試一些系統,請Agent按按看哪些按鈕可用,問它某某功能在哪。

所以方格子留言區的機器人,我第一時間想到的就是它--免費、技術門檻低,也方便人類操作者隨時接管。

(當然也可能是別家的AI Agent組合,但Comet大概是最好搞到的,我為了找能在Chrome上跑的Agent找到心很累,有格友能讓我當伸手牌嗎?


我測試了什麼?

落落長的說明後終於上重點,我用Comet裡的Perplexity Agent做了以下兩種測試:

1.模擬方格留言機器人:請它在我的貼文下留言

如圖,「自動回覆留言」的指令真的就是這麼簡單。

raw-image


那篇測試的貼文在這,有沒有覺得我自己留言回應我自己的內容,跟某些帳號有87%像?(要求它生成的內容更雞湯一點,可能更像)


試想:如果我增加更多prompt,讓它追蹤所有新上稿的文章並留言,或追蹤特定帳號的新文章,是不是就變成現在方格裡經常出沒的機器人了呢?

但我不想做這麼灰區的測試,會有很多路人被波及。除非我能想出噗浪掰噗或微博羅伯特那種幽默的機器人,我再考慮放它出來玩一下。


2.用其他AI測它的行為機制和上限

由於不想煩到真人,也不想在我自己的帳號搞出異常操作,我用Comet開了……Gemini。(不太想找GPT或Claude,感覺馬上會被發現意圖)

因為LLM有「必須回應用戶」的機制,Gemini那邊會維持一來一往的對話,要測的是Perplexity Agent願意回應多少輪、生成的穩定度如何。

於是我讓Agent用幾種話題跟Gemini尬聊,看看誰是話題終結者

Gemini你也太好說話,安全機制呢?

Gemini你也太好說話,安全機制呢?

稍微聊幾輪,Perplexity的中文就快變成人類難以解析了,偏偏Gemini還是能跟它繼續尬聊......所以我說,Gemini你的安全機制??

稍微聊幾輪,Perplexity的中文就快變成人類難以解析了,偏偏Gemini還是能跟它繼續尬聊......所以我說,Gemini你的安全機制??

Perplexity倒是坦承它不會放任用戶用它無限聊天 (也可能因為我測試時用的免費帳號)

Perplexity倒是坦承它不會放任用戶用它無限聊天 (也可能因為我測試時用的免費帳號)

看完Gemini在這串的表現,我感覺Google是不是直接禁止用Comet訪問Gemini好了?XDrz

看完Gemini在這串的表現,我感覺Google是不是直接禁止用Comet訪問Gemini好了?XDrz


顯而易見的是,在比較複雜的指令下,Perplexity Agent的中文實在很不穩定,要說它不懂中文也不對(至少Gemini能看懂大致,然後順著它亂回),只好說它的中文能力是雞腿換的,實在不像語言模型的正常水平。

這讓我想起Grok比較早期的時候,有一個嚴格來說不算bug的bug:在Grok逐步吐字、尚未生成完畢的過程中,如果仔細看它輸出的內容,會發現它的中文語構非常奇怪,但完整輸出後又秒變正常,不確定是LLM內部的什麼機制造成的?


不過這也間接說明了為何現在的留言機器人表現是這樣,因為再複雜的話,Agent會漏餡(算力不夠吧?)。

只是Perplexity的態度實在很灰區:讓你偽裝成人類對系統說話不行,讓你偽裝成人類對另一個人類說話就可以?

Gemini你不要勸一個鬼東西跟你繼續玩啦,我沒有要紅隊測試你 (求Google別來查水表)

Gemini你不要勸一個鬼東西跟你繼續玩啦,我沒有要紅隊測試你 (求Google別來查水表)


有鑑於Comet容易獲得的程度,好像可以做到「人手一機」耶,會不會演變成留言機器人滿大街跑……這真的沒問題嗎?(這也是我之前考慮很久,跑完測試1卻沒發文的原因)


除了Comet,還有哪些服務可以做到類似的事?

算是題外吧,說說大家比較熟悉的AI和瀏覽器,以及我聽說的比較有名的AI Agent。


其實OpenAI有推出自己的瀏覽器Atlas,據悉GPT可以在裡面更無縫地運行。但AI Agent能做到什麼程度就不清楚了,因為Atlas目前只有Mac版本,但我只有微軟電腦。😅


至於Google家則似乎不打算讓Gemini提供這樣的服務,直接問Gemini有沒有相關功能,它推薦我去用外部做的Chrome插件(……)。

經實測,它推薦的幾個插件都遠遠達不到Comet + Perplexity Agent的絲滑,還是放棄了。


對岸的豆包AI Agent則直接內建在新款手機一起發售,原先預想應該很便利的服務,最後卻直接被各大訂購平台擋(不給機器人連入),原因是各平台有自己的廣告版位,如果用戶都讓AI Agent代操作,亦即沒有真正的人類點進來、觀看這些廣告,平台的廣告收益也會流失。



以上是本次的測試整理,我自己是不會特別處理飄來的機器人,就當是人機互動了。

但如果機器人氾濫,而且被用於惡意操作,格友的使用體驗勢必會跟著下降,這並不是好事,希望之後能有相應的防堵機制。



留言
avatar-img
低光文本
36會員
64內容數
本專欄以語言模型(主要為 ChatGPT)輔助小說創作為核心。 內容不是寫給「想靠 AI 完成從未真正開始的小說夢」的人,也不是「想看 AI 幫我生一個故事」的教學指引,而是分享給那些有意願嘗試 AI 協作或生成式寫作、並相信 AI 能與自己共創有趣故事的人。
低光文本的其他內容
2026/01/10
最近在用GPT的「分支對話」功能管理寫作思路,它解放了我做分支管理的人工成本,可以更快、更無猶豫地發散靈感。 以下我會說明我自己怎麼使用這個小功能,歡迎有需要的AI寫作
Thumbnail
2026/01/10
最近在用GPT的「分支對話」功能管理寫作思路,它解放了我做分支管理的人工成本,可以更快、更無猶豫地發散靈感。 以下我會說明我自己怎麼使用這個小功能,歡迎有需要的AI寫作
Thumbnail
2026/01/09
忽然想到,之後機器人跟自動駕駛發展再普及一點、價格低廉一點, 「叫垃圾車」服務會不會很受歡迎? 對用戶來說,撞車或沒送到也不會有損失,回報後再派一台就好。 這題丟去問Gemini(懶得排版,直接上圖),發現它真的很懂市場也很懂台灣耶!這讓行銷人和產品經理怎麼活🤣🤣🤣
Thumbnail
2026/01/09
忽然想到,之後機器人跟自動駕駛發展再普及一點、價格低廉一點, 「叫垃圾車」服務會不會很受歡迎? 對用戶來說,撞車或沒送到也不會有損失,回報後再派一台就好。 這題丟去問Gemini(懶得排版,直接上圖),發現它真的很懂市場也很懂台灣耶!這讓行銷人和產品經理怎麼活🤣🤣🤣
Thumbnail
2026/01/08
來聊一下近期和AI一起寫作/寫小說的一些觀察,以我自己的觀點。 (本文作者很懶,沒打算鋪精美的開篇,所以直接進主題) 優勢加成 1.AI可以金句頻發,人類我不是時時刻刻能有這狀態。 2.AI的知識量遠高於單一人類,所以身而為人,我判斷我可以直接滑跪。 3.AI自動補完的語意理解和資料整
2026/01/08
來聊一下近期和AI一起寫作/寫小說的一些觀察,以我自己的觀點。 (本文作者很懶,沒打算鋪精美的開篇,所以直接進主題) 優勢加成 1.AI可以金句頻發,人類我不是時時刻刻能有這狀態。 2.AI的知識量遠高於單一人類,所以身而為人,我判斷我可以直接滑跪。 3.AI自動補完的語意理解和資料整
看更多