一、主題介紹
在瀏覽Youtube的時候,常常被留言區的惡意評論影響瀏覽的心情嗎?這時就需要一個留言過濾器──「Tune」,協助遮蔽這些烏煙瘴氣的言論,還你一個乾淨的網路世界。😇
簡介
Tune 為 Jigsaw(Alphabet Inc.的子公司)的實驗項目所延伸出的 Chrome擴充功能,同時也是 Conversation-AI 研究專案的一部分,並且完全開源。
Tune 可用於多個平台,如 YouTube、Reddit 等,讓使用者有能力更加主動地控制自己的網路互動環境,減少接觸負面或有害內容。
其背後技術,是建立於 Perspective 的機器學習模型之上,能判斷留言為惡意評論的可能性機率。
此處「有毒(惡意)評論」的定義為「可能會造成他人退出交流討論的粗俗、不雅或無理的評論」。
此模型針對「惡意評論」的屬性分類如下:Attack on identity(人格攻擊)、Insult(侮辱)、Profanity(髒話)、Threat(威脅)、Sexually explicit(露骨的)。
優缺點
優:
- 簡單快速安裝、容易使用,轉個旋鈕瞬間讓評論區變乾淨。
- 提供多種「有毒屬性」分類過濾。
- 程式碼完全開源,較不擔心資安問題。
缺:
- 只支援部分知名大網站,如:Youtube、Reddit。
- 因目前該服務仍處實驗階段,精確率不算高(有機率禁掉非惡意評論),尚不穩定(有時候會失效)。
二、操作說明
安裝Google擴充功能的套件後,打開擴充功能工具,就可以操作並過濾網頁上的有毒、惡意評論囉。(就是這麼簡單)
- 主要支援網站如下

支援平台
Disqus提供網站留言板(評論區)平台服務,常見於自架網站,如:Blogger、WordPress、Wix的留言區
- 使用方法,跳轉到要用的網站(如:Youtube),然後轉動按鈕,便可選擇要噤聲的強弱程度。

操作示範
三、測試範例
以容易出現有毒、惡意評論的影片留言區,來進行測試
測試、Youtube 網紅道歉留言區
陷抄襲爭議!老高「鄭重道歉」宣布影片將標來源...網驚新片超酸
Before

After

只是精確率......有待加強。
比如:「抄襲是不對的」被誤判為惡意評論。
順帶提一下,Tune有個優點,可過濾無效(沒有意義)的留言。
例如:當留言裡有不明所以的數字......
Before

After

四、延伸練習、自行串接使用 Perspective API
文章開頭有提到,Tune 本身背後使用的技術是來自於 Perspective 的機器學習模型,而Perspective 有開放免費的 API 供所有人使用測試。
而串接 API 後,我們就能做更多自訂的處理功能!
比如:在網站的填報表單系統,很偶爾會收到惡作劇或惡意言論,此時,我們只需做一個「惡意言論篩選器」。當偵測到惡意言論時,限制使用者不能將表單送出,就可以避免收到有毒留言啦~👍
這邊將使用文章開頭提到的──"Perspective API"進行實驗。
- Perspective API 官網內有建置好的測試區,可以先試玩一下

官網有小小的測試區,可以在這邊輸入句子,測試語句"毒性"判斷
- Perspective API 目前支援多種語言:中、日、韓、法、西文等

- 有關 Perspective API 的應用

Perspective API 的應用
- 詳細 API 使用方法,可參考官方完整逐步教學。
API 支援的語句分析,除了Toxicity(毒性)屬性外,還有另外6個參數:
- Attack on identity(人格攻擊)
- Insult(侮辱)
- Profanity(髒話)
- Threat(威脅)
- Sexually explicit(露骨的)
- Severe Toxicity(嚴重毒性)
有了這些參數,就可以從不同面向去篩選過濾掉不希望出現的語句。
補充:Severe Toxicity(嚴重毒性),對於較溫和的有毒言論比較不敏感。意即,若想以較寬鬆的方式判斷言論的有毒性,就可以考慮使用這個參數。
另外,API 的使用扣打為 每秒一次請求(若要增加可以申請)。
筆者有跟著官網的詳細教學實作,最後再請 ChatGPT 幫忙寫了個簡單的網頁,就能來串接 Perspective API 試玩囉~😎
Perspective API 自製測試連結:
https://ai2.iformosa.com.tw/perspective-api/perspective-api.html
測試一、輸入"你好"

正常的句子,被判斷為有毒言論的可能性很低
測試二、輸入"你好蠢"

當語句中出現惡意言論的時候,被判斷為有毒言論的可能性就會上升
使用結語
目前經過數次中英文測試,整體判斷結果尚可,但當遇到某些情況時,判斷會不準確。
1. 比較少見詞彙,較難判斷出來。
比如:「殺了你」判斷威脅的可能性很高,但「宰了你」判斷的威脅可能性則偏低。
2. 若語句是採用採用指桑罵槐、委婉非直觀的敘述方式,也偵測不出來。
比如:使用隱喻、網路流行用語、新聞時事。
總而言之,這項服務仍處於實驗階段,精確率仍非完美;但若是想做簡單初步的留言過濾,使用 Perspective API 已可達到基本成效了。👍
五、相似軟體工具比較
在研究「如何阻擋無效留言或髒話」時,筆者有找到一個類似功能的工具── Akismet。它是一款由 WordPress 開發的反垃圾留言的外掛。尤其在阻擋機器人或惡意程式的罐頭訊息或反向連結時非常有用。
其主要特色包含:
- 自動檢查全部留言,並篩選可疑的垃圾留言。
- 每一則留言都有狀態記錄,因此網站管理員可以輕鬆查看 Akismet 攔截或清除了哪些留言,以及哪些留言是由審核者標示為垃圾留言或非垃圾留言。
- 將網址顯示於留言內容中,藉以顯示隱藏的連結或誤導性連結。
- 留言審核者可以看到每一位使用者已核准的留言數量。
雖然這同樣也有開放 API 介接,但由於其 API 返回值只有 True 或 False,不像 Perspective API 還有附述各種有毒參數的機率可以參考。 因此在實際開發應用上,筆者認為使用 Perspective API 會比 Akismet 更具擴展性。
Akismet 若為個人非商業使用同樣有免費扣打。
By 阿福