「Tune」讓網路世界更乾淨!完全開源專案,過濾惡意留言

2024/04/23閱讀時間約 6 分鐘


一、主題介紹

在瀏覽Youtube的時候,常常被留言區的惡意評論影響瀏覽的心情嗎?這時就需要一個留言過濾器──「Tune」,協助遮蔽這些烏煙瘴氣的言論,還你一個乾淨的網路世界。😇


簡介

Tune 為 Jigsaw(Alphabet Inc.的子公司)的實驗項目所延伸出的 Chrome擴充功能,同時也是 Conversation-AI 研究專案的一部分,並且完全開源。

Tune 可用於多個平台,如 YouTube、Reddit 等,讓使用者有能力更加主動地控制自己的網路互動環境,減少接觸負面或有害內容。

其背後技術,是建立於 Perspective 的機器學習模型之上,能判斷留言為惡意評論的可能性機率。

此處「有毒(惡意)評論」的定義為「可能會造成他人退出交流討論的粗俗、不雅或無理的評論」。

此模型針對「惡意評論」的屬性分類如下:Attack on identity(人格攻擊)、Insult(侮辱)、Profanity(髒話)、Threat(威脅)、Sexually explicit(露骨的)。



優缺點

優:

  1. 簡單快速安裝、容易使用,轉個旋鈕瞬間讓評論區變乾淨。
  2. 提供多種「有毒屬性」分類過濾。
  3. 程式碼完全開源,較不擔心資安問題。

缺:

  1. 只支援部分知名大網站,如:Youtube、Reddit。
  2. 因目前該服務仍處實驗階段,精確率不算高(有機率禁掉惡意評論),尚不穩定(有時候會失效)。



二、操作說明

安裝Google擴充功能的套件後,打開擴充功能工具,就可以操作並過濾網頁上的有毒、惡意評論囉。(就是這麼簡單)


  • 主要支援網站如下
支援平台

支援平台

Disqus提供網站留言板(評論區)平台服務,常見於自架網站,如:Blogger、WordPress、Wix的留言區


  • 使用方法,跳轉到要用的網站(如:Youtube),然後轉動按鈕,便可選擇要噤聲的強弱程度。
操作示範

操作示範



三、測試範例

以容易出現有毒、惡意評論的影片留言區,來進行測試


測試、Youtube 網紅道歉留言區

陷抄襲爭議!老高「鄭重道歉」宣布影片將標來源...網驚新片超酸

Before

raw-image

After

raw-image

只是精確率......有待加強。

比如:「抄襲是不對的」被誤判為惡意評論。



順帶提一下,​Tune有個優點,可過濾無效(沒有意義)的留言。

例如:當留言裡有不明所以的數字......

Before

raw-image

After

raw-image

四、延伸練習、自行串接使用 Perspective API

文章開頭有提到,Tune 本身背後使用的技術是來自於 Perspective 的機器學習模型,而Perspective 有開放免費的 API 供所有人使用測試。

而串接 API 後,我們就能做更多自訂的處理功能

比如:在網站的填報表單系統,很偶爾會收到惡作劇或惡意言論,此時,我們只需做一個「惡意言論篩選器」。當偵測到惡意言論時,限制使用者不能將表單送出,就可以避免收到有毒留言啦~👍


這邊將使用文章開頭提到的──"Perspective API"進行實驗。


  • Perspective API 官網內有建置好的測試區,可以先試玩一下
官網有小小的測試區,可以在這邊輸入句子,測試語句"毒性"判斷

官網有小小的測試區,可以在這邊輸入句子,測試語句"毒性"判斷


  • Perspective API 目前支援多種語言:中、日、韓、法、西文等
raw-image


  • 有關 Perspective API 的應用
Perspective API 的應用

Perspective API 的應用



API 支援的語句分析,除了Toxicity(毒性)屬性外,還有另外6個參數:

  1. Attack on identity(人格攻擊)
  2. Insult(侮辱)
  3. Profanity(髒話)
  4. Threat(威脅)
  5. Sexually explicit(露骨的)
  6. Severe Toxicity(嚴重毒性)

有了這些參數,就可以從不同面向去篩選過濾掉不希望出現的語句。

補充:Severe Toxicity(嚴重毒性),對於較溫和的有毒言論比較不敏感。意即,若想以較寬鬆的方式判斷言論的有毒性,就可以考慮使用這個參數。


另外,API 的使用扣打為 每秒一次請求(若要增加可以申請)。



筆者有跟著官網的詳細教學實作,最後再請 ChatGPT 幫忙寫了個簡單的網頁,就能來串接 Perspective API 試玩囉~😎


Perspective API 自製測試連結:

https://ai2.iformosa.com.tw/perspective-api/perspective-api.html


測試一、輸入"你好"

正常的句子,被判斷為有毒言論的可能性很低

正常的句子,被判斷為有毒言論的可能性很低


測試二、輸入"你好蠢"

當語句中出現惡意言論的時候,被判斷為有毒言論的可能性就會上升

當語句中出現惡意言論的時候,被判斷為有毒言論的可能性就會上升



使用結語

目前經過數次中英文測試,整體判斷結果尚可,但當遇到某些情況時,判斷會不準確。

1. 比較少見詞彙,較難判斷出來。

比如:「殺了你」判斷威脅的可能性很,但「宰了你」判斷的威脅可能性則偏低

2. 若語句是採用採用指桑罵槐、委婉非直觀的敘述方式,也偵測不出來。

比如:使用隱喻、網路流行用語、新聞時事。

總而言之,這項服務仍處於實驗階段,精確率仍非完美;但若是想做簡單初步的留言過濾,使用 Perspective API 已可達到基本成效了。👍



五、相似軟體工具比較

在研究「如何阻擋無效留言或髒話」時,筆者有找到一個類似功能的工具── Akismet。它是一款由 WordPress 開發的反垃圾留言的外掛。尤其在阻擋機器人或惡意程式的罐頭訊息或反向連結時非常有用。

其主要特色包含:

  • 自動檢查全部留言,並篩選可疑的垃圾留言。
  • 每一則留言都有狀態記錄,因此網站管理員可以輕鬆查看 Akismet 攔截或清除了哪些留言,以及哪些留言是由審核者標示為垃圾留言或非垃圾留言。
  • 將網址顯示於留言內容中,藉以顯示隱藏的連結或誤導性連結。
  • 留言審核者可以看到每一位使用者已核准的留言數量。

雖然這同樣也有開放 API 介接,但由於其 API 返回值只有 True 或 False,不像 Perspective API 還有附述各種有毒參數的機率可以參考。 因此在實際開發應用上,筆者認為使用 Perspective API 會比 Akismet 更具擴展性。

Akismet 若為個人非商業使用同樣有免費扣打。




By 阿福

12會員
10內容數
留言0
查看全部
發表第一個留言支持創作者!