只有替身才能打倒替身!用AI Text Classifier檢查出ChatGPT抄襲文本

更新於 2025/02/02發佈於 2023/02/03閱讀時間約 5 分鐘

OpenAI 已經意識到有關ChatGPT 的抄襲行為，因此推出 AI Text Classifier 以區分文本是AI 或是人類編寫的。本文將介紹如何使用AI Text Classifier檢測文本，並詮釋其產生的檢測結果，最後解釋該工具準確性和限制。OpenAI 強調該工具尚未完善且有一定錯誤率，不應成為唯一的抄襲剽竊證據。

雖然自ChatGPT發布以來一直很受歡迎，但該聊天機器人一直捲入剽竊問題，該工具已被許多學校禁止使用。然而，ChatGPT抄襲問題仍然嚴重，許多人認為其中一個原因是缺少具有系統且有效的工具來診斷ChatGPT抄襲文本。

ChatGPT的研發公司，OpenAI 開始正視這項問題，近期公布了了一款名為AI Text Classifier的工具，旨在區分 AI 生成的文本和人類編寫的文字。OpenAI希望AI Text Classifier可以幫助家長和老師有效且快速地偵測文本是否有抄襲剽竊的問題。但是OpenAI也強調該AI尚未成熟，有一定機率會分錯，所以但不應成為唯一的抄襲剽竊證據。

如何使用?

首先我請ChatGPT生成一段網路霸凌文本，指令如下，生成內容太長就不貼了

Please introduce me the content of cyberbullying, at least 1000 words

接下來把ChatGPT生成的文本貼到AI Text Classifier，然後按Submit

結果如下:此文本可能是AI生成，預測正確

The classifier considers the text to be possibly AI-generated.

接下來把人類生成的文本貼到AI Text Classifier，然後按Submit

如何解釋AI Text Classifier的結果？

AI Text Classifier是根據來自各種來源的人類書寫和AI產生文本進行訓練的。每個文檔都被標記為非常不可能、不太可能、不確定、可能或非常可能是AI 生成的。以下評估結果是根據Challenge set評估而來，其是由一個由人類產生的文本和訓練後的AI模型(我猜可能是GPT-3 和或ChatGPT之類的模型)組合而成，讓AI Text Classifier去猜測文本是人類還是AI寫的。AI Text Classifier會產生五種結果:

"Very unlikely to be AI-generated"(非常不可能是人工智能生成的) :大約有5%的人類書寫的文本和2%的人工智能生成的文本有這個標籤。
"Unlikely to be AI-generated"(不太可能是人工智能生成的):大約15%的人類書寫的文本和10%的人工智能生成的文本有這個標籤。
"Unclear if it is AI written"(不確定是否為AI生成的):大約50%的人類書寫的文本和34%的人工智能生成的文本有這個標籤。
"Possibly AI-generated"(可能是人工智能生成的):在我們的挑戰集中，大約21%的人類書寫文本和28%的人工智能生成的文本有這個標籤。
"Likely AI-generated"(很可能是人工智能生成的): 大約9%的人類書寫文本和26%的人工智能生成的文本有這個標籤。

整體而言，Challenge set的AUC 得分為 0.66，顯示此分類系統還未完全成熟，準確度還有待提升。

AI Text Classifier的限制

至少需要 1,000 個字符，即大約 150 - 250 個英文單詞。
分類器並不是非常準確的，它有時會錯誤標記 AI 生成的文本和人工編寫的文本。
不容易檢測出經過人為修改的AI 文本(就像你也看不出本文哪段有用ChatGPT幫忙)。
分類器可能會在兒童書寫的文本和非英語文本上出錯(台灣學生表示:)，因為它主要是針對成人書寫的英語內容進行訓練的。

您的研究遇到了統計分析的困難嗎？您需要專業的統計諮詢和代跑服務嗎？請點我看提供的服務

教育心理博士的筆記本統計分析 × 學術生涯科技新知

留言

留言分享你的想法！

教育心理博士的筆記本

244會員

140內容數

文章內容以圖像式和步驟化方式，教您如何在各種統計軟體中(例如:SPSS、R和Mplus)，執行多種統計方法。此外，我還會分享一些學術和科技新知，幫助您在學術之路上走得更順利。

教育心理博士的筆記本的其他內容

2024/10/16

用 ChatGPT 來發現你的不為人知的另一面！

大家好！今天想和你們聊聊一個有趣的主題——如何用 ChatGPT 來了解你自己可能不知道的另一面。沒錯！透過每日使用ChatGPT，他會逐漸記住你的行為和特質。這時你就可以透過這個智慧助手，來幫助你更好地認識自己。

2024/10/16

用 ChatGPT 來發現你的不為人知的另一面！

2024/10/16

o1-preview 與 GPT-4o：如何選擇適合的 AI 模型？

隨著人工智慧技術的飛速發展，越來越多的新模型被推出，協助使用者解決各種複雜的問題。近期亮相的 o1-preview 和 GPT-4o 是兩款功能強大的語言模型，但它們各自適用於不同的任務。本文將深入探討這兩者之間的差異，並指導您何時應該選擇 o1-preview，何時應該選擇 GPT-4o。

2024/10/16

o1-preview 與 GPT-4o：如何選擇適合的 AI 模型？

2024/10/06

ChatGPT 4.0 with Canvas對於文字創作者用處

在這篇文章中，我們將介紹最新的ChatGPT 4.0功能—Canvas。它對於文字創作者到底有何幫助?Canvas提供了一個平台，可以幫助你在上面完成文章，在Canvas協作下，控制文章長度和深度變得簡單，改寫和潤稿文章過程中的能夠大大提高工作效率。最後我會提出自己看法-值不值購買Canvas?

2024/10/06

ChatGPT 4.0 with Canvas對於文字創作者用處

看更多

你可能也想看

巷子外的的沙龍

當你文章寫太好時

隨著ChatGpt這類的AI生產工具，越來越多人運用這項工具來幫忙論文寫作，我看過的文獻就顯示，許多編輯發現，現在收到的文章，有四成到五成的比重可能是有運用過AI協作。小平同事曾經說過：實踐是檢驗真理的不二法門，所以我又調皮了。我把兩段文字，丟去給現在新出現的AI偵測器檢查，這一類的

2023/12/18

巷子外的的沙龍

當你文章寫太好時

2023/12/18

教育心理博士的筆記本

如何避免被AI Text Classifier偵測出用過ChatGPT?三個免費工具幫你改寫內容

AI Text Classifier是被開發來用於偵測AI文本的工具。為了避免被偵測出用過ChatGPT，本文將測試五種不同的改寫工具，結果發現其中三種不同的免費網路工具，可以簡單改寫ChatGPT內容，並且改寫後的內容將不易被AI Text Classifier判定為AI文本。

#ChatGPT#OpenAI#Google

2023/04/16

教育心理博士的筆記本

如何避免被AI Text Classifier偵測出用過ChatGPT?三個免費工具幫你改寫內容

#ChatGPT#OpenAI#Google

2023/04/16

Thomas Fan的沙龍

用ChatGPT與AI工具輔助創作是甚麼感覺? 太棒了!

本篇文章在分享親身體驗使用AI輔助創作的過程。文章中可以看到作者第一手的經驗與描述，如何運用ChatGPT、Midjourney、Speech to Text、Autotag等眾多工具來進行輔助，以及最終的成果

#ChatGPT#OpenAI#互動

2023/02/25

Thomas Fan的沙龍

用ChatGPT與AI工具輔助創作是甚麼感覺? 太棒了!

#ChatGPT#OpenAI#互動

2023/02/25

寶鼎出版的沙龍

從引領風潮也帶來爭議的ChatGPT，反思AI時代所需的人才與技能

ChatGPT 的全名是「Generative Pre-trained Transformer」，簡稱 GPT。GPT 是一個由 OpenAI 開發的自然語言處理模型，它使用大量的文本資料來訓練自己並且可以生成自然語言文本，可以進行文章寫作、問答、對話等多種語言任務。在中文使用者中，通常也會稱其為「

#ChatGPT#OpenAI#聊天機器人

2023/02/24

寶鼎出版的沙龍

從引領風潮也帶來爭議的ChatGPT，反思AI時代所需的人才與技能

#ChatGPT#OpenAI#聊天機器人

2023/02/24

漫閱讀-漫談人生/自媒體經營/職場經驗

擔心寫作被AI取代？從ChatGPT重新審視自己的寫作初衷

現在的ChatGPT AI還無法取代寫作者，頂多是作為寫作時的輔助，但寫作者若不勤奮點，則有機會被取代。寫作者也可以藉此審視自己的寫作初衷，若是在流量，點擊率裡迷失了自己，產出的文字也會漸漸地失去溫度，到時後不用AI來取代你，閱讀者就會先離你而去了。

#ChatGPT#AI#寫作

2023/02/20

漫閱讀-漫談人生/自媒體經營/職場經驗

擔心寫作被AI取代？從ChatGPT重新審視自己的寫作初衷

#ChatGPT#AI#寫作

2023/02/20

教育心理博士的筆記本

原來自己才是最大的敵人?ChatGPT能否檢查出AI產生的文本?

OpenAI 推出 AI Text Classifier 以區分文本是AI 或是人類編寫的。但該工具限制在於主要針對英文文本，並且至少要1000字。因此，針對中文文本或是不滿1000字符，則可以考慮用ChatGPT檢測文本，本文將以中文和英文的人類和AI產生的文本進行測試，看看ChatGPT能否猜對

#ChatGPT#OpenAI#文章

2023/02/04

教育心理博士的筆記本

原來自己才是最大的敵人?ChatGPT能否檢查出AI產生的文本?

#ChatGPT#OpenAI#文章

2023/02/04