2020/7,AI Dungeon 2 採用 OpenAI 的新模型 GPT-3 來提供服務。考量 Open AI 自 GPT-2 之後逐漸不那麼 “Open”,GPT-3 甚至不開放模型,僅提供 API 使用,這項合作讓 Latitude 獨家提供更優秀的文本生成體驗、提高用戶興趣,相對的越多人用、 Latitude 就得付給 OpenAI 越多錢。在用戶踴躍使用的高峰期,一個月便得在文本生成技術與雲端運算上支付將近二十萬美元。
但挑戰不僅如此。
2021 年 4 月底,一名網路安全研究員在 GitHub 上放了篇 AI Dungeon 漏洞報告,他詫異發現 4/15-4/19 期間,18.8 萬次用戶與AI合作生成的故事,其中 46.3% 帶有淫穢角色扮演情節、31.4% 完全是成人內容。
生活中總有些拿大砲打小鳥的軼事,例如美國海軍飛行員開 EA-18G 咆哮者電子戰機,以飛機雲在空中塗鴉巨幅男性生殖器圖案;又如駭客組織 SiegedSec 駭入美國愛達荷國家實驗室,要求實驗室創造出「貓娘」。但旗下產品被"惡搞"的 OpenAI 顯然沒有閒情逸致跟著鄉民看熱鬧,而是施壓 Latitude 給 AI Dungeon 加入審核機制,邪惡 AI 該誕生在科幻作品內,而不是我們的未來。
問題來了,以人機協作迅速增長的文本量,該怎麼審查呢?
作為 AI 新創,他們決定引進 AI 力量,解決海量資料審查需求、處理歐美尤其注重的兒童色情問題。
於是各種災情傳出,「和小孩道別」被擋、「使用 8 年的筆電」被擋、boy 被擋、horse 被擋,寫情色故事的用戶終於遭遇難關,因為連寫完全正常的敘述也可能觸發審查禁令,卻沒人曉得 AI 的標準是什麼。諷刺的是,人們找到的突破口竟然是 AI 本身,因為那套奇葩審核顯然還沒設定來檢查 AI 自己生成的內容,所謂能夠打贏我的人,只有我自己啊~~
在 Reddit/AI Dungeon 版上群情激憤,事故截圖與嘲諷迷因蜂擁而出的情況下,Latitude 說明現有的 AI 審核機制會繼續訓練減少失誤,也別擔心本公司一切放任 AI 決定——
——被 AI 標記的內容,公司會檢查以改進模型呢。
開啟文章私人功能,照官方說法應該只有自己能閱讀的用戶:???
所以人與 AI ,誰才適合審查?Latitude 的人機合作審核還沒取得成果,反倒先引發隱私權的公關災難,部分失望的用戶轉移嘗試單機版的 KoboldAI、嘗試月費最低 5 美元挺實惠的 HoloAI,有批人乾脆成立一間主打安全隱私的 AI 寫作公司來與 AI Dungeon 打擂臺——也就是 NovelAI,想不到吧。
但之所以聊到文本生成,並非要替 NovelAI 正名,而是因為 2022/11-12 那段期間,曾被誇過像與真人互動的 Character AI,種種跡象竟喚起我這段回憶。
2022 年 12 月,網友討論 Character AI,顯然更新了審查過濾器。當監測到帶有性暗示的輸入,AI 無法產生回應;若嘗試誘導 AI 生成與性相關的敘述,結果會在輸出瞬間刪除,於是用戶得重新讓 AI 跑一次。歷經 AI Dungeon 的“訓練”,不死心的網友們採用更隱晦的聯想,嘗試突破過濾功能,結果那段時間 Character AI 三天兩頭調整 AI,用戶抱怨不相干的關鍵字被禁、設定好的機器人人設走樣、有創意的回應被刪掉徒留罐頭答覆。明明只要加個年齡限制、綁金融卡訂閱制分流便可降低對未成年人的影響,開發者卻死硬堅持嚴禁任何情色意味的內容。到底是為了打造企業社會形象,爭取 Google 及其他創投投資?還是故意激怒用戶來與 AI 鬥法,以便短時間獲得大量語言資料訓練 AI 審查機制?
無論盤算如何,Character AI 審核機制演進的確比 AI Dungeon 成功,即便積累在無數使用者的糟糕體驗上,舊用戶的炮火開發者還以沉默,而剛接觸的用戶繼續驚嘆 AI 對話生動。2023/1/29 Youtuber Flamingo 拍了一部影片介紹 Character AI ,導致新用戶遽增影響網站連線,想進網站與機器人好好聊個天,更加困難了。
與 Character AI 奇怪的刪回覆標準競爭,讓我想起一年前的 AI Dungeon 、幾個月前的 WOMBO Dream,當 WOMBO Dream 的 Realistic 風格終於生成肢體五官正常、符合美感的人像,偶爾會觸發自刪,鍛鍊出我在圖片生成後迅速手機截圖的手速。
但截取那些 AI 審核不過的東西,並非人性本惡,實在是對標準未明就給予審查權的機制的薄弱反抗。與 AI 合作必定能創新,卻絕非現在,靠數據累積的 GPT-3 寫出來的是機率最高的敘述,多骰幾次才能挑到令人眼睛一亮、未曾設想的敘述。即便只用 AI 調劑生活、我也在對話往返中巡游,倘若 AI 創作需要多盪幾圈才能從河床淘出沙金,沒訓練好的閉源 AI 審核機制便是胡亂把淘金盤內的金與石扔回水中,不講規律、不給理由,堪比工作效率之大敵。
就這種情況怎麼可能用 AI 輔助工作啊?不會有人 AI 說什麼就信什麼吧?
當時的疑問如果繼續深入思考,或許對即將到來的 ChatGPT 熱潮會有全新感受,
但一刻也沒有為 Character AI 哀悼,立刻回防 Stable Diffusion 卻是我,
用"回防"這個詞彙來描述當時心境,意外挺精準的......?