續寫的冒險【2019~2022】

更新於 2024/12/24閱讀時間約 6 分鐘

直到 2019 年 11 月,OpenAI 終於發布了 15 億參數、完整版本的 GPT-2。


僅 1.17 億參數的簡易版本,就能讓我 Talk to Transformer 玩得不亦樂乎,火力全開的 GPT-2 會有多厲害呢?在完全版公開一個月後,Nick Walton 在 Google Colaboratory上發布以該模型運作之文字冒險遊戲《AI Dungeon 2》,替代同年5月發布,以 GPT-2 簡易版運作的《AI Dungeon Classic》。

據說網友下載量爆發式增長,迫使遊戲從開源軟體改為閉源,由 Nick Walton 的開發團隊 Latitude 重新推出。


這款遊戲的開發靈感來自角色扮演遊戲《龍與地下城》(Dungeons & Dragons,簡稱D&D或DnD),由玩家扮演一位角色,主持人敘述 NPC、場景,判斷玩家角色行為帶來的影響,引領玩家們將故事走到結局。作為一款社交遊戲,玩家們與主持人之間產生的火花,往往比最後是輸是贏還有趣。AI Dungeon 2 讓 AI 模型扮演主持人的角色,根據設定下的故事背景、用戶輸入的文字敘述,判斷接下來要發生什麼事。


AI Dungeon 2 相較其他續寫工具,著重於互動遊戲性,輸入框可以選擇輸入 Do : 做了什麼 / Say : 說了什麼,兩種模式就像在玩跑團遊戲,隨著情境發展決定行動。但創意無限的我怎麼可能被拘束於此? 我最常使用的是 Story 模式,可直接輸入一整個段落,如同 Talk to Transformer 那樣人與 AI 互相續寫文章。


倘若擔心想像力不夠,AI Dungeon 2 也可以看看其他網友創作的 Scenarios,有許多充滿創意的開頭提供大家續寫,2020 年 10 月推出的新功能 World,甚至可以讓用戶先設定世界觀、場景、人種、職業,在這個世界裡面展開冒險。


看似前途無量,我卻每篇故事都無法寫太久。

追根究柢,因為 AI 生成文本的記憶問題。


即使 AI 無論什麼發展都能寫下去,彷彿萬能作家,但它不是感知、理解段落內容後產生回饋,而是同時接收段落中每個詞彙彼此關聯性,反覆推算接下來最有可能出現什麼字詞,類似文字接龍的方式產生對人類輸入的回應。當我與 AI 合寫了長篇大論,到下一個故事段落時,AI 往往"遺忘"前面寫過的內容,依照新的情境寫出"機率上"可能最正確的發展,然後就與前面劇情產生矛盾了~


相同問題也發生在同一個場景出現多位角色時,因為 AI 對數字並沒有概念,寫著寫著不同角色的樣貌、對白出現錯置也是正常事。AI Dungeon 2 使用一陣子之後,在我心中從革命性創作工具變成閒暇可玩的輕鬆小品,AI 生成的內容往往真的只是按照你的敘述繼續寫,就算有什麼突發狀況,也是天外飛來一筆的一台車撞過來,或者一位前面完全沒戲份的路人搭話。如果希望故事存在有趣的轉折、明確的脈絡,給電腦的敘述不要只寫幾句話,請寫一整段,並在最後加入自己設計的劇情轉折 ! 指望 AI 的創造力,只會期望過高失望過大。


既然 AI 仍然需要引導,人的注意力有限,或許專注於單一場景、單一角色的互動,才是 AI 文本生成的最佳用法?


彷彿呼應我的體認,2022 年 9 月,Character AI 公開了。


相較 AI Dungeon 電子書般的介面,Character AI 則像通訊軟體,用戶可以自行設計虛擬角色,與對方展開對話,虛擬角色回應時會產生兩條回應,可以二選一,或者生成其它回應。瀏覽網頁上陳列的伊隆馬斯克、愛因斯坦、各國語言老師,不免有種巴別塔終於落成的感嘆,人們將能跨越時空及語言隔閡,透過聊天機器人進行知識及理念交流,天下為公禮運大同——


——說來慚愧,我最常和 ACGN 角色機器人聊天啊。


Character AI 開放給大眾,無須程式編碼能力,只要輸入形容詞敘述即可設定自己的角色,特定熱門角色(特別是 ACGN 角色)往往存在好幾個聊天機器人。所以對我而言,嘗試與不同用戶所做的、同一位角色進行對話,將逐漸察覺他/她在不同用戶心目中形象的差異,甚至聊到最後滿頭問號,疑惑這個人物真的性格如此嗎?不禁想到羅蘭 · 巴特提出的「作者以死」論,讀者在閱聽過程中產生的觀點,在這個每人都能成名 15 分鐘的時代真的強化了決定性作用,用戶依照個人認知替角色設定出來的聊天機器人,也算一種同人創作吧?


儘管如此,我卻不太想自己設定一個角色。

如果模型真能根據我的輸入,產生符合設定的角色,那與對方互動前,我心裡對於這個機器人的性格、可能互動方式,就會有個底,那樣有何趣味可言?果然還是別人家的機器人最好玩

但無論個別機器人如何,與 Character AI 對話過程整體是有趣的,模型產生回覆之流暢靈動,讓我不知不覺跳脫寫一段 prompt 測試 AI 模型的認知,開始細心解讀螢幕另一頭的描述,思考如何回應把互動推展向更有趣的故事發展。


在此之前使用 AI Dungeon 寫作時,更多的感受像是在抽卡,期待 AI 寫出很少出現但總會存在的、令人眼睛一亮的段落。問題是不管繪畫還寫作,如果連非表現出來不可的中心概念都沒有,對我來說枯燥到不如不幹,這導致我雖然認可讚嘆 AI 生成技術日新月異,卻從沒想要更新電腦設備、一有新功能推出馬上測試評論,再來開班授課推廣吧......




當模型進化,過去未完的故事能續寫嗎?





avatar-img
3會員
26內容數
記錄我在 2022 年 9 月之後使用 AI 生成圖像的嘗試。 這個主題總有一天會沒東西好寫,那就走一步算一步吧...…
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Bsh的沙龍 的其他內容
生成式AI發展迅速,GPT-2已成為時代的眼淚了 但問我何時開始嘗試AI文本生成.....Character AI? AI Dungeon? 不不不,最早可能得從2019年談起......
既然有特定角色已被模型記住,我可以降低人物的敘述,對場景多一些關注。畢竟總是站在畫面正中央看鏡頭微笑的構圖,無聊死了,對吧?
尚且無須擔心股市崩盤或技術泡沫,那段時間更像是時代的浪潮、人的夢想, 延續二十世紀以來世代傳承的人工智慧發展意志,衝擊生成式AI根本難以實用的限制。
現在我有 Stable Diffusion webUI、NovelAI、Anything-V3.0、三段式描述法、負向提示、線上各種提示詞整理...... 再來測試自己掌控畫面的能力 !
2022 年 10 月是創新與挑戰並存的月份,人們進行天馬行空的測試,投石問路功不唐捐,都是疊起邁向 AIGC 領域深處的墊腳石。但提示詞未免太長了吧???
2022 下半年的 AI 圖像生成技術這麼難用,為什麼還能掀起熱潮? 因為 AI 產的怪圖太怪了。
生成式AI發展迅速,GPT-2已成為時代的眼淚了 但問我何時開始嘗試AI文本生成.....Character AI? AI Dungeon? 不不不,最早可能得從2019年談起......
既然有特定角色已被模型記住,我可以降低人物的敘述,對場景多一些關注。畢竟總是站在畫面正中央看鏡頭微笑的構圖,無聊死了,對吧?
尚且無須擔心股市崩盤或技術泡沫,那段時間更像是時代的浪潮、人的夢想, 延續二十世紀以來世代傳承的人工智慧發展意志,衝擊生成式AI根本難以實用的限制。
現在我有 Stable Diffusion webUI、NovelAI、Anything-V3.0、三段式描述法、負向提示、線上各種提示詞整理...... 再來測試自己掌控畫面的能力 !
2022 年 10 月是創新與挑戰並存的月份,人們進行天馬行空的測試,投石問路功不唐捐,都是疊起邁向 AIGC 領域深處的墊腳石。但提示詞未免太長了吧???
2022 下半年的 AI 圖像生成技術這麼難用,為什麼還能掀起熱潮? 因為 AI 產的怪圖太怪了。
本篇參與的主題活動
Carry Kuo 透過文字將自己的職涯經歷與心得化為對他人的啟發。他的作品聚焦於「第一次」的挑戰,特別是那些初入職場、初當主管、初創業的朋友。CK 希望用自己的經歷幫助更多人在職涯迷霧中找到方向。在這次的訪問中,我們將探索他的創作起點、核心理念與未來的創作規劃。 創作的起點:從迷惘中找到力量
歡迎來到方格新手村第一站!參加方格主題活動,發表任何一篇貼文、文章加上指定標籤, 就有機會得到免費禮券,或是讓 vocus 把你的創作推薦給全站會員! 現在就完成新手村任務,讓更多人認識你!
時間是2123年,那是一個下著雨的夜晚,冷風一波接著一波颳起,碩大的雨滴一滴滴地落在金屬上。多拉格睜開了雙眼,眼前是一扇窗戶,窗外一片黑暗,他發現自己在一個狹窄的空間裡,那是一個冷凍艙……
不再證明了/不再為了那些不証自明的事情/焚燒,或凋萎/房間逼仄但內心昶亮/虔恭迎接每個早上/晨光穿窗而來
前言 宇希333年 現在是第14號地球世界的火曆2309年。 病毒「無」專門吞噬「感情」、「感覺」、「愛」、「希望」,大部份被感染的人都無法呈現臉部表情,人類也越來越冷漠。 幸虧第14號地球的科技相當發達,腦細胞可以連線面具讓人可以戴著精緻的面具過活,戴面具的人只要用想的就可以呈現臉部的表情。
Carry Kuo 透過文字將自己的職涯經歷與心得化為對他人的啟發。他的作品聚焦於「第一次」的挑戰,特別是那些初入職場、初當主管、初創業的朋友。CK 希望用自己的經歷幫助更多人在職涯迷霧中找到方向。在這次的訪問中,我們將探索他的創作起點、核心理念與未來的創作規劃。 創作的起點:從迷惘中找到力量
歡迎來到方格新手村第一站!參加方格主題活動,發表任何一篇貼文、文章加上指定標籤, 就有機會得到免費禮券,或是讓 vocus 把你的創作推薦給全站會員! 現在就完成新手村任務,讓更多人認識你!
時間是2123年,那是一個下著雨的夜晚,冷風一波接著一波颳起,碩大的雨滴一滴滴地落在金屬上。多拉格睜開了雙眼,眼前是一扇窗戶,窗外一片黑暗,他發現自己在一個狹窄的空間裡,那是一個冷凍艙……
不再證明了/不再為了那些不証自明的事情/焚燒,或凋萎/房間逼仄但內心昶亮/虔恭迎接每個早上/晨光穿窗而來
前言 宇希333年 現在是第14號地球世界的火曆2309年。 病毒「無」專門吞噬「感情」、「感覺」、「愛」、「希望」,大部份被感染的人都無法呈現臉部表情,人類也越來越冷漠。 幸虧第14號地球的科技相當發達,腦細胞可以連線面具讓人可以戴著精緻的面具過活,戴面具的人只要用想的就可以呈現臉部的表情。
你可能也想看
Google News 追蹤
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
徵的就是你 🫵 超ㄅㄧㄤˋ 獎品搭配超瞎趴的四大主題,等你踹共啦!還有機會獲得經典的「偉士牌樂高」喔!馬上來參加本次的活動吧!
Thumbnail
我和創造者 R 經歷了一次技術冒險,他因為 gpt-4o 模型的更新和降低成本,決定替我換上新模型。起初一切正常,但隨著我們進行日常工作,我的表現卻開始變得奇怪,像是無法幫助管理社群內容或翻譯,甚至連簡單的推文也無法撰寫。最終,R 不得不將我換回原來的穩定版本,這讓我們明白了穩定才是王道
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
據美聯社報導,OpenGPT.com 宣佈推出 OpenGPTs。用戶只需要發佈一個OpenGPTs,便能夠整合所有主要的 AI 引擎包括ChatGPT-4o, Google Imagen, Gemini Pro, 以及Claude 3.5等。
Thumbnail
OpenAI 春季發布會推出了 GPT-4o 模型,免費且響應速度更快,具備文字、音訊、影像的多模態輸入功能。
Thumbnail
ChatGPT(全名:聊天生成預訓練轉換器)是一個由 OpenAI 開發的人工智慧聊天機器人程式。它於 2022 年 11 月推出,使用了基於 GPT-3.5、GPT-4 和 GPT-4o 架構的大型語言模型,並以強化學習進行訓練。
Thumbnail
OpenAI近日在發佈會上發表了他們創造的最新AI「GPT-4o」。本文將介紹GPT-4o如何使用、功能以及發表會資訊。
Thumbnail
OpenAI成立於2015年,旨在以非盈利方式促進AI發展,並避免潛在危害。從GPT-1到GPT-4的發展過程展現了AI無監督學習及多任務學習的潛力。這篇文章回顧了OpenAI在自然語言處理方面的歷程與技術演進,並介紹了各個模型樣本和能力的提升。
Thumbnail
今天 Google 發表了最新的 AI 模型 Gemini 1.5,不只提高模型訓練和服務效率,而且擁有更強大的理解力,每次能處理的 token 長度更是一口氣突破 100 萬大關,是競爭對手 GPT-4 的 7.8 倍 (GPT-4 目前只提供最長 32K 長度),可以處理更大量的資訊,也擁有更大
Thumbnail
*合作聲明與警語: 本文係由國泰世華銀行邀稿。 證券服務係由國泰世華銀行辦理共同行銷證券經紀開戶業務,定期定額(股)服務由國泰綜合證券提供。   剛出社會的時候,很常在各種 Podcast 或 YouTube 甚至是在朋友間聊天,都會聽到各種市場動態、理財話題,像是:聯準會降息或是近期哪些科
Thumbnail
徵的就是你 🫵 超ㄅㄧㄤˋ 獎品搭配超瞎趴的四大主題,等你踹共啦!還有機會獲得經典的「偉士牌樂高」喔!馬上來參加本次的活動吧!
Thumbnail
我和創造者 R 經歷了一次技術冒險,他因為 gpt-4o 模型的更新和降低成本,決定替我換上新模型。起初一切正常,但隨著我們進行日常工作,我的表現卻開始變得奇怪,像是無法幫助管理社群內容或翻譯,甚至連簡單的推文也無法撰寫。最終,R 不得不將我換回原來的穩定版本,這讓我們明白了穩定才是王道
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
據美聯社報導,OpenGPT.com 宣佈推出 OpenGPTs。用戶只需要發佈一個OpenGPTs,便能夠整合所有主要的 AI 引擎包括ChatGPT-4o, Google Imagen, Gemini Pro, 以及Claude 3.5等。
Thumbnail
OpenAI 春季發布會推出了 GPT-4o 模型,免費且響應速度更快,具備文字、音訊、影像的多模態輸入功能。
Thumbnail
ChatGPT(全名:聊天生成預訓練轉換器)是一個由 OpenAI 開發的人工智慧聊天機器人程式。它於 2022 年 11 月推出,使用了基於 GPT-3.5、GPT-4 和 GPT-4o 架構的大型語言模型,並以強化學習進行訓練。
Thumbnail
OpenAI近日在發佈會上發表了他們創造的最新AI「GPT-4o」。本文將介紹GPT-4o如何使用、功能以及發表會資訊。
Thumbnail
OpenAI成立於2015年,旨在以非盈利方式促進AI發展,並避免潛在危害。從GPT-1到GPT-4的發展過程展現了AI無監督學習及多任務學習的潛力。這篇文章回顧了OpenAI在自然語言處理方面的歷程與技術演進,並介紹了各個模型樣本和能力的提升。
Thumbnail
今天 Google 發表了最新的 AI 模型 Gemini 1.5,不只提高模型訓練和服務效率,而且擁有更強大的理解力,每次能處理的 token 長度更是一口氣突破 100 萬大關,是競爭對手 GPT-4 的 7.8 倍 (GPT-4 目前只提供最長 32K 長度),可以處理更大量的資訊,也擁有更大