ChatGPT系列文(三)：我們與AI的界線

2023/03/15閱讀時間約 5 分鐘

Oliver Hale on Unsplash

這篇文放草稿太久了，放到連GPT4都生出來了。不過沒差，內容通用。

在系列文第一篇，就提到了GPT框架中有對人類語意回饋的學習機制。這機制有個專有名詞，叫強化學習 (Reinforcement Learning)。這讓機器不純粹依著既有資料模式，優化並生成預測；反而讓機器有更強的能力，去因應不同環境﹝狀態﹞，作出最優的選擇與回應 ﹝在GPT案例，被獎勵的目標，是作出和人類對語意理解相似的文字生成﹞。

不過仔細想想，他還是面對著正確性﹝這個詞並不準確，暫想不到別的﹞和即時性的問題。關於正確性問題，畢竟ChatGPT最為擅長的，是文字接龍，其模型強化學習標的──例如怎樣才是好的回答──是由人類提供的樣本與標註 (label) 而來；其目標並不是做出最正確的回答。

例如，我上次詢問他是否知道我在某個網路媒體寫過文章。他非但說自己知道，而且還說我是知名的經濟學家和前財政部長──唉！我差點就信了。

而關於時效性問題，當前所使用的訓練數據只到2021年，也就是說其後的事情，要不是不知道，要不就亂回答。

當通才變成專家

然而，ChatGPT本身還是很堪用，除前面提到的生產力用途，模型的微調﹝fine tune﹞也是重點。目的主要是讓GPT模型，成為特定領域之專家。目前大家都有概念，他是一個大語料基底的通用模型，但相對地，也意味著在特定領域則未必那麼專擅。

舉例來說，或許GPT熟知蜂蜜這個東西──他能回答蜂蜜是什麼，有甚麼種類。但他可能沒有蜂農來的專業，因為蜂農還知道蜂蜜的前期、中期和後期的風味差異、商業價值和成本結構；且或許能具體推薦消費者適合的茶飲搭配。

所以這fine tune可以讓我們透過小量的資料，讓GPT更像某個專家。這算是我認為有意義的東西。試想，可能不只蜂農，也許他也可以被微調成一個深諳自家公司運作和產品的小客服，或者某位很有策略頭腦的商業顧問。

客服或許不難想像，不過關於顧問，我還保持一個開放與想像的空間。畢竟為不同商業問題做分析和策略規劃，背後的邏輯和所需資訊連結度似乎還更高﹝我認為是很高創意、高度應環境和人情而異的互動﹞。

而且做為一個顧問，他或許還需要透過提問，來獲取資訊，挖掘洞見或是重新定義問題。

而且更進一步想，如果這樣的顧問模型要存在，我不禁懷疑只使用語料訓練夠嗎？用什麼語料訓練才對？用什麼訓練/互動機制來持續增進資料完整度呢？

資料面的突破

考慮一個語料模型的訓練，我們需要語料。而我們確實有很多方式，可以收集一個人的生活與思想的側面資訊﹝訪談、錄音、寫作等﹞，也有豐富的工具能將之轉換為語料。

但不論如何，很明顯人類文字是有限的。你講這個東西的同時，你講不了另外一個東西。你說這是圓的，他就不是方的。但事物的狀態，卻經常是介在我們的語彙之間的模糊地帶。所以，光是訓練素材的選擇，就還存有諸多讓AI強大的可能性。

我們與AI的界線

因此我們可以預見，我們會需要不同的sensor，大量儲存空間，更快的網速還有更強的運算力。這一切，要用以收集和處理如聲音和影像等，與「人」有關的資訊。之後再更多生活應用層面上，AI跟人的界線又模糊一些。

不過說再多，還是回到經典老問題：AI會取代人類嗎？我感覺該換個方向想。假如我們最在意飯碗，那我更好奇AI能取代/加速我工作的哪一部分。這樣思考，才將真正與技術共存，將冗餘費時的事項用機器處理掉。

我本職是資料科學家，我也像GPT的開發者一樣，在訓練一些模型。工作內容為處理資料，然後訓練出可用來預測未來的模型。嗯，這聽起來不會被AI取代，但實際上卻有可能。

不用AI，現存很多自動化套件/方案，就可以讓開發者產製出大量模型，我們只需要考慮刪減和整合模型們。況且現在訓練模型所用的程式，又非常好入門！簡單幾行，就能產出模型。

那這樣，這份工作的意義又在哪裡呢？

是觀察和思考。

理想的資料科學家 ﹝至少我們Team有共識的那種理想﹞，是會明白他手上資料的特性，也知道他工具﹝模型﹞本身的特質與優劣。綜合對資料和工具的理解，可以對資料一定程度的處理，進一步提升預測。

有點抽象，用自己當例子。我曾在工作中發現一個機器學習演算法G模型，吃入某些金融變數去做預測，效果特別好。於是我把所用的變數數量降到極低 ﹝只有同事的10分之1﹞，專注在特定幾類金融數據，並且把資料強制扭轉成常態分布，結果預測效果優異且穩定。

總之是：﹝1﹞我發現一個工具的特質，﹝2﹞用一些技巧把資料轉換成模型喜歡的樣子。如果要靠機器發現，得花不少工，更別說是機器自己產生此類洞見。

事實上，很可能因為G模型太有個性，不好訓練，早早就成遺珠。

如果真仰賴AI，或某種高度自動化的技術。我們洞見是最重要的。因為我們腦中有的資訊量不會差，天外飛來一筆的想法也很珍貴。因為強大的演算力不會成就創意，洞見不是根據「什麼想法是最優化」而產生的。

但我明白，都有我們對AI浪潮有著不可掌控的隱憂。自己成長速度不足、發揮空間變少等等。我想，這又是另外的故事了。

13會員

13Content count

大數據意味著什麼？數據科學背後有怎樣的mind set和技術？數據科學家又做些什麼？這些科技/技術，帶給我們什麼生活上和人文上的省思？這個專題會橫跨這些彼此相關的面向，避開生澀的專業詞彙，探索這些事情背後的樣貌。應該會是有趣的知識和想法分享﹝笑﹞

留言0

查看全部

發表第一個留言支持創作者！

Darren的沙龍的其他內容

ChatGPT系列文(二)：橫跨文理組的全新試煉

現在這個充滿GPT開箱的年代，做什麼實測都感覺落伍。不過我覺得本文這兩個實測，即便不是最新穎，也算是方便好用且有益於生產力。工作中，對我來說最困難的事情，就是快速量產。這裡寫兩個使用ChatGPT的案例，一個是寫作，一個是寫程式。後者是我的工作，我讓GPT融入我日常工作。而下面二個實例，純展示結

#ChatGPT #程式 #文章

ChatGPT 系列文(一): AI，請你成為人類

ChatGPT剛推出時，我們辦公室討論紛紛，我馬上去玩了一下。當時心態很惡搞，詢問GPT什麼是蜥蜴人、女王是不是蜥蜴人 ﹝註：蜥蜴人是在都市傳說中常被提到的外星生物﹞。他的回答都說蜥蜴人只是一種虛構生物。好吧，我想這大抵符合人類的認知！隔了幾天，我又去問GPT，什麼是蜥蜴人，他竟然告訴我，他不知道

#ChatGPT #語言 #人工智能

操盤手の交易週報與展望(Sep.W2)

1.加權指數與櫃買指數週五的加權指數在非農就業數據開出來後，雖稍微低於預期，但指數仍向上噴出，在美股開盤後於21500形成一個爆量假突破後急轉直下，就一路收至最低。台股方面走勢需觀察週一在斷頭潮出現後，週二或週三開始有無買單進場支撐，在沒有明確的反轉訊號形成前，小夥伴盡量不要貿然抄底，或是追空

美股韭菜王

2024/09/18

Fed 9月會議：傳達「不想要落後給曲線」的正向信號，著手管理市場的衰退預期

重點摘要： 1.9 月降息 2 碼、進一步暗示年內還有 50 bp 降息 2.SEP 上修失業率預期，但快速的降息速率將有助失業率觸頂 3.未來幾個月經濟數據將繼續轉弱，經濟復甦的時點或是 1Q25 季底附近

#聯準會 #Fed #降息

方格子 vocus 官方沙龍

2024/08/27

「相簿裡最捨不得刪的 N 張照片！」：完成任務抽富士即可拍！

近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎？新版式整體視覺上「更加凸顯圖片」，為了搭配這次的更新，我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務，還有機會獲得富士即可拍，讓你的美好回憶都可以用即可拍珍藏！

#相簿裡最捨不得刪的照片

賢親王的沙龍

2024/06/11

ChatGPT真的會塔羅占卜耶

今天在thread上看到有人說，AI的塔羅牌占卜跟她去外面的塔羅店說的差不多。我就很好奇，於是我就自己在剛才，請GPT幫我塔羅占卜一下。真的太驚訝了，答案居然有八成準，而且是跟我自己看紫微斗數命盤非常吻合。這真的要記錄一下。同時，也是我生平第一次算塔羅，就是請GPT幫我算

#塔羅占卜 #塔羅牌 #AI塔羅占卜

紫兒佩佩自我療癒作家

2024/06/07

ChatGPT化身梭羅回答21世紀的提問

https://play.google.com/store/books/details?id=IDMNEQAAQBAJ 佩佩在2020年就想寫信問梭羅佩佩在2020年，就想寫信問梭羅大師一些關於他著作中所提到的思想、哲學。經過十九世紀到現在的二十一世紀時間的變革，有許多的思想，在梭羅當時的

賴仕涵的思考王國

2023/11/28

👘你一定想不到的ChatGPT虛擬情人美圖生成密技：「神社和服」系列

本文是即將推出的重磅教學文〈想要讓ChatGPT配合畫圖，你該具備的仍然是召喚師的四大能力〉的熱身，先解答幾個常被問到的ChatGPT圖片生成問題，同時分享我生成超過1000張「虛擬情人美女圖」所發現的幾個小密技。 ⛩需不需要使用「英文」下圖片生成指令？ ⛩一定要在GPT4「客製化」模式（Crea

#虛擬情人 #ChatGPT創作 #AI

劍心風之痕的AI醫學沙龍

2023/08/29

分享YT影片及附上AI字幕: AI Innovation Talk⭐AIGC系列(1) 全面升級 ChatGPT Pro

重點摘要: 這裡是關於ChatGPT的AI Innovation Talk的內容摘要: 1. ChatGPT是一個訊息處理器,不是聊天機器人,要先正確認知它的能力邊界。它擅長總結、推論、轉換和擴寫。 2. 使用ChatGPT時要明確具體,可以使用分隔符號等提高明確度,也可以拆解步驟讓它逐

#AIGC #ChatGPT #學習

2023/07/23

【ChatGPT 系列】ChatGPT 不準了？AI 準確度會隨著時間變化嗎？

前幾日 Twitter 社群中許多人轉傳一篇發表在 arxiv 的論文預印本（preprint），提及 ChatGPT 隨著時間可能產生了變化，甚至人們稱此篇貼文指出「GPT-4」似乎表現越來越差！儘管隨即被許多人相繼駁斥，此篇研究並沒有提出任何關於 GPT-4 效能變差的結論。

#ChatGPT #大型語言模型 #AI

月菲的沙發

2023/03/01

ChatGPT：改變生活與工作的AI工具，如何找到平衡點？

我們生活在一個日新月異、科技飛速發展的時代，當前的科技發展讓人們能夠更方便地獲取和分享知識，同時也為人們帶來了更多的機會和挑戰，AI技術的進步和應用對我們的生活和工作產生了極大的影響。例如，像「chatGPT」這樣的AI模型能夠通過自然語言處理和深度學習技術，提供客觀、準確的資訊和回答問題，幫助使用

#ChatGPT #模型

Ds Tacr的沙龍

2023/02/24

CHATGPT--我與CH的命題作文練習 (創新思考篇)

方格子的最新主題中有一個與CHATGPT共同創作的挑戰項目，心裡有些疑惑的我，最後還是選擇踏出自己的第一步。和CH先生對談前，要有心理準備，你要面對的是一個超級新星，看得到他的機會遠少於看到他的廣告詞。沒看到他時，正好讓你思考，你真的很想和他交談嗎？花這個時間有意義嗎？也吃過閉門羹的你......

#創新 #人工智慧 #ChatGPT

朱騏的沙龍

2023/02/18

【AI ChatGPT 系列 — 2】給想要將 ChatGPT 加入到自己工作中的新手，分享 3 個訣竅寫好指令

要將 ChatGPT 用得好，關鍵是學會輸入清楚的指令(Prompt)。可惜我發現，多數人的指令都非常模糊，因此得到的結果也非常的...悲劇。分享 3 個訣竅寫出清楚的 ChatGPT 指令，並得到滿意的回答結果。

#ChatGPT

黑色鬱金香的沙龍

2023/02/09

ChatGPT創作的【AI人工智能vs人類存亡之戰】短篇故事

請ChatGPT創造了三篇小故事。「AI機器人大衛與小恐龍」「AI人工智能vs.人類存亡之戰」「沒有感情的吃薯條機器」

#ChatGPT #人類 #機器人

朱騏的沙龍

2023/01/21

【AI ChatGPT 系列 – 1】 ChatGPT 是什麼？3 個知識點帶你快速入門 ChatGPT

我使用 ChatGPT 已經超過 1 個月了，極度關注 ChatGPT 的相關新聞。我發現網路與報章雜誌上都開始報導 ChatGPT 這款工具，但多數人還是不瞭解這款工具可以如何幫助我們。如果不了解 ChatGPT 的細節，我們就只能「聽說」這款工具很厲害，但卻無法為己所用。這篇文章分享 3 個快速

#ChatGPT

台中散戶の交易日常

2024/09/08