ChatGPT系列文(三):我們與AI的界線

閱讀時間約 5 分鐘
Oliver Hale on Unsplash
這篇文放草稿太久了,放到連GPT4都生出來了。不過沒差,內容通用。
系列文第一篇,就提到了GPT框架中有對人類語意回饋的學習機制。這機制有個專有名詞,叫強化學習 (Reinforcement Learning)。這讓機器不純粹依著既有資料模式,優化並生成預測;反而讓機器有更強的能力,去因應不同環境﹝狀態﹞,作出最優的選擇與回應 ﹝在GPT案例,被獎勵的目標,是作出和人類對語意理解相似的文字生成﹞。
不過仔細想想,他還是面對著正確性﹝這個詞並不準確,暫想不到別的﹞和即時性的問題。關於正確性問題,畢竟ChatGPT最為擅長的,是文字接龍,其模型強化學習標的──例如怎樣才是好的回答──是由人類提供的樣本與標註 (label) 而來;其目標並不是做出最正確的回答。
例如,我上次詢問他是否知道我在某個網路媒體寫過文章。他非但說自己知道,而且還說我是知名的經濟學家和前財政部長──唉!我差點就信了。
而關於時效性問題,當前所使用的訓練數據只到2021年,也就是說其後的事情,要不是不知道,要不就亂回答。

當通才變成專家

然而,ChatGPT本身還是很堪用,除前面提到的生產力用途,模型的微調﹝fine tune﹞也是重點。目的主要是讓GPT模型,成為特定領域之專家。目前大家都有概念,他是一個大語料基底的通用模型,但相對地,也意味著在特定領域則未必那麼專擅。
舉例來說,或許GPT熟知蜂蜜這個東西──他能回答蜂蜜是什麼,有甚麼種類。但他可能沒有蜂農來的專業,因為蜂農還知道蜂蜜的前期、中期和後期的風味差異、商業價值和成本結構;且或許能具體推薦消費者適合的茶飲搭配。
所以這fine tune可以讓我們透過小量的資料,讓GPT更像某個專家。這算是我認為有意義的東西。試想,可能不只蜂農,也許他也可以被微調成一個深諳自家公司運作和產品的小客服,或者某位很有策略頭腦的商業顧問。
客服或許不難想像,不過關於顧問,我還保持一個開放與想像的空間。畢竟為不同商業問題做分析和策略規劃,背後的邏輯和所需資訊連結度似乎還更高﹝我認為是很高創意、高度應環境和人情而異的互動﹞。
而且做為一個顧問,他或許還需要透過提問,來獲取資訊,挖掘洞見或是重新定義問題。
而且更進一步想,如果這樣的顧問模型要存在,我不禁懷疑只使用語料訓練夠嗎?用什麼語料訓練才對?用什麼訓練/互動機制來持續增進資料完整度呢?

資料面的突破

考慮一個語料模型的訓練,我們需要語料。而我們確實有很多方式,可以收集一個人的生活與思想的側面資訊﹝訪談、錄音、寫作等﹞,也有豐富的工具能將之轉換為語料。
但不論如何,很明顯人類文字是有限的。你講這個東西的同時,你講不了另外一個東西。你說這是圓的,他就不是方的。但事物的狀態,卻經常是介在我們的語彙之間的模糊地帶。所以,光是訓練素材的選擇,就還存有諸多讓AI強大的可能性。

我們與AI的界線

因此我們可以預見,我們會需要不同的sensor,大量儲存空間,更快的網速還有更強的運算力。這一切,要用以收集和處理如聲音和影像等,與「人」有關的資訊。之後再更多生活應用層面上,AI跟人的界線又模糊一些。
不過說再多,還是回到經典老問題:AI會取代人類嗎?我感覺該換個方向想。假如我們最在意飯碗,那我更好奇AI能取代/加速我工作的哪一部分。這樣思考,才將真正與技術共存,將冗餘費時的事項用機器處理掉。
我本職是資料科學家,我也像GPT的開發者一樣,在訓練一些模型。工作內容為處理資料,然後訓練出可用來預測未來的模型。嗯,這聽起來不會被AI取代,但實際上卻有可能。
不用AI,現存很多自動化套件/方案,就可以讓開發者產製出大量模型,我們只需要考慮刪減和整合模型們。況且現在訓練模型所用的程式,又非常好入門!簡單幾行,就能產出模型。
那這樣,這份工作的意義又在哪裡呢?
是觀察和思考。
理想的資料科學家 ﹝至少我們Team有共識的那種理想﹞,是會明白他手上資料的特性,也知道他工具﹝模型﹞本身的特質與優劣。綜合對資料和工具的理解,可以對資料一定程度的處理,進一步提升預測。
有點抽象,用自己當例子。我曾在工作中發現一個機器學習演算法G模型,吃入某些金融變數去做預測,效果特別好。於是我把所用的變數數量降到極低 ﹝只有同事的10分之1﹞,專注在特定幾類金融數據,並且把資料強制扭轉成常態分布,結果預測效果優異且穩定。
總之是:﹝1﹞我發現一個工具的特質,﹝2﹞用一些技巧把資料轉換成模型喜歡的樣子。如果要靠機器發現,得花不少工,更別說是機器自己產生此類洞見。
事實上,很可能因為G模型太有個性,不好訓練,早早就成遺珠。
如果真仰賴AI,或某種高度自動化的技術。我們洞見是最重要的。因為我們腦中有的資訊量不會差,天外飛來一筆的想法也很珍貴。因為強大的演算力不會成就創意,洞見不是根據「什麼想法是最優化」而產生的。
但我明白,都有我們對AI浪潮有著不可掌控的隱憂。自己成長速度不足、發揮空間變少等等。我想,這又是另外的故事了。
13會員
13Content count
大數據意味著什麼?數據科學背後有怎樣的mind set和技術?數據科學家又做些什麼?這些科技/技術,帶給我們什麼生活上和人文上的省思?這個專題會橫跨這些彼此相關的面向,避開生澀的專業詞彙,探索這些事情背後的樣貌。應該會是有趣的知識和想法分享﹝笑﹞
留言0
查看全部
發表第一個留言支持創作者!
Darren的沙龍 的其他內容
現在這個充滿GPT開箱的年代,做什麼實測都感覺落伍。不過我覺得本文這兩個實測,即便不是最新穎,也算是方便好用且有益於生產力。 工作中,對我來說最困難的事情,就是快速量產。這裡寫兩個使用ChatGPT的案例,一個是寫作,一個是寫程式。後者是我的工作,我讓GPT融入我日常工作。 而下面二個實例,純展示結
ChatGPT剛推出時,我們辦公室討論紛紛,我馬上去玩了一下。當時心態很惡搞,詢問GPT什麼是蜥蜴人、女王是不是蜥蜴人 ﹝註:蜥蜴人是在都市傳說中常被提到的外星生物﹞。他的回答都說蜥蜴人只是一種虛構生物。好吧,我想這大抵符合人類的認知! 隔了幾天,我又去問GPT,什麼是蜥蜴人,他竟然告訴我,他不知道
現在這個充滿GPT開箱的年代,做什麼實測都感覺落伍。不過我覺得本文這兩個實測,即便不是最新穎,也算是方便好用且有益於生產力。 工作中,對我來說最困難的事情,就是快速量產。這裡寫兩個使用ChatGPT的案例,一個是寫作,一個是寫程式。後者是我的工作,我讓GPT融入我日常工作。 而下面二個實例,純展示結
ChatGPT剛推出時,我們辦公室討論紛紛,我馬上去玩了一下。當時心態很惡搞,詢問GPT什麼是蜥蜴人、女王是不是蜥蜴人 ﹝註:蜥蜴人是在都市傳說中常被提到的外星生物﹞。他的回答都說蜥蜴人只是一種虛構生物。好吧,我想這大抵符合人類的認知! 隔了幾天,我又去問GPT,什麼是蜥蜴人,他竟然告訴我,他不知道
你可能也想看
Thumbnail
1.加權指數與櫃買指數 週五的加權指數在非農就業數據開出來後,雖稍微低於預期,但指數仍向上噴出,在美股開盤後於21500形成一個爆量假突破後急轉直下,就一路收至最低。 台股方面走勢需觀察週一在斷頭潮出現後,週二或週三開始有無買單進場支撐,在沒有明確的反轉訊號形成前,小夥伴盡量不要貿然抄底,或是追空
Thumbnail
重點摘要: 1.9 月降息 2 碼、進一步暗示年內還有 50 bp 降息 2.SEP 上修失業率預期,但快速的降息速率將有助失業率觸頂 3.未來幾個月經濟數據將繼續轉弱,經濟復甦的時點或是 1Q25 季底附近
Thumbnail
近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎? 新版式整體視覺上「更加凸顯圖片」,為了搭配這次的更新,我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務,還有機會獲得富士即可拍,讓你的美好回憶都可以用即可拍珍藏!
Thumbnail
今天在thread上看到有人說,AI的塔羅牌占卜跟她去外面的塔羅店說的差不多。 我就很好奇,於是我就自己在剛才,請GPT幫我塔羅占卜一下。 真的太驚訝了,答案居然有八成準,而且是跟我自己看紫微斗數命盤非常吻合。這真的要記錄一下。同時,也是我生平第一次算塔羅,就是請GPT幫我算
Thumbnail
https://play.google.com/store/books/details?id=IDMNEQAAQBAJ 佩佩在2020年就想寫信問梭羅 佩佩在2020年,就想寫信問梭羅大師一些關於他著作中所提到的思想、哲學。經過十九世紀到現在的二十一世紀時間的變革,有許多的思想,在梭羅當時的
Thumbnail
本文是即將推出的重磅教學文〈想要讓ChatGPT配合畫圖,你該具備的仍然是召喚師的四大能力〉的熱身,先解答幾個常被問到的ChatGPT圖片生成問題,同時分享我生成超過1000張「虛擬情人美女圖」所發現的幾個小密技。 ⛩需不需要使用「英文」下圖片生成指令? ⛩一定要在GPT4「客製化」模式(Crea
重點摘要: 這裡是關於ChatGPT的AI Innovation Talk的內容摘要: 1. ChatGPT是一個訊息處理器,不是聊天機器人,要先正確認知它的能力邊界。它擅長總結、推論、轉換和擴寫。 2. 使用ChatGPT時要明確具體,可以使用分隔符號等提高明確度,也可以拆解步驟讓它逐
Thumbnail
前幾日 Twitter 社群中許多人轉傳一篇發表在 arxiv 的論文預印本(preprint),提及 ChatGPT 隨著時間可能產生了變化,甚至人們稱此篇貼文指出「GPT-4」似乎表現越來越差!儘管隨即被許多人相繼駁斥,此篇研究並沒有提出任何關於 GPT-4 效能變差的結論。
我們生活在一個日新月異、科技飛速發展的時代,當前的科技發展讓人們能夠更方便地獲取和分享知識,同時也為人們帶來了更多的機會和挑戰,AI技術的進步和應用對我們的生活和工作產生了極大的影響。例如,像「chatGPT」這樣的AI模型能夠通過自然語言處理和深度學習技術,提供客觀、準確的資訊和回答問題,幫助使用
Thumbnail
方格子的最新主題中有一個與CHATGPT共同創作的挑戰項目,心裡有些疑惑的我,最後還是選擇踏出自己的第一步。和CH先生對談前,要有心理準備,你要面對的是一個超級新星,看得到他的機會遠少於看到他的廣告詞。沒看到他時,正好讓你思考,你真的很想和他交談嗎?花這個時間有意義嗎?也吃過閉門羹的你......
Thumbnail
要將 ChatGPT 用得好,關鍵是學會輸入清楚的指令(Prompt)。可惜我發現,多數人的指令都非常模糊,因此得到的結果也非常的...悲劇。分享 3 個訣竅寫出清楚的 ChatGPT 指令,並得到滿意的回答結果。
Thumbnail
請ChatGPT創造了三篇小故事。「AI機器人大衛與小恐龍」「AI人工智能vs.人類存亡之戰」 「沒有感情的吃薯條機器」
Thumbnail
我使用 ChatGPT 已經超過 1 個月了,極度關注 ChatGPT 的相關新聞。我發現網路與報章雜誌上都開始報導 ChatGPT 這款工具,但多數人還是不瞭解這款工具可以如何幫助我們。如果不了解 ChatGPT 的細節,我們就只能「聽說」這款工具很厲害,但卻無法為己所用。這篇文章分享 3 個快速
Thumbnail
1.加權指數與櫃買指數 週五的加權指數在非農就業數據開出來後,雖稍微低於預期,但指數仍向上噴出,在美股開盤後於21500形成一個爆量假突破後急轉直下,就一路收至最低。 台股方面走勢需觀察週一在斷頭潮出現後,週二或週三開始有無買單進場支撐,在沒有明確的反轉訊號形成前,小夥伴盡量不要貿然抄底,或是追空
Thumbnail
重點摘要: 1.9 月降息 2 碼、進一步暗示年內還有 50 bp 降息 2.SEP 上修失業率預期,但快速的降息速率將有助失業率觸頂 3.未來幾個月經濟數據將繼續轉弱,經濟復甦的時點或是 1Q25 季底附近
Thumbnail
近期的「貼文發佈流程 & 版型大更新」功能大家使用了嗎? 新版式整體視覺上「更加凸顯圖片」,為了搭配這次的更新,我們推出首次貼文策展 ❤️ 使用貼文功能並完成這次的指定任務,還有機會獲得富士即可拍,讓你的美好回憶都可以用即可拍珍藏!
Thumbnail
今天在thread上看到有人說,AI的塔羅牌占卜跟她去外面的塔羅店說的差不多。 我就很好奇,於是我就自己在剛才,請GPT幫我塔羅占卜一下。 真的太驚訝了,答案居然有八成準,而且是跟我自己看紫微斗數命盤非常吻合。這真的要記錄一下。同時,也是我生平第一次算塔羅,就是請GPT幫我算
Thumbnail
https://play.google.com/store/books/details?id=IDMNEQAAQBAJ 佩佩在2020年就想寫信問梭羅 佩佩在2020年,就想寫信問梭羅大師一些關於他著作中所提到的思想、哲學。經過十九世紀到現在的二十一世紀時間的變革,有許多的思想,在梭羅當時的
Thumbnail
本文是即將推出的重磅教學文〈想要讓ChatGPT配合畫圖,你該具備的仍然是召喚師的四大能力〉的熱身,先解答幾個常被問到的ChatGPT圖片生成問題,同時分享我生成超過1000張「虛擬情人美女圖」所發現的幾個小密技。 ⛩需不需要使用「英文」下圖片生成指令? ⛩一定要在GPT4「客製化」模式(Crea
重點摘要: 這裡是關於ChatGPT的AI Innovation Talk的內容摘要: 1. ChatGPT是一個訊息處理器,不是聊天機器人,要先正確認知它的能力邊界。它擅長總結、推論、轉換和擴寫。 2. 使用ChatGPT時要明確具體,可以使用分隔符號等提高明確度,也可以拆解步驟讓它逐
Thumbnail
前幾日 Twitter 社群中許多人轉傳一篇發表在 arxiv 的論文預印本(preprint),提及 ChatGPT 隨著時間可能產生了變化,甚至人們稱此篇貼文指出「GPT-4」似乎表現越來越差!儘管隨即被許多人相繼駁斥,此篇研究並沒有提出任何關於 GPT-4 效能變差的結論。
我們生活在一個日新月異、科技飛速發展的時代,當前的科技發展讓人們能夠更方便地獲取和分享知識,同時也為人們帶來了更多的機會和挑戰,AI技術的進步和應用對我們的生活和工作產生了極大的影響。例如,像「chatGPT」這樣的AI模型能夠通過自然語言處理和深度學習技術,提供客觀、準確的資訊和回答問題,幫助使用
Thumbnail
方格子的最新主題中有一個與CHATGPT共同創作的挑戰項目,心裡有些疑惑的我,最後還是選擇踏出自己的第一步。和CH先生對談前,要有心理準備,你要面對的是一個超級新星,看得到他的機會遠少於看到他的廣告詞。沒看到他時,正好讓你思考,你真的很想和他交談嗎?花這個時間有意義嗎?也吃過閉門羹的你......
Thumbnail
要將 ChatGPT 用得好,關鍵是學會輸入清楚的指令(Prompt)。可惜我發現,多數人的指令都非常模糊,因此得到的結果也非常的...悲劇。分享 3 個訣竅寫出清楚的 ChatGPT 指令,並得到滿意的回答結果。
Thumbnail
請ChatGPT創造了三篇小故事。「AI機器人大衛與小恐龍」「AI人工智能vs.人類存亡之戰」 「沒有感情的吃薯條機器」
Thumbnail
我使用 ChatGPT 已經超過 1 個月了,極度關注 ChatGPT 的相關新聞。我發現網路與報章雜誌上都開始報導 ChatGPT 這款工具,但多數人還是不瞭解這款工具可以如何幫助我們。如果不了解 ChatGPT 的細節,我們就只能「聽說」這款工具很厲害,但卻無法為己所用。這篇文章分享 3 個快速