ChatGPT系列文(三):我們與AI的界線

更新於 發佈於 閱讀時間約 5 分鐘
Oliver Hale on Unsplash
這篇文放草稿太久了,放到連GPT4都生出來了。不過沒差,內容通用。
系列文第一篇,就提到了GPT框架中有對人類語意回饋的學習機制。這機制有個專有名詞,叫強化學習 (Reinforcement Learning)。這讓機器不純粹依著既有資料模式,優化並生成預測;反而讓機器有更強的能力,去因應不同環境﹝狀態﹞,作出最優的選擇與回應 ﹝在GPT案例,被獎勵的目標,是作出和人類對語意理解相似的文字生成﹞。
不過仔細想想,他還是面對著正確性﹝這個詞並不準確,暫想不到別的﹞和即時性的問題。關於正確性問題,畢竟ChatGPT最為擅長的,是文字接龍,其模型強化學習標的──例如怎樣才是好的回答──是由人類提供的樣本與標註 (label) 而來;其目標並不是做出最正確的回答。
例如,我上次詢問他是否知道我在某個網路媒體寫過文章。他非但說自己知道,而且還說我是知名的經濟學家和前財政部長──唉!我差點就信了。
而關於時效性問題,當前所使用的訓練數據只到2021年,也就是說其後的事情,要不是不知道,要不就亂回答。

當通才變成專家

然而,ChatGPT本身還是很堪用,除前面提到的生產力用途,模型的微調﹝fine tune﹞也是重點。目的主要是讓GPT模型,成為特定領域之專家。目前大家都有概念,他是一個大語料基底的通用模型,但相對地,也意味著在特定領域則未必那麼專擅。
舉例來說,或許GPT熟知蜂蜜這個東西──他能回答蜂蜜是什麼,有甚麼種類。但他可能沒有蜂農來的專業,因為蜂農還知道蜂蜜的前期、中期和後期的風味差異、商業價值和成本結構;且或許能具體推薦消費者適合的茶飲搭配。
所以這fine tune可以讓我們透過小量的資料,讓GPT更像某個專家。這算是我認為有意義的東西。試想,可能不只蜂農,也許他也可以被微調成一個深諳自家公司運作和產品的小客服,或者某位很有策略頭腦的商業顧問。
客服或許不難想像,不過關於顧問,我還保持一個開放與想像的空間。畢竟為不同商業問題做分析和策略規劃,背後的邏輯和所需資訊連結度似乎還更高﹝我認為是很高創意、高度應環境和人情而異的互動﹞。
而且做為一個顧問,他或許還需要透過提問,來獲取資訊,挖掘洞見或是重新定義問題。
而且更進一步想,如果這樣的顧問模型要存在,我不禁懷疑只使用語料訓練夠嗎?用什麼語料訓練才對?用什麼訓練/互動機制來持續增進資料完整度呢?

資料面的突破

考慮一個語料模型的訓練,我們需要語料。而我們確實有很多方式,可以收集一個人的生活與思想的側面資訊﹝訪談、錄音、寫作等﹞,也有豐富的工具能將之轉換為語料。
但不論如何,很明顯人類文字是有限的。你講這個東西的同時,你講不了另外一個東西。你說這是圓的,他就不是方的。但事物的狀態,卻經常是介在我們的語彙之間的模糊地帶。所以,光是訓練素材的選擇,就還存有諸多讓AI強大的可能性。

我們與AI的界線

因此我們可以預見,我們會需要不同的sensor,大量儲存空間,更快的網速還有更強的運算力。這一切,要用以收集和處理如聲音和影像等,與「人」有關的資訊。之後再更多生活應用層面上,AI跟人的界線又模糊一些。
不過說再多,還是回到經典老問題:AI會取代人類嗎?我感覺該換個方向想。假如我們最在意飯碗,那我更好奇AI能取代/加速我工作的哪一部分。這樣思考,才將真正與技術共存,將冗餘費時的事項用機器處理掉。
我本職是資料科學家,我也像GPT的開發者一樣,在訓練一些模型。工作內容為處理資料,然後訓練出可用來預測未來的模型。嗯,這聽起來不會被AI取代,但實際上卻有可能。
不用AI,現存很多自動化套件/方案,就可以讓開發者產製出大量模型,我們只需要考慮刪減和整合模型們。況且現在訓練模型所用的程式,又非常好入門!簡單幾行,就能產出模型。
那這樣,這份工作的意義又在哪裡呢?
是觀察和思考。
理想的資料科學家 ﹝至少我們Team有共識的那種理想﹞,是會明白他手上資料的特性,也知道他工具﹝模型﹞本身的特質與優劣。綜合對資料和工具的理解,可以對資料一定程度的處理,進一步提升預測。
有點抽象,用自己當例子。我曾在工作中發現一個機器學習演算法G模型,吃入某些金融變數去做預測,效果特別好。於是我把所用的變數數量降到極低 ﹝只有同事的10分之1﹞,專注在特定幾類金融數據,並且把資料強制扭轉成常態分布,結果預測效果優異且穩定。
總之是:﹝1﹞我發現一個工具的特質,﹝2﹞用一些技巧把資料轉換成模型喜歡的樣子。如果要靠機器發現,得花不少工,更別說是機器自己產生此類洞見。
事實上,很可能因為G模型太有個性,不好訓練,早早就成遺珠。
如果真仰賴AI,或某種高度自動化的技術。我們洞見是最重要的。因為我們腦中有的資訊量不會差,天外飛來一筆的想法也很珍貴。因為強大的演算力不會成就創意,洞見不是根據「什麼想法是最優化」而產生的。
但我明白,都有我們對AI浪潮有著不可掌控的隱憂。自己成長速度不足、發揮空間變少等等。我想,這又是另外的故事了。
avatar-img
14會員
14內容數
大數據意味著什麼?數據科學背後有怎樣的mind set和技術?數據科學家又做些什麼?這些科技/技術,帶給我們什麼生活上和人文上的省思?這個專題會橫跨這些彼此相關的面向,避開生澀的專業詞彙,探索這些事情背後的樣貌。應該會是有趣的知識和想法分享﹝笑﹞
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Darren的沙龍 的其他內容
現在這個充滿GPT開箱的年代,做什麼實測都感覺落伍。不過我覺得本文這兩個實測,即便不是最新穎,也算是方便好用且有益於生產力。 工作中,對我來說最困難的事情,就是快速量產。這裡寫兩個使用ChatGPT的案例,一個是寫作,一個是寫程式。後者是我的工作,我讓GPT融入我日常工作。 而下面二個實例,純展示結
ChatGPT剛推出時,我們辦公室討論紛紛,我馬上去玩了一下。當時心態很惡搞,詢問GPT什麼是蜥蜴人、女王是不是蜥蜴人 ﹝註:蜥蜴人是在都市傳說中常被提到的外星生物﹞。他的回答都說蜥蜴人只是一種虛構生物。好吧,我想這大抵符合人類的認知! 隔了幾天,我又去問GPT,什麼是蜥蜴人,他竟然告訴我,他不知道
現在這個充滿GPT開箱的年代,做什麼實測都感覺落伍。不過我覺得本文這兩個實測,即便不是最新穎,也算是方便好用且有益於生產力。 工作中,對我來說最困難的事情,就是快速量產。這裡寫兩個使用ChatGPT的案例,一個是寫作,一個是寫程式。後者是我的工作,我讓GPT融入我日常工作。 而下面二個實例,純展示結
ChatGPT剛推出時,我們辦公室討論紛紛,我馬上去玩了一下。當時心態很惡搞,詢問GPT什麼是蜥蜴人、女王是不是蜥蜴人 ﹝註:蜥蜴人是在都市傳說中常被提到的外星生物﹞。他的回答都說蜥蜴人只是一種虛構生物。好吧,我想這大抵符合人類的認知! 隔了幾天,我又去問GPT,什麼是蜥蜴人,他竟然告訴我,他不知道
你可能也想看
Google News 追蹤
Thumbnail
/ 大家現在出門買東西還會帶錢包嗎 鴨鴨發現自己好像快一個禮拜沒帶錢包出門 還是可以天天買滿買好回家(? 因此為了記錄手機消費跟各種紅利優惠 鴨鴨都會特別注意銀行的App好不好用! 像是介面設計就是會很在意的地方 很多銀行通常會為了要滿足不同客群 會推出很多App讓使用者下載 每次
Thumbnail
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 人工智慧的未來是以使用者為中心,個人在與人工智慧系統的互動中扮演著越來越重要的角色。預計這種趨勢將催生被
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 以下來談談生成式AI對未來世界的轉變: 商業格局重新構想:邁向未來,生成式人工智慧成為改變商業格局
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 ChatGPT縱然成功,但是仍有一些任務處理得不好,例如: 需要邏輯推論的任務 多步驟的任務
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 生成式AI (Generative AI)是一種人工智慧,它調度機器學習方式來產生新的或者是原創的文字、
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續AI說書 - Prompt Engineering - 1,我們從AI分類開始談起: 機器學習
Thumbnail
ChatGPT(全名:聊天生成預訓練轉換器)是一個由 OpenAI 開發的人工智慧聊天機器人程式。它於 2022 年 11 月推出,使用了基於 GPT-3.5、GPT-4 和 GPT-4o 架構的大型語言模型,並以強化學習進行訓練。
大語言模型,例如OpenAI提供的ChatGPT,是過去幾年發展的深度神經網路模型,開啟自然語言處理的新紀元。
Thumbnail
前年2022年11月OpenAI公司發表了ChatGPT,並開放ChatGPT-3.5在網路上供人免費下載試用,瞬間引爆了人工智慧的話題,能夠自我學習的ChatGPT以每天可見的變化在進步,讓人見識到人工智能的學習力,隨後OpenAI發表的GPT-4,讓人見識到GPT這個人工智慧系統有著令人驚訝的智
Thumbnail
ChatGPT 是 OpenAI 開發的大型語言模型,以其強大的生成能力和對話能力而聞名。 ChatGPT 的訓練過程主要分為兩個階段:預訓練和微調。 微調使用了 RLHF(Reinforcement Learning from Human Feedback)技術,可以有效地提高模型生成內容的質量。
「我們將擁有一種比我們所有人都聰明的智能,而我們對發生了什麼毫不知情。」
Thumbnail
/ 大家現在出門買東西還會帶錢包嗎 鴨鴨發現自己好像快一個禮拜沒帶錢包出門 還是可以天天買滿買好回家(? 因此為了記錄手機消費跟各種紅利優惠 鴨鴨都會特別注意銀行的App好不好用! 像是介面設計就是會很在意的地方 很多銀行通常會為了要滿足不同客群 會推出很多App讓使用者下載 每次
Thumbnail
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 人工智慧的未來是以使用者為中心,個人在與人工智慧系統的互動中扮演著越來越重要的角色。預計這種趨勢將催生被
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 以下來談談生成式AI對未來世界的轉變: 商業格局重新構想:邁向未來,生成式人工智慧成為改變商業格局
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 ChatGPT縱然成功,但是仍有一些任務處理得不好,例如: 需要邏輯推論的任務 多步驟的任務
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 生成式AI (Generative AI)是一種人工智慧,它調度機器學習方式來產生新的或者是原創的文字、
我們人類和ChatGPT的對話技巧也是需要學習的,有鑑於此,我想要一天分享一點「和ChatGPT對話的技術」,並且每篇文章長度控制在三分鐘以內,讓大家不會壓力太大,但是又能夠每天成長一點。 延續AI說書 - Prompt Engineering - 1,我們從AI分類開始談起: 機器學習
Thumbnail
ChatGPT(全名:聊天生成預訓練轉換器)是一個由 OpenAI 開發的人工智慧聊天機器人程式。它於 2022 年 11 月推出,使用了基於 GPT-3.5、GPT-4 和 GPT-4o 架構的大型語言模型,並以強化學習進行訓練。
大語言模型,例如OpenAI提供的ChatGPT,是過去幾年發展的深度神經網路模型,開啟自然語言處理的新紀元。
Thumbnail
前年2022年11月OpenAI公司發表了ChatGPT,並開放ChatGPT-3.5在網路上供人免費下載試用,瞬間引爆了人工智慧的話題,能夠自我學習的ChatGPT以每天可見的變化在進步,讓人見識到人工智能的學習力,隨後OpenAI發表的GPT-4,讓人見識到GPT這個人工智慧系統有著令人驚訝的智
Thumbnail
ChatGPT 是 OpenAI 開發的大型語言模型,以其強大的生成能力和對話能力而聞名。 ChatGPT 的訓練過程主要分為兩個階段:預訓練和微調。 微調使用了 RLHF(Reinforcement Learning from Human Feedback)技術,可以有效地提高模型生成內容的質量。
「我們將擁有一種比我們所有人都聰明的智能,而我們對發生了什麼毫不知情。」