ChatGPT系列文(三):我們與AI的界線

更新於 發佈於 閱讀時間約 6 分鐘
raw-image

這篇文放草稿太久了,放到連GPT4都生出來了。不過沒差,內容通用。

系列文第一篇,就提到了GPT框架中有對人類語意回饋的學習機制。這機制有個專有名詞,叫強化學習 (Reinforcement Learning)。這讓機器不純粹依著既有資料模式,優化並生成預測;反而讓機器有更強的能力,去因應不同環境﹝狀態﹞,作出最優的選擇與回應 ﹝在GPT案例,被獎勵的目標,是作出和人類對語意理解相似的文字生成﹞。

不過仔細想想,他還是面對著正確性﹝這個詞並不準確,暫想不到別的﹞和即時性的問題。關於正確性問題,畢竟ChatGPT最為擅長的,是文字接龍,其模型強化學習標的──例如怎樣才是好的回答──是由人類提供的樣本與標註 (label) 而來;其目標並不是做出最正確的回答。

例如,我上次詢問他是否知道我在某個網路媒體寫過文章。他非但說自己知道,而且還說我是知名的經濟學家和前財政部長──唉!我差點就信了。

而關於時效性問題,當前所使用的訓練數據只到2021年,也就是說其後的事情,要不是不知道,要不就亂回答。

當通才變成專家

然而,ChatGPT本身還是很堪用,除前面提到的生產力用途,模型的微調﹝fine tune﹞也是重點。目的主要是讓GPT模型,成為特定領域之專家。目前大家都有概念,他是一個大語料基底的通用模型,但相對地,也意味著在特定領域則未必那麼專擅。

舉例來說,或許GPT熟知蜂蜜這個東西──他能回答蜂蜜是什麼,有甚麼種類。但他可能沒有蜂農來的專業,因為蜂農還知道蜂蜜的前期、中期和後期的風味差異、商業價值和成本結構;且或許能具體推薦消費者適合的茶飲搭配。

所以這fine tune可以讓我們透過小量的資料,讓GPT更像某個專家。這算是我認為有意義的東西。試想,可能不只蜂農,也許他也可以被微調成一個深諳自家公司運作和產品的小客服,或者某位很有策略頭腦的商業顧問。

客服或許不難想像,不過關於顧問,我還保持一個開放與想像的空間。畢竟為不同商業問題做分析和策略規劃,背後的邏輯和所需資訊連結度似乎還更高﹝我認為是很高創意、高度應環境和人情而異的互動﹞。

而且做為一個顧問,他或許還需要透過提問,來獲取資訊,挖掘洞見或是重新定義問題。

而且更進一步想,如果這樣的顧問模型要存在,我不禁懷疑只使用語料訓練夠嗎?用什麼語料訓練才對?用什麼訓練/互動機制來持續增進資料完整度呢?

資料面的突破

考慮一個語料模型的訓練,我們需要語料。而我們確實有很多方式,可以收集一個人的生活與思想的側面資訊﹝訪談、錄音、寫作等﹞,也有豐富的工具能將之轉換為語料。

但不論如何,很明顯人類文字是有限的。你講這個東西的同時,你講不了另外一個東西。你說這是圓的,他就不是方的。但事物的狀態,卻經常是介在我們的語彙之間的模糊地帶。所以,光是訓練素材的選擇,就還存有諸多讓AI強大的可能性。

我們與AI的界線

因此我們可以預見,我們會需要不同的sensor,大量儲存空間,更快的網速還有更強的運算力。這一切,要用以收集和處理如聲音和影像等,與「人」有關的資訊。之後再更多生活應用層面上,AI跟人的界線又模糊一些。

不過說再多,還是回到經典老問題:AI會取代人類嗎?我感覺該換個方向想。假如我們最在意飯碗,那我更好奇AI能取代/加速我工作的哪一部分。這樣思考,才將真正與技術共存,將冗餘費時的事項用機器處理掉。

我本職是資料科學家,我也像GPT的開發者一樣,在訓練一些模型。工作內容為處理資料,然後訓練出可用來預測未來的模型。嗯,這聽起來不會被AI取代,但實際上卻有可能。

不用AI,現存很多自動化套件/方案,就可以讓開發者產製出大量模型,我們只需要考慮刪減和整合模型們。況且現在訓練模型所用的程式,又非常好入門!簡單幾行,就能產出模型。

那這樣,這份工作的意義又在哪裡呢?

是觀察和思考。

理想的資料科學家 ﹝至少我們Team有共識的那種理想﹞,是會明白他手上資料的特性,也知道他工具﹝模型﹞本身的特質與優劣。綜合對資料和工具的理解,可以對資料一定程度的處理,進一步提升預測。

有點抽象,用自己當例子。我曾在工作中發現一個機器學習演算法G模型,吃入某些金融變數去做預測,效果特別好。於是我把所用的變數數量降到極低 ﹝只有同事的10分之1﹞,專注在特定幾類金融數據,並且把資料強制扭轉成常態分布,結果預測效果優異且穩定。

總之是:﹝1﹞我發現一個工具的特質,﹝2﹞用一些技巧把資料轉換成模型喜歡的樣子。如果要靠機器發現,得花不少工,更別說是機器自己產生此類洞見。

事實上,很可能因為G模型太有個性,不好訓練,早早就成遺珠。

如果真仰賴AI,或某種高度自動化的技術。我們洞見是最重要的。因為我們腦中有的資訊量不會差,天外飛來一筆的想法也很珍貴。因為強大的演算力不會成就創意,洞見不是根據「什麼想法是最優化」而產生的。

但我明白,都有我們對AI浪潮有著不可掌控的隱憂。自己成長速度不足、發揮空間變少等等。我想,這又是另外的故事了。

留言
avatar-img
留言分享你的想法!
avatar-img
Darren的沙龍
14會員
14內容數
大數據意味著什麼?數據科學背後有怎樣的mind set和技術?數據科學家又做些什麼?這些科技/技術,帶給我們什麼生活上和人文上的省思?這個專題會橫跨這些彼此相關的面向,避開生澀的專業詞彙,探索這些事情背後的樣貌。應該會是有趣的知識和想法分享﹝笑﹞
Darren的沙龍的其他內容
2024/08/31
文章主攻四大領域:機率與統計、計量經濟和量化金融分析。以機率統計為核心主幹,詳加說明其精神與應用。也會輔以其餘三個領域的介紹作為統計實例。統計學是AI / 機器學習背後的英雄,假設檢定與統計分布是其兩大特色,前者找出彼此相互關聯的變數;後者則幫助我們進行模擬和抽樣,幫助我們找尋最優解或近似真實值。
Thumbnail
2024/08/31
文章主攻四大領域:機率與統計、計量經濟和量化金融分析。以機率統計為核心主幹,詳加說明其精神與應用。也會輔以其餘三個領域的介紹作為統計實例。統計學是AI / 機器學習背後的英雄,假設檢定與統計分布是其兩大特色,前者找出彼此相互關聯的變數;後者則幫助我們進行模擬和抽樣,幫助我們找尋最優解或近似真實值。
Thumbnail
2024/07/19
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
2024/07/19
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
2024/07/05
本文談及資料科學的領域與分工。首先是建造一個AI的研發流程,資料收集到 AI 模型訓練的過程,AI經歷這一切流程被創造出來並產生價值;再來本文也提及在這個領域中的各種腳色、資料工程師、數據庫工程師、資料科學家和資料分析師的各種介紹。並且強調跨領域合作的重要性。
Thumbnail
2024/07/05
本文談及資料科學的領域與分工。首先是建造一個AI的研發流程,資料收集到 AI 模型訓練的過程,AI經歷這一切流程被創造出來並產生價值;再來本文也提及在這個領域中的各種腳色、資料工程師、數據庫工程師、資料科學家和資料分析師的各種介紹。並且強調跨領域合作的重要性。
Thumbnail
看更多
你可能也想看
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
這篇文章介紹了ChatGPT,一種大型的語言模型,能以自然語言回答問題,但不透過搜尋罐頭文字或網路內容。其核心技術是自監督式學習,通過大量的網路資料進行訓練,讓模型能進行文字接龍。儘管GPT系列經歷了多次演進,並需用大量的訓練資料,它的問答能力仍有待提升。然而,透過不斷優化,我們已有了更進一步的版本
Thumbnail
這篇文章介紹了ChatGPT,一種大型的語言模型,能以自然語言回答問題,但不透過搜尋罐頭文字或網路內容。其核心技術是自監督式學習,通過大量的網路資料進行訓練,讓模型能進行文字接龍。儘管GPT系列經歷了多次演進,並需用大量的訓練資料,它的問答能力仍有待提升。然而,透過不斷優化,我們已有了更進一步的版本
Thumbnail
在這裡會講一些如何和chatGPT溝通的方式 現在沒有人不知道大名鼎鼎的GPT君 但可能不是每個人都能完全發揮它的功用 所以我想要總結一些我摸索到的和GPT君的溝通方法,看可不可以幫到大家xD
Thumbnail
在這裡會講一些如何和chatGPT溝通的方式 現在沒有人不知道大名鼎鼎的GPT君 但可能不是每個人都能完全發揮它的功用 所以我想要總結一些我摸索到的和GPT君的溝通方法,看可不可以幫到大家xD
Thumbnail
相信自從去年年底一直到現在都一直聽到 ChatGPT 這個名詞吧?顯然這個名詞已經變成另一個媒體爭寵的話題。但就我看來這次與上次的區塊鏈很不一樣! 而在昨天第四代 GPT 已經發布了,有興趣可以到他們官網了解與 GPT-4 相關的資訊,我相信第四代 GPT 應該會引起人們更多對於 AI 的極限以及應
Thumbnail
相信自從去年年底一直到現在都一直聽到 ChatGPT 這個名詞吧?顯然這個名詞已經變成另一個媒體爭寵的話題。但就我看來這次與上次的區塊鏈很不一樣! 而在昨天第四代 GPT 已經發布了,有興趣可以到他們官網了解與 GPT-4 相關的資訊,我相信第四代 GPT 應該會引起人們更多對於 AI 的極限以及應
Thumbnail
晚安我是山羊,   最近打開社群軟體時,常看到關於ChatGPT的新聞、使用心得分享。雖然我未使用過,但近期遇到一件與ChatGPT有關的小故事,讓我對AI與人類之間的立場、關聯產生了疑惑,因此想來分享我的看法。
Thumbnail
晚安我是山羊,   最近打開社群軟體時,常看到關於ChatGPT的新聞、使用心得分享。雖然我未使用過,但近期遇到一件與ChatGPT有關的小故事,讓我對AI與人類之間的立場、關聯產生了疑惑,因此想來分享我的看法。
Thumbnail
這篇文放草稿太久了,放到連GPT4都生出來了。不過沒差,內容通用。 在系列文第一篇,就提到了GPT框架中有對人類語意回饋的學習機制。這機制有個專有名詞,叫強化學習 (Reinforcement Learning)。這讓機器不純粹依著既有資料模式,優化並生成預測;反而讓機器有更強的能力,去因應不同環境
Thumbnail
這篇文放草稿太久了,放到連GPT4都生出來了。不過沒差,內容通用。 在系列文第一篇,就提到了GPT框架中有對人類語意回饋的學習機制。這機制有個專有名詞,叫強化學習 (Reinforcement Learning)。這讓機器不純粹依著既有資料模式,優化並生成預測;反而讓機器有更強的能力,去因應不同環境
Thumbnail
ChatGPT 的全名是「Generative Pre-trained Transformer」,簡稱 GPT。GPT 是一個由 OpenAI 開發的自然語言處理模型,它使用大量的文本資料來訓練自己並且可以生成自然語言文本,可以進行文章寫作、問答、對話等多種語言任務。在中文使用者中,通常也會稱其為「
Thumbnail
ChatGPT 的全名是「Generative Pre-trained Transformer」,簡稱 GPT。GPT 是一個由 OpenAI 開發的自然語言處理模型,它使用大量的文本資料來訓練自己並且可以生成自然語言文本,可以進行文章寫作、問答、對話等多種語言任務。在中文使用者中,通常也會稱其為「
Thumbnail
去年底開始,大家在社群媒體上狂發自己的 AI 人像繪圖,許多繪師和設計師們開始擔心未來的出路。 後來出現了 ChatGPT,社群媒體上開始傳了許多與 ChatGPT 的對話。 突然之間,AI 這話題熱門了起來! 這幾個月 Youtube 上充斥著用 ChatGPT 迅速獲利、用 ChatGPT 幫你
Thumbnail
去年底開始,大家在社群媒體上狂發自己的 AI 人像繪圖,許多繪師和設計師們開始擔心未來的出路。 後來出現了 ChatGPT,社群媒體上開始傳了許多與 ChatGPT 的對話。 突然之間,AI 這話題熱門了起來! 這幾個月 Youtube 上充斥著用 ChatGPT 迅速獲利、用 ChatGPT 幫你
Thumbnail
問題是,圖像的感性體驗往往是由觀看者的客觀視覺產生的。因此不論是創作者投注情感繪製的繪畫,還是AI產生的「圖片」,人類的視覺感官是沒辦法解讀、區分出埋藏於圖像裡的感性訊號,究竟是由人類思緒編織而成,還是AI透過學習模仿得來的。
Thumbnail
問題是,圖像的感性體驗往往是由觀看者的客觀視覺產生的。因此不論是創作者投注情感繪製的繪畫,還是AI產生的「圖片」,人類的視覺感官是沒辦法解讀、區分出埋藏於圖像裡的感性訊號,究竟是由人類思緒編織而成,還是AI透過學習模仿得來的。
Thumbnail
人工智慧(AI)是近年來發展迅速的一個技術,剛開始討論時大家都在想像會不會有一天人類的工作被它取代,但因AI的發展涉及許多領域,包括自然語言處理、計算視覺、強化學習等還需要許多時間醞釀才成得了氣候,使得我們老神在在,覺得就算會被取代,也只是低階的重複性工作,畢竟人性才是人類工作最核心的價值,不是嗎?
Thumbnail
人工智慧(AI)是近年來發展迅速的一個技術,剛開始討論時大家都在想像會不會有一天人類的工作被它取代,但因AI的發展涉及許多領域,包括自然語言處理、計算視覺、強化學習等還需要許多時間醞釀才成得了氣候,使得我們老神在在,覺得就算會被取代,也只是低階的重複性工作,畢竟人性才是人類工作最核心的價值,不是嗎?
Thumbnail
相信這個大家最近都有看到新聞,就是OepnAI這個基金會提出了一個新的AI模型ChatGPT,這個ChatGPT跟以往的AI模型不太一樣,基本上輸入很多問題都可以獲得解答,而且回答得語氣跟人類很像。 同時這個ChatGPT很厲害的事情,包含可以產出程式、幫助回覆程式問題、產出行銷文案、演講大綱等等,
Thumbnail
相信這個大家最近都有看到新聞,就是OepnAI這個基金會提出了一個新的AI模型ChatGPT,這個ChatGPT跟以往的AI模型不太一樣,基本上輸入很多問題都可以獲得解答,而且回答得語氣跟人類很像。 同時這個ChatGPT很厲害的事情,包含可以產出程式、幫助回覆程式問題、產出行銷文案、演講大綱等等,
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News