ChatGPT系列文(三):我們與AI的界線

2023/03/15閱讀時間約 5 分鐘
Oliver Hale on Unsplash
這篇文放草稿太久了,放到連GPT4都生出來了。不過沒差,內容通用。
系列文第一篇,就提到了GPT框架中有對人類語意回饋的學習機制。這機制有個專有名詞,叫強化學習 (Reinforcement Learning)。這讓機器不純粹依著既有資料模式,優化並生成預測;反而讓機器有更強的能力,去因應不同環境﹝狀態﹞,作出最優的選擇與回應 ﹝在GPT案例,被獎勵的目標,是作出和人類對語意理解相似的文字生成﹞。
不過仔細想想,他還是面對著正確性﹝這個詞並不準確,暫想不到別的﹞和即時性的問題。關於正確性問題,畢竟ChatGPT最為擅長的,是文字接龍,其模型強化學習標的──例如怎樣才是好的回答──是由人類提供的樣本與標註 (label) 而來;其目標並不是做出最正確的回答。
例如,我上次詢問他是否知道我在某個網路媒體寫過文章。他非但說自己知道,而且還說我是知名的經濟學家和前財政部長──唉!我差點就信了。
而關於時效性問題,當前所使用的訓練數據只到2021年,也就是說其後的事情,要不是不知道,要不就亂回答。

當通才變成專家

然而,ChatGPT本身還是很堪用,除前面提到的生產力用途,模型的微調﹝fine tune﹞也是重點。目的主要是讓GPT模型,成為特定領域之專家。目前大家都有概念,他是一個大語料基底的通用模型,但相對地,也意味著在特定領域則未必那麼專擅。
舉例來說,或許GPT熟知蜂蜜這個東西──他能回答蜂蜜是什麼,有甚麼種類。但他可能沒有蜂農來的專業,因為蜂農還知道蜂蜜的前期、中期和後期的風味差異、商業價值和成本結構;且或許能具體推薦消費者適合的茶飲搭配。
所以這fine tune可以讓我們透過小量的資料,讓GPT更像某個專家。這算是我認為有意義的東西。試想,可能不只蜂農,也許他也可以被微調成一個深諳自家公司運作和產品的小客服,或者某位很有策略頭腦的商業顧問。
客服或許不難想像,不過關於顧問,我還保持一個開放與想像的空間。畢竟為不同商業問題做分析和策略規劃,背後的邏輯和所需資訊連結度似乎還更高﹝我認為是很高創意、高度應環境和人情而異的互動﹞。
而且做為一個顧問,他或許還需要透過提問,來獲取資訊,挖掘洞見或是重新定義問題。
而且更進一步想,如果這樣的顧問模型要存在,我不禁懷疑只使用語料訓練夠嗎?用什麼語料訓練才對?用什麼訓練/互動機制來持續增進資料完整度呢?

資料面的突破

考慮一個語料模型的訓練,我們需要語料。而我們確實有很多方式,可以收集一個人的生活與思想的側面資訊﹝訪談、錄音、寫作等﹞,也有豐富的工具能將之轉換為語料。
但不論如何,很明顯人類文字是有限的。你講這個東西的同時,你講不了另外一個東西。你說這是圓的,他就不是方的。但事物的狀態,卻經常是介在我們的語彙之間的模糊地帶。所以,光是訓練素材的選擇,就還存有諸多讓AI強大的可能性。

我們與AI的界線

因此我們可以預見,我們會需要不同的sensor,大量儲存空間,更快的網速還有更強的運算力。這一切,要用以收集和處理如聲音和影像等,與「人」有關的資訊。之後再更多生活應用層面上,AI跟人的界線又模糊一些。
不過說再多,還是回到經典老問題:AI會取代人類嗎?我感覺該換個方向想。假如我們最在意飯碗,那我更好奇AI能取代/加速我工作的哪一部分。這樣思考,才將真正與技術共存,將冗餘費時的事項用機器處理掉。
我本職是資料科學家,我也像GPT的開發者一樣,在訓練一些模型。工作內容為處理資料,然後訓練出可用來預測未來的模型。嗯,這聽起來不會被AI取代,但實際上卻有可能。
不用AI,現存很多自動化套件/方案,就可以讓開發者產製出大量模型,我們只需要考慮刪減和整合模型們。況且現在訓練模型所用的程式,又非常好入門!簡單幾行,就能產出模型。
那這樣,這份工作的意義又在哪裡呢?
是觀察和思考。
理想的資料科學家 ﹝至少我們Team有共識的那種理想﹞,是會明白他手上資料的特性,也知道他工具﹝模型﹞本身的特質與優劣。綜合對資料和工具的理解,可以對資料一定程度的處理,進一步提升預測。
有點抽象,用自己當例子。我曾在工作中發現一個機器學習演算法G模型,吃入某些金融變數去做預測,效果特別好。於是我把所用的變數數量降到極低 ﹝只有同事的10分之1﹞,專注在特定幾類金融數據,並且把資料強制扭轉成常態分布,結果預測效果優異且穩定。
總之是:﹝1﹞我發現一個工具的特質,﹝2﹞用一些技巧把資料轉換成模型喜歡的樣子。如果要靠機器發現,得花不少工,更別說是機器自己產生此類洞見。
事實上,很可能因為G模型太有個性,不好訓練,早早就成遺珠。
如果真仰賴AI,或某種高度自動化的技術。我們洞見是最重要的。因為我們腦中有的資訊量不會差,天外飛來一筆的想法也很珍貴。因為強大的演算力不會成就創意,洞見不是根據「什麼想法是最優化」而產生的。
但我明白,都有我們對AI浪潮有著不可掌控的隱憂。自己成長速度不足、發揮空間變少等等。我想,這又是另外的故事了。
Darren
Darren
資料科學家,專攻機器學習與金融商品價格預測,英國學術機構 CORMSIS (作業研究與管理科學中心) & 運籌學會 (Operational Research Society) 的成員。以前是幾個自媒體的專欄作家,文章曾見於關鍵評論網、口袋財經、科技報橘等。喜歡寫一些技術、科技、人文社會的觀察。
留言0
查看全部
發表第一個留言支持創作者!