AI 憑什麼這麼強 (二):未來兩個方向的改進,讓 AI 變更強大

更新於 發佈於 閱讀時間約 5 分鐘


raw-image

正文1,724字,主要跟你分享未來 AI 變更強更效率的兩個層面──數據與模型框架。你會從實務者的觀點,知道數據跟 AI (或機器學習模型) 表現間的關係;了解 ChatGPT 為什麼有運算資源的困擾;同時,你也會看到目前最新改善 AI 運算速度的技術發表。

正文開始

系列文的前一篇,我們提及了「湧現」,這是一種隨著模型參數變高 (複雜度變高),機器產生了一些人們難以理解的神奇表現。

湧現的出現,與模型的參數息息相關。這也驅使我們思考,要打造一個這麼強的智能,非得把東西搞的這麼複雜不可嗎?


更短小精幹的數據,打造出更強的 AI?

應該不用,這可以從兩個方面著手,首先是數據層面。研究者發現,有的語言模型參數量和訓練運算量更低,卻在諸多任務上表現,比大型模型要來的好。這也暗示著只要有一定品質的數據,模型確實可能「以小搏大」。

雖然此些研究並未提及所使用的數據細節,或量化「資料品質」這個概念,我以個人的經驗來分享一下──儘管是不同的研發任務。我的主戰場在財務金融,預測的目標是金融資產的價格。

我們知道金融資產經常受總體經濟、政策、突發事故以及供需基本面影響,可是價格在特定時間內,不會被這些因素同時影響,有時候政策影響大,有時候是供需問題影響。

所以,假如我想建立一個大型預測模型,也就是使用大量資料與變數,去建立模型做預測。你們猜效果會如何?答案是基本上挺爛的。因為能把過去解釋的很好的模型,不一定能預測現在。眼前當下可能是匯率影響最大,但你模型還有其他變數正在打亂「專注力」,以至於模型真正實戰時,反而不知道誰輕誰重。

因此在這種變化多端的環境下,實務上,反而是打造很多小模型,他們都只吃入有限的領域或特定類型的資料,他們個別也還不差,有的還異常強大,彼此最後加總起來,會比一個大模型更強。


百家爭鳴的框架優化

儘管如此,回到語言模型,科學家還無法完全把以小搏大的功勞,完全歸因於數據的高品質,相對的,模型框架也很重要。白話文說,就是你的模型長什麼樣子,也非常重要。

我最愛的例子就是BERT,在講微調新聞情緒判斷的AI時,我也說過他。

他框架主要是Encoder,一個編碼器,計算文字或各種輸入之間的相似性並賦予權重,將這些被壓縮的數值做轉換,在神經網路層中層層傳遞,並輸出結果。

不懂也沒關係,關鍵是這樣一個東西單獨使用,效果未必佳。很多實測表明框架設計中,如果將Encoder和Decoder (與Encoder相對,意為解碼) 一同使用,其效果更佳。這東西就是因著ChatGPT而火紅的Transformer架構,如今這個酷東西,大家都能說上兩句。

這個例子說明了,模型的設計,會根本地影響表現。

也因此,湧現伴隨而來的,技術上是人們對大模型的反思,不一定需要更多數據,框架的優化也扮演重要腳色。

前一陣子,可能將近一個月前,還有人疑問或質疑,OpenAI是不是在開發GPT-5。這猜測旋即被創辦人Sam Altman打破。他在訪談中表示,打造新模型並非當務之急,做出巨大模型不是一個好選擇。

的確 OpenAI 不是沒有挑戰,他們面對O(n^2),或二次複雜性問題。也就是說,隨著我們輸入的語料等序列資料長度變長,其運算時間與模型參數也高速成長,因而需要更多運算資源,當然,還有GPU (NVIDIA或恐成為最大贏家)。

當然生成式 AI 玩家們,可能已經注意到,ChatGPT與他的服務,似乎常常 "down" 掉。

這個問題正發生在ChatGPT所使用的技術:Attention機制上,所以改善框架成為了重點項目。接下來我們來吊個書袋。史丹佛大學與相關研究團隊提出了 Heyna 結構,在減少20%的運算(FLOP)之下,達到相近於原始GPT的表現。

而最新也有點意思的進展則是Direct Preference Optimization (DPO),針對ChatGPT 中以 RLHF (基於人類反饋的強化學習) 微調模型這個環節,做出改進。RLHF這類強化學習方案雖然讓AI可以應對多變的環境與對話,但是其穩定度並不如DPO來的好。

技術細節沒辦法多說,就只能在這個小節提一些研究方向。至於什麼方法能真正勝出,我覺得都還遠在未定之天。


小結

總之,框架的改進確實能使資源消耗減少,也未必要刻意追求資料跟參數的擴張。

現在,架構的優化與改進,配上運算資源的提升,AI還會有更進一步的突破。而會是哪個方法突破重圍,哪家廠商、什麼產品會在這個風口浪尖上脫穎而出,值得舉世的技術人跟投資人注目。

系列文未完待續......


留言
avatar-img
留言分享你的想法!
桑的記事本-avatar-img
2023/06/12
AI 真的是探討不完的議題...
avatar-img
Darren的沙龍
14會員
14內容數
大數據意味著什麼?數據科學背後有怎樣的mind set和技術?數據科學家又做些什麼?這些科技/技術,帶給我們什麼生活上和人文上的省思?這個專題會橫跨這些彼此相關的面向,避開生澀的專業詞彙,探索這些事情背後的樣貌。應該會是有趣的知識和想法分享﹝笑﹞
Darren的沙龍的其他內容
2024/08/31
文章主攻四大領域:機率與統計、計量經濟和量化金融分析。以機率統計為核心主幹,詳加說明其精神與應用。也會輔以其餘三個領域的介紹作為統計實例。統計學是AI / 機器學習背後的英雄,假設檢定與統計分布是其兩大特色,前者找出彼此相互關聯的變數;後者則幫助我們進行模擬和抽樣,幫助我們找尋最優解或近似真實值。
Thumbnail
2024/08/31
文章主攻四大領域:機率與統計、計量經濟和量化金融分析。以機率統計為核心主幹,詳加說明其精神與應用。也會輔以其餘三個領域的介紹作為統計實例。統計學是AI / 機器學習背後的英雄,假設檢定與統計分布是其兩大特色,前者找出彼此相互關聯的變數;後者則幫助我們進行模擬和抽樣,幫助我們找尋最優解或近似真實值。
Thumbnail
2024/07/19
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
2024/07/19
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
2024/07/05
本文談及資料科學的領域與分工。首先是建造一個AI的研發流程,資料收集到 AI 模型訓練的過程,AI經歷這一切流程被創造出來並產生價值;再來本文也提及在這個領域中的各種腳色、資料工程師、數據庫工程師、資料科學家和資料分析師的各種介紹。並且強調跨領域合作的重要性。
Thumbnail
2024/07/05
本文談及資料科學的領域與分工。首先是建造一個AI的研發流程,資料收集到 AI 模型訓練的過程,AI經歷這一切流程被創造出來並產生價值;再來本文也提及在這個領域中的各種腳色、資料工程師、數據庫工程師、資料科學家和資料分析師的各種介紹。並且強調跨領域合作的重要性。
Thumbnail
看更多
你可能也想看
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
全球科技產業的焦點,AKA 全村的希望 NVIDIA,於五月底正式發布了他們在今年 2025 第一季的財報 (輝達內部財務年度為 2026 Q1,實際日曆期間為今年二到四月),交出了打敗了市場預期的成績單。然而,在銷售持續高速成長的同時,川普政府加大對於中國的晶片管制......
Thumbnail
AI浪潮 自從去年ChatGPT後,AI這個本來沉寂已久的話題,瞬間火爆全世界,不論是各家各戶開始瘋狂訓練自己的大語言模型與基礎模型,包含法國的Bloom、Meta的LLaMA、AWS的Titan、Google的LaMDA等等,抑或是開始推出自己的生成式AI工具等等,例如Google的Bard、百
Thumbnail
AI浪潮 自從去年ChatGPT後,AI這個本來沉寂已久的話題,瞬間火爆全世界,不論是各家各戶開始瘋狂訓練自己的大語言模型與基礎模型,包含法國的Bloom、Meta的LLaMA、AWS的Titan、Google的LaMDA等等,抑或是開始推出自己的生成式AI工具等等,例如Google的Bard、百
Thumbnail
本文探討大資料對模型的影響。研究指出,大資料量對模型的語法和世界知識理解有顯著影響。固定運算資源下,DeepMind發現適應參數數量更重要,這使模型Chinchilla以較小規模但更多訓練資料,在實際任務中優於Gopher模型。這說明增大模型的規模已不具有太大意義,應增加訓練資料。
Thumbnail
本文探討大資料對模型的影響。研究指出,大資料量對模型的語法和世界知識理解有顯著影響。固定運算資源下,DeepMind發現適應參數數量更重要,這使模型Chinchilla以較小規模但更多訓練資料,在實際任務中優於Gopher模型。這說明增大模型的規模已不具有太大意義,應增加訓練資料。
Thumbnail
正文1,724字,主要跟你分享未來 AI 變更強更效率的兩個層面──數據與模型框架。你會從實務者的觀點,知道數據跟 AI (或機器學習模型) 表現間的關係;了解 ChatGPT 為什麼有運算資源的困擾;同時,你也會看到目前最新改善 AI 運算速度的技術發表。
Thumbnail
正文1,724字,主要跟你分享未來 AI 變更強更效率的兩個層面──數據與模型框架。你會從實務者的觀點,知道數據跟 AI (或機器學習模型) 表現間的關係;了解 ChatGPT 為什麼有運算資源的困擾;同時,你也會看到目前最新改善 AI 運算速度的技術發表。
Thumbnail
[進行中未完成] 1.簡介 本文旨在讓沒有計算機科學背景的人對ChatGPT和類似的人工智能系統 (如GPT-3、GPT-4、Bing Chat、Bard等)有一些了解。 ChatGPT是一種聊天機器人,是建立在大型語言模型之上的對話型人工智能。專業術語可能會讓人感到陌生,但此文將一一解釋這些概念。
Thumbnail
[進行中未完成] 1.簡介 本文旨在讓沒有計算機科學背景的人對ChatGPT和類似的人工智能系統 (如GPT-3、GPT-4、Bing Chat、Bard等)有一些了解。 ChatGPT是一種聊天機器人,是建立在大型語言模型之上的對話型人工智能。專業術語可能會讓人感到陌生,但此文將一一解釋這些概念。
Thumbnail
本文回答幾個問題:(一) 什麼叫做湧現;(二)湧現是什麼現象;(三)為什麼我們造不出自己的超級 AI。看完後,你會理解現在 AI 的現象跟趨勢、一些技術與專有名詞,像是參數、大型機構與他們模型的名字。
Thumbnail
本文回答幾個問題:(一) 什麼叫做湧現;(二)湧現是什麼現象;(三)為什麼我們造不出自己的超級 AI。看完後,你會理解現在 AI 的現象跟趨勢、一些技術與專有名詞,像是參數、大型機構與他們模型的名字。
Thumbnail
這篇文放草稿太久了,放到連GPT4都生出來了。不過沒差,內容通用。 在系列文第一篇,就提到了GPT框架中有對人類語意回饋的學習機制。這機制有個專有名詞,叫強化學習 (Reinforcement Learning)。這讓機器不純粹依著既有資料模式,優化並生成預測;反而讓機器有更強的能力,去因應不同環境
Thumbnail
這篇文放草稿太久了,放到連GPT4都生出來了。不過沒差,內容通用。 在系列文第一篇,就提到了GPT框架中有對人類語意回饋的學習機制。這機制有個專有名詞,叫強化學習 (Reinforcement Learning)。這讓機器不純粹依著既有資料模式,優化並生成預測;反而讓機器有更強的能力,去因應不同環境
Thumbnail
金融科技領域,ChatGPT已逐漸被應用,未來也有可能取代或減少部分金融工作。但ChatGPT 還存在一些挑戰和注意事項,像保障用戶隱私、處理語言歧義等,並無法完全取代金融領域的工作。究竟ChaGPT 是什麼呢?如何發展至今?它將在金融領域帶來什麼機遇與挑戰?想知道更多歡迎看看這篇文章!
Thumbnail
金融科技領域,ChatGPT已逐漸被應用,未來也有可能取代或減少部分金融工作。但ChatGPT 還存在一些挑戰和注意事項,像保障用戶隱私、處理語言歧義等,並無法完全取代金融領域的工作。究竟ChaGPT 是什麼呢?如何發展至今?它將在金融領域帶來什麼機遇與挑戰?想知道更多歡迎看看這篇文章!
Thumbnail
機器人會幫助我們獲得財務自由嗎? 毫無疑問,OpenAI 的 ChatGPT 非常出色! 我喜歡寫有關金融市場的文章,尤其是從數據科學的角度。 不用說,這個人工智能工具對我來說形成了一個很好的交集; 這能滿足我內心的書呆子,同時證明這工具對追求財務自由有價值嗎? 我問了一個非常直率的問題,直接對其進
Thumbnail
機器人會幫助我們獲得財務自由嗎? 毫無疑問,OpenAI 的 ChatGPT 非常出色! 我喜歡寫有關金融市場的文章,尤其是從數據科學的角度。 不用說,這個人工智能工具對我來說形成了一個很好的交集; 這能滿足我內心的書呆子,同時證明這工具對追求財務自由有價值嗎? 我問了一個非常直率的問題,直接對其進
Thumbnail
相信這個大家最近都有看到新聞,就是OepnAI這個基金會提出了一個新的AI模型ChatGPT,這個ChatGPT跟以往的AI模型不太一樣,基本上輸入很多問題都可以獲得解答,而且回答得語氣跟人類很像。 同時這個ChatGPT很厲害的事情,包含可以產出程式、幫助回覆程式問題、產出行銷文案、演講大綱等等,
Thumbnail
相信這個大家最近都有看到新聞,就是OepnAI這個基金會提出了一個新的AI模型ChatGPT,這個ChatGPT跟以往的AI模型不太一樣,基本上輸入很多問題都可以獲得解答,而且回答得語氣跟人類很像。 同時這個ChatGPT很厲害的事情,包含可以產出程式、幫助回覆程式問題、產出行銷文案、演講大綱等等,
Thumbnail
OpenAI發佈免費機器人對話模型ChatGPT(GPT-3.5系列),模型中首次採用RLHF(從人類反饋中強化學習)方式。模型目前處於測試階段,面世一週便已有超過一百萬用户使用。
Thumbnail
OpenAI發佈免費機器人對話模型ChatGPT(GPT-3.5系列),模型中首次採用RLHF(從人類反饋中強化學習)方式。模型目前處於測試階段,面世一週便已有超過一百萬用户使用。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News