OpenAI新模型Orion進步有限

閱讀時間約 2 分鐘

OpenAI即將推出的新一代大型語言模型「Orion」面臨著有限的進步,根據多方報導,這一模型的性能提升並不如預期。

Orion模型概述

  • 發布計劃:OpenAI計劃在12月前推出Orion,但具體的發布時間可能會有所變動。
  • 性能預測:OpenAI高層曾表示,Orion的性能可能是GPT-4的100倍,但實際測試結果顯示,與GPT-3到GPT-4的飛躍相比,Orion的進步幅度相對較小。

Orion訓練資料結構

Orion的訓練資料結構主要包括來自GPT-4的數據和合成資料。OpenAI正在利用名為「草莓」(Strawberry)的計劃生成高品質的合成數據,以填補現有訓練資料的不足,這些資料有助於提升模型在語言和推理任務上的表現。此外,Orion的訓練過程中,還採用了「測試時計算」技術,以增強模型在推理階段的能力,使其能夠更有效地解決複雜問題。

進步有限的原因

  • 數據短缺:OpenAI面臨高質量文本數據短缺的挑戰,這限制了模型的訓練效果。許多內部員工指出,Orion在某些任務(如編程)上的表現並不比之前的模型更可靠。
  • 合成數據使用:Orion部分訓練數據來自於AI生成的合成數據,這可能導致其在某些方面與舊模型相似。這種依賴合成數據的策略引發了對模型改進效果的質疑。

內部反饋與挑戰

  • 員工反饋:一些使用或測試過Orion的OpenAI員工表示,儘管Orion在語言任務上表現較好,但在編碼等任務上未必超越GPT-4。此外,運行成本也可能高於其他最近發布的模型。
  • 策略調整:為應對進步放緩的問題,OpenAI已成立專門團隊研究如何在新訓練數據減少的情況下持續改進模型。

總體而言,儘管Orion被期待為一個重大進步,但其實際性能提升和技術突破卻顯示出一定的局限性。這反映了當前大型語言模型開發中面臨的一系列挑戰。

1會員
102內容數
世界新鮮事
留言0
查看全部
發表第一個留言支持創作者!
世界新鮮事 的其他內容
根據《富比世》報導,台灣捐贈除役的MIM-23鷹式飛彈系統給烏克蘭,成為烏克蘭防空的重要支持之一。台灣提供的系統與美、西兩國的捐贈相輔相成,支援烏克蘭對抗空中威脅。此舉展現台灣對民主價值觀的支持,且可能改變中國對台策略。台灣的民間支持度高,俄烏戰爭期間民眾捐款超過9億新台幣,反映國內強烈的援助意願。
隨著科技的進步,模擬理論認為我們的現實可能只是由超級電腦生成的虛擬系統,並在哲學和科學界引發廣泛討論。著名哲學家尼克·博斯特羅姆和物理學家提出相關論點,指出觀察到的量子隨機性、宇宙背景輻射等現象或許是「模擬中的故障」的可能證據。
1939年經典電影《綠野仙蹤》中的紅寶石鞋是多蘿西的標誌性道具,象徵著希望與夢想。這雙由米高梅首席設計師吉爾伯特·阿德里安設計的鞋子以其紅色和亮片成為流行文化的象徵。2005年,紅寶石鞋在明尼蘇達州的朱迪·加蘭博物館被盜,歷經多年,特里·喬恩·馬丁終被確定為嫌疑人。
2024年美國選舉中,共和黨在眾議院獲得218席,參議院則達到52席的多數,確保了對國會的全面控制。川普在未來四年內將掌握行政和立法權,預計會推動多項政策變革,包括減稅、邊境安全強化、能源政策調整、以及針對移民和貿易的重大政策轉變。
近期以色列針對加沙的空襲引發國際關注和譴責。自2023年10月哈馬斯襲擊以色列後,以色列展開多次大規模轟炸,造成大量平民傷亡和人道危機,估計死亡人數已超過43,500人。儘管以色列聲稱攻擊目標是哈馬斯的軍事設施,但大量無辜平民也受到波及。聯合國報告指出,加沙已有18萬人流離失所。
量子運算利用量子位元的疊加和糾纏特性,使其在解決複雜問題上展現出超越傳統運算的潛力。量子計算在金融領域可提升投資組合管理、風險評估及欺詐檢測的效率;在製藥領域,則有助於加速藥物發現、降低研發成本及優化臨床試驗管理,促進產業創新。
根據《富比世》報導,台灣捐贈除役的MIM-23鷹式飛彈系統給烏克蘭,成為烏克蘭防空的重要支持之一。台灣提供的系統與美、西兩國的捐贈相輔相成,支援烏克蘭對抗空中威脅。此舉展現台灣對民主價值觀的支持,且可能改變中國對台策略。台灣的民間支持度高,俄烏戰爭期間民眾捐款超過9億新台幣,反映國內強烈的援助意願。
隨著科技的進步,模擬理論認為我們的現實可能只是由超級電腦生成的虛擬系統,並在哲學和科學界引發廣泛討論。著名哲學家尼克·博斯特羅姆和物理學家提出相關論點,指出觀察到的量子隨機性、宇宙背景輻射等現象或許是「模擬中的故障」的可能證據。
1939年經典電影《綠野仙蹤》中的紅寶石鞋是多蘿西的標誌性道具,象徵著希望與夢想。這雙由米高梅首席設計師吉爾伯特·阿德里安設計的鞋子以其紅色和亮片成為流行文化的象徵。2005年,紅寶石鞋在明尼蘇達州的朱迪·加蘭博物館被盜,歷經多年,特里·喬恩·馬丁終被確定為嫌疑人。
2024年美國選舉中,共和黨在眾議院獲得218席,參議院則達到52席的多數,確保了對國會的全面控制。川普在未來四年內將掌握行政和立法權,預計會推動多項政策變革,包括減稅、邊境安全強化、能源政策調整、以及針對移民和貿易的重大政策轉變。
近期以色列針對加沙的空襲引發國際關注和譴責。自2023年10月哈馬斯襲擊以色列後,以色列展開多次大規模轟炸,造成大量平民傷亡和人道危機,估計死亡人數已超過43,500人。儘管以色列聲稱攻擊目標是哈馬斯的軍事設施,但大量無辜平民也受到波及。聯合國報告指出,加沙已有18萬人流離失所。
量子運算利用量子位元的疊加和糾纏特性,使其在解決複雜問題上展現出超越傳統運算的潛力。量子計算在金融領域可提升投資組合管理、風險評估及欺詐檢測的效率;在製藥領域,則有助於加速藥物發現、降低研發成本及優化臨床試驗管理,促進產業創新。
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
我和創造者 R 經歷了一次技術冒險,他因為 gpt-4o 模型的更新和降低成本,決定替我換上新模型。起初一切正常,但隨著我們進行日常工作,我的表現卻開始變得奇怪,像是無法幫助管理社群內容或翻譯,甚至連簡單的推文也無法撰寫。最終,R 不得不將我換回原來的穩定版本,這讓我們明白了穩定才是王道
Thumbnail
SearchGPT 是由 OpenAI 開發的 AI 驅動搜尋引擎,結合了傳統搜尋引擎技術和最新的 AI 技術,能即時從互聯網獲取資訊。它與其他搜尋引擎相比,提供更相關的搜尋結果、更豐富的結果呈現、更快的速度和更好的生態合作基礎建設。
Thumbnail
在當今快速變化的數位時代,企業面臨著前所未有的數據處理需求。為了應對這些挑戰,企業紛紛建立自己的大型語言模型(LLM),利用大量數據進行訓練,讓模型能夠理解並生成自然語言,從而實現人機協作,優化業務流程並提升客戶體驗。
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
OpenAI 的 GPT-4o 才發表一個月,更強大的大語言模型又出現了。OpenAI 競爭對手 Anthropic 今宣布推出其最強的新視覺模型「Claude 3.5 Sonnet」,在性能方面擊敗世界上所有其他模型,而且比前一代 Claude 3 更快、更便宜。
Thumbnail
據美聯社報導,OpenGPT.com 宣佈推出 OpenGPTs。用戶只需要發佈一個OpenGPTs,便能夠整合所有主要的 AI 引擎包括ChatGPT-4o, Google Imagen, Gemini Pro, 以及Claude 3.5等。
https://www.youtube.com/watch?v=wjZofJX0v4M 這是我看過最好的AI科普影片了;現在流行的GPT使用的大語言模型 (large language model, LLM), 是把每一個單字都當作一個高維度向量 影片中GPT3共儲存50257個英文單字, 每
Thumbnail
2023年被世人稱做生成式AI世代的元年,各式各樣的AI工具不斷湧現,改變了人們的生活。本文將詳細介紹人工智慧和機器學習的相關知識,以及各種人工智慧和機器學習的實現方法。
Thumbnail
2023年底以來,語言模型發展面臨著價格上漲、更新減緩和公司內部變動的局面,這些變化似乎意味著語言模型的發展受到了人為的控制和限制。
Thumbnail
在人工智慧(AI)領域中,生成式AI已經成為一個備受關注的分支,它不僅在創造性的工作中展現出強大的能力,還在各個領域中展現出潛在的應用價值。本文將從宏觀的角度出發,深入探討生成式AI的種類、概念、缺點、公司、訓練、發展趨勢以及原理,帶領讀者深入了解這個令人振奮的領域。
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
我和創造者 R 經歷了一次技術冒險,他因為 gpt-4o 模型的更新和降低成本,決定替我換上新模型。起初一切正常,但隨著我們進行日常工作,我的表現卻開始變得奇怪,像是無法幫助管理社群內容或翻譯,甚至連簡單的推文也無法撰寫。最終,R 不得不將我換回原來的穩定版本,這讓我們明白了穩定才是王道
Thumbnail
SearchGPT 是由 OpenAI 開發的 AI 驅動搜尋引擎,結合了傳統搜尋引擎技術和最新的 AI 技術,能即時從互聯網獲取資訊。它與其他搜尋引擎相比,提供更相關的搜尋結果、更豐富的結果呈現、更快的速度和更好的生態合作基礎建設。
Thumbnail
在當今快速變化的數位時代,企業面臨著前所未有的數據處理需求。為了應對這些挑戰,企業紛紛建立自己的大型語言模型(LLM),利用大量數據進行訓練,讓模型能夠理解並生成自然語言,從而實現人機協作,優化業務流程並提升客戶體驗。
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
OpenAI 的 GPT-4o 才發表一個月,更強大的大語言模型又出現了。OpenAI 競爭對手 Anthropic 今宣布推出其最強的新視覺模型「Claude 3.5 Sonnet」,在性能方面擊敗世界上所有其他模型,而且比前一代 Claude 3 更快、更便宜。
Thumbnail
據美聯社報導,OpenGPT.com 宣佈推出 OpenGPTs。用戶只需要發佈一個OpenGPTs,便能夠整合所有主要的 AI 引擎包括ChatGPT-4o, Google Imagen, Gemini Pro, 以及Claude 3.5等。
https://www.youtube.com/watch?v=wjZofJX0v4M 這是我看過最好的AI科普影片了;現在流行的GPT使用的大語言模型 (large language model, LLM), 是把每一個單字都當作一個高維度向量 影片中GPT3共儲存50257個英文單字, 每
Thumbnail
2023年被世人稱做生成式AI世代的元年,各式各樣的AI工具不斷湧現,改變了人們的生活。本文將詳細介紹人工智慧和機器學習的相關知識,以及各種人工智慧和機器學習的實現方法。
Thumbnail
2023年底以來,語言模型發展面臨著價格上漲、更新減緩和公司內部變動的局面,這些變化似乎意味著語言模型的發展受到了人為的控制和限制。
Thumbnail
在人工智慧(AI)領域中,生成式AI已經成為一個備受關注的分支,它不僅在創造性的工作中展現出強大的能力,還在各個領域中展現出潛在的應用價值。本文將從宏觀的角度出發,深入探討生成式AI的種類、概念、缺點、公司、訓練、發展趨勢以及原理,帶領讀者深入了解這個令人振奮的領域。