OpenAI推出「Deep Research」:與DeepSeek-R1相比,能力再上一層樓?

更新於 發佈於 閱讀時間約 4 分鐘

OpenAI在今天馬不停蹄地又推出了一款名為「Deep Research」的工具,專為複雜的多步驟研究任務而設計:

  • Deep Research能夠通過網路瀏覽、解讀和整合資訊,使用經過最佳化的o3模型進行網路瀏覽和數據分析。它可以在5至30分鐘內完成人類可能需要數分鐘到數天的研究任務。
  • 該功能主打的目標族群可能面向金融、科學、政策和工程等知識密集型領域的專業人士,以及針對需要進行汽車或家電等消費決策的消費者,畢竟挑選家電可是一件很費工夫的事情。
  • Deep Research目前暫時僅限ChatGPT Pro用戶使用,每月100次查詢。OpenAI計劃未來擴大至其他用戶。
  • Deep Research在最近熱門的測試項目「人類最後考試(Humanity's Last Exam)」基準測試中得分26.6%,在各學術領域的專家級問題上表現優異,是現階段競爭對手的兩倍。但也承認目前依然存在侷限性,可能出現「幻覺」、生成不正確資訊、難以區分可靠來源以及報告格式問題。
  • OpenAI也計劃在後續增加嵌入圖像、數據可視化和連結專業領域資訊等功能。




我們也試著將 OpenAI「Deep Research」與DeepSeek-R1在網路搜尋任務中的表現結果來做個比較:

  • OpenAI「Deep Research」:專為網路搜尋任務而設計,能瀏覽、解讀和總結網路內容。包括處理可能涉及多個來源的複雜查詢、資訊整合和報告生成。其性能針對專業和消費者研究需求,注重準確性和深度。
  • DeepSeek-R1:雖然不是專門的網路搜尋任務工具,但其推理能力也可應用於研究任務。模型的開源性質和推理基準表現如果進行微調或整合到網路搜尋結果的分析中,可能具有相當程度的適用性,目前已有多個單位在嘗試使用不同方式將DeepSeek-R1整合到網路搜尋任務中,感覺仍然未來可期。
  • 成本和可訪問性
    • OpenAI「Deep Research」:僅對ChatGPT Pro用戶開放,設有每月查詢限制,採用更受控的高級服務模式。
    • DeepSeek-R1:在API使用成本上較OpenAI的o1模型低90-95%,開源性質意味著更廣泛的可訪問性和社區驅動的潛在增強。

以上就網路搜尋任務來說,OpenAI的「Deep Research」具有針對網路瀏覽和報告生成功能,可能有較好的表現結果,只是目前僅對ChatGPT Pro用戶開放,並設有每月查詢限制,相對不方便。而DeepSeek R1的優勢在於其推理能力有整合到網路搜尋系統的潛力及相對便宜的使用成本,端看個人的選擇取向。



以下提供OpenAI影片連結,有興趣深入了解的朋友可以自行觀看:

https://www.youtube.com/watch?v=YkCDVn3_wiw




我是TN科技筆記,如果喜歡這篇文章,歡迎留言或轉發給朋友給我支持鼓勵!!



大家好,我是TN,喜歡分享科技領域相關資訊,希望各位不吝支持與交流!
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
還記得一顆衛星讓美國徹底驚醒的史普尼克時刻,以及隨之而來的太空競賽嗎?2025年,AI 界似乎正在上演類似的劇情:當 DeepSeek 展現實力,OpenAI 不只強勢反擊,更首次向免費用戶開放高階功能。這場驚人相似的歷史重演,似乎暗示背後的AI大戰已經悄悄開始了! 史普尼克1號(Spu
中國新創公司DeepSeek推出的DeepSeek-R1模型,以更少的運算資源達到與OpenAI的o1模型相同的效能,引發科技界震盪。但細心的投資者發現,這可能不是末日,而是新機會的開始!傑文斯悖論似乎提示了AI 效率提升背後隱藏的市場擴張機會。
Trump政府啟動5000億美元的「星際之門計劃」旨在建設頂尖AI基礎設施,卻引發Elon Musk對OpenAI的質疑,與Sam Altman隔空論戰。
還記得一顆衛星讓美國徹底驚醒的史普尼克時刻,以及隨之而來的太空競賽嗎?2025年,AI 界似乎正在上演類似的劇情:當 DeepSeek 展現實力,OpenAI 不只強勢反擊,更首次向免費用戶開放高階功能。這場驚人相似的歷史重演,似乎暗示背後的AI大戰已經悄悄開始了! 史普尼克1號(Spu
中國新創公司DeepSeek推出的DeepSeek-R1模型,以更少的運算資源達到與OpenAI的o1模型相同的效能,引發科技界震盪。但細心的投資者發現,這可能不是末日,而是新機會的開始!傑文斯悖論似乎提示了AI 效率提升背後隱藏的市場擴張機會。
Trump政府啟動5000億美元的「星際之門計劃」旨在建設頂尖AI基礎設施,卻引發Elon Musk對OpenAI的質疑,與Sam Altman隔空論戰。
本篇參與的主題活動
身為一名提倡讀萬卷書同行萬里路一樣重要的格友,以往於外出時總是習慣隨身攜帶幾本書,一來是出於自勉的心理,期待自己能把握住空檔閱讀,再者是出於喜歡換口味的閱讀風格,讀累了、換個內容又可以繼續投身於書海;隨著年齡的增長與體力的衰退,逐漸變得討厭攜帶重物,當然這些都是藉口,抱著「上網動動手指查詢、chat
這篇超完整的7天6夜北越自由行攻略,涵蓋河內、下龍灣、陸龍灣精華景點、美食與特色活動,提供行前準備、Google地圖懶人包、詳細行程規劃、總花費及購票連結,讓你輕鬆規劃深度北越之旅!
大家好~我是蘆薈,歡迎來到我的方格子! 之前在 Threads 上分享過如何利用網路資源自學鉤針,因為有字數限制,所以只能概略說明。從這篇開始,我會陸續推出一系列詳細文章,帶大家一起進入鉤針的世界! 毛線挑選重點 鉤針挑選重點
其實女生大概都喜歡風格時尚之類的,只是從一個專注練琴關在琴房的書呆子到磨練出自己適合的風格和造型,漸漸的發現每一件事情要從無到有慢慢地在每一次演每一次活動的紀錄之中,慢慢地修改找尋適合自己的風格,也是個人內在的形塑、氣質、每一個單品透露出用品本人的性格,都在無形的地方,慢慢的成為人生的一部分
身為一名提倡讀萬卷書同行萬里路一樣重要的格友,以往於外出時總是習慣隨身攜帶幾本書,一來是出於自勉的心理,期待自己能把握住空檔閱讀,再者是出於喜歡換口味的閱讀風格,讀累了、換個內容又可以繼續投身於書海;隨著年齡的增長與體力的衰退,逐漸變得討厭攜帶重物,當然這些都是藉口,抱著「上網動動手指查詢、chat
這篇超完整的7天6夜北越自由行攻略,涵蓋河內、下龍灣、陸龍灣精華景點、美食與特色活動,提供行前準備、Google地圖懶人包、詳細行程規劃、總花費及購票連結,讓你輕鬆規劃深度北越之旅!
大家好~我是蘆薈,歡迎來到我的方格子! 之前在 Threads 上分享過如何利用網路資源自學鉤針,因為有字數限制,所以只能概略說明。從這篇開始,我會陸續推出一系列詳細文章,帶大家一起進入鉤針的世界! 毛線挑選重點 鉤針挑選重點
其實女生大概都喜歡風格時尚之類的,只是從一個專注練琴關在琴房的書呆子到磨練出自己適合的風格和造型,漸漸的發現每一件事情要從無到有慢慢地在每一次演每一次活動的紀錄之中,慢慢地修改找尋適合自己的風格,也是個人內在的形塑、氣質、每一個單品透露出用品本人的性格,都在無形的地方,慢慢的成為人生的一部分
你可能也想看
Google News 追蹤
Thumbnail
/ 大家現在出門買東西還會帶錢包嗎 鴨鴨發現自己好像快一個禮拜沒帶錢包出門 還是可以天天買滿買好回家(? 因此為了記錄手機消費跟各種紅利優惠 鴨鴨都會特別注意銀行的App好不好用! 像是介面設計就是會很在意的地方 很多銀行通常會為了要滿足不同客群 會推出很多App讓使用者下載 每次
Thumbnail
SearchGPT 是由 OpenAI 開發的 AI 驅動搜尋引擎,結合了傳統搜尋引擎技術和最新的 AI 技術,能即時從互聯網獲取資訊。它與其他搜尋引擎相比,提供更相關的搜尋結果、更豐富的結果呈現、更快的速度和更好的生態合作基礎建設。
Thumbnail
數據分析與解讀 隨著數據的爆炸式增長,能夠分析、解讀和應用數據的能力變得至關重要。這包括熟悉數據分析工具和技術,如統計學、數據挖掘、機器學習等。然而,僅靠短時間的數據分析並不足以提供深入見解。 要熟悉數據分析工具和技術,如統計學、數據挖掘和機器學習,可以從以下幾個方面入手: 基礎知識的學習
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
本文介紹了AI科研文獻管理工具,包括Connected Papers、EasyScholar、Research Rabbit、ReadPaper、立理 LitLit、海鯨AI學術、pdftopdf.ai等。這些工具能幫助科研人員實現高效的文獻管理和利用文獻資源,並提高科研工作的效率和質量。
Thumbnail
據美聯社報導,OpenGPT.com 宣佈推出 OpenGPTs。用戶只需要發佈一個OpenGPTs,便能夠整合所有主要的 AI 引擎包括ChatGPT-4o, Google Imagen, Gemini Pro, 以及Claude 3.5等。
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
這篇文章介紹瞭如何利用AI論文工具來提高研究生的論文閱讀效率以及寫作效率。透過Connected Papers、Scispace和Immersive Translate等AI工具,可以進行文獻回顧、段落摘要生成、Paraphrasing、APA格式生成以及論文對照翻譯
Thumbnail
透過先進的技術將繁複的書籍內容轉換成精煉的摘要。這不僅是對當前技術進步的展現,也象徵著未來人工智慧與人類知識互動的無限可能性。
Thumbnail
在 AI 研究的領域中,理解和解釋語言模型如何處理和回應特定輸入始終是一項巨大挑戰。這種復雜性不僅限於模型的規模和結構,還涉及到它們如何在內部做出決策。為了應對這一挑戰,OpenAI 推出了一款名為 Transformer Debugger (TDB) 的工具,旨在深入探索小型語言模型的行為
Thumbnail
OpenAI成立於2015年,旨在以非盈利方式促進AI發展,並避免潛在危害。從GPT-1到GPT-4的發展過程展現了AI無監督學習及多任務學習的潛力。這篇文章回顧了OpenAI在自然語言處理方面的歷程與技術演進,並介紹了各個模型樣本和能力的提升。
Thumbnail
/ 大家現在出門買東西還會帶錢包嗎 鴨鴨發現自己好像快一個禮拜沒帶錢包出門 還是可以天天買滿買好回家(? 因此為了記錄手機消費跟各種紅利優惠 鴨鴨都會特別注意銀行的App好不好用! 像是介面設計就是會很在意的地方 很多銀行通常會為了要滿足不同客群 會推出很多App讓使用者下載 每次
Thumbnail
SearchGPT 是由 OpenAI 開發的 AI 驅動搜尋引擎,結合了傳統搜尋引擎技術和最新的 AI 技術,能即時從互聯網獲取資訊。它與其他搜尋引擎相比,提供更相關的搜尋結果、更豐富的結果呈現、更快的速度和更好的生態合作基礎建設。
Thumbnail
數據分析與解讀 隨著數據的爆炸式增長,能夠分析、解讀和應用數據的能力變得至關重要。這包括熟悉數據分析工具和技術,如統計學、數據挖掘、機器學習等。然而,僅靠短時間的數據分析並不足以提供深入見解。 要熟悉數據分析工具和技術,如統計學、數據挖掘和機器學習,可以從以下幾個方面入手: 基礎知識的學習
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
本文介紹了AI科研文獻管理工具,包括Connected Papers、EasyScholar、Research Rabbit、ReadPaper、立理 LitLit、海鯨AI學術、pdftopdf.ai等。這些工具能幫助科研人員實現高效的文獻管理和利用文獻資源,並提高科研工作的效率和質量。
Thumbnail
據美聯社報導,OpenGPT.com 宣佈推出 OpenGPTs。用戶只需要發佈一個OpenGPTs,便能夠整合所有主要的 AI 引擎包括ChatGPT-4o, Google Imagen, Gemini Pro, 以及Claude 3.5等。
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
這篇文章介紹瞭如何利用AI論文工具來提高研究生的論文閱讀效率以及寫作效率。透過Connected Papers、Scispace和Immersive Translate等AI工具,可以進行文獻回顧、段落摘要生成、Paraphrasing、APA格式生成以及論文對照翻譯
Thumbnail
透過先進的技術將繁複的書籍內容轉換成精煉的摘要。這不僅是對當前技術進步的展現,也象徵著未來人工智慧與人類知識互動的無限可能性。
Thumbnail
在 AI 研究的領域中,理解和解釋語言模型如何處理和回應特定輸入始終是一項巨大挑戰。這種復雜性不僅限於模型的規模和結構,還涉及到它們如何在內部做出決策。為了應對這一挑戰,OpenAI 推出了一款名為 Transformer Debugger (TDB) 的工具,旨在深入探索小型語言模型的行為
Thumbnail
OpenAI成立於2015年,旨在以非盈利方式促進AI發展,並避免潛在危害。從GPT-1到GPT-4的發展過程展現了AI無監督學習及多任務學習的潛力。這篇文章回顧了OpenAI在自然語言處理方面的歷程與技術演進,並介紹了各個模型樣本和能力的提升。