AI 工具 | GPT-5登場,快速實測搜尋研究表現,更聰明、更快速嗎?

更新於 發佈於 閱讀時間約 4 分鐘
GPT-5在昨晚發佈了,我的工作時常會使用ChatGPT幫我蒐集總結研究資訊,今天就打鐵趁熱直接來實測,比較看看GPT-5模型是否有感升級。

首先先來看看OpenAI官方是如何論述GPT-5,OpenAI 說GPT-5是"OpenAI 有史以來最聰明、最快速、最實用的模型”,而且”涵蓋 4o、OpenAI o 系列的推理能力、智慧體與進階數學⁠能力”。現在看LLM模型發表有種在看每年手機發表的既視感,每一次都是更好用、更快、更聰明,不過跟手機的差別是,大多數人現在不會每年升級自己的手機,但LLM模型不一樣,LLM模型升級是可以馬上體驗的。

raw-image

不廢話馬上開始實測,我最近在研究無人機巡檢這個領域,主要是想看看全球現在發展的情況以及相關的供應鏈、規格、落地案例等等,我請ChatGPT幫我找資料,因為我很注重內容的真實性,4o模型時常會有AI幻覺的問題,所以這類的研究我會用o3模型或是深度研究功能,內容會根據搜尋資料給出統整的回覆,對於研究使用幫助比較大。

這個實測我的詢問是限縮一些條件,要ChatGPT找到對應的案例,這邊我給的條件是: 無人機可飛行30-70公里、使用SDR通訊模組、應用在巡檢的案例

與前幾天我用o3反覆詢問得到的結果相比,GPT-5竟然找出一個之前都沒有被找到的案例,經過我的確認,GPT提供了3個資料來源都沒問題,分別來自無人機商業網站、無人機廠商、及通訊系統廠商的資料,交叉比對確認3筆資料來源是都是在講同一個案例,顯示GPT-5在推理跟統整的能力有更上一層樓

raw-image

我來拆解一下為什麼GPT-5找到PAU的例子而o3沒有找到,以下是GPT-5提供的3個資料來源的大致內容:

  1. Silvus: Silvus本身是SDR提供廠商,這是一份PDF檔案,內容是類似給公司內部員工的一個成果總結檔案,裡面有提到PAU是Silvus的合作夥伴關係,Silvus提供SDR幫助PAU進行電網巡檢
  2. 無人機商業網站: 說明PAU使用SwissDrones無人機在美國進行BVLOS巡檢操作,也提到SwissDrones無人機的最大航程可飛行62英里
  3. SwissDrones: 說明SwissDrones與PAU合作在美國進行BVLOS巡檢操作

資料來源2跟3說明這個案例的真實性,涵蓋PAU、SwissDrones在美國進行BVLOS巡檢的內容,我認為關鍵在資料來源1能夠與資料來源2跟3正確地串在一起,邏輯思考鏈是: PAU跟SwissDrones有BVLOS電網巡檢的方案 > Silvus 是PAU BVLOS電網巡檢的通訊方案提供商 >所以可以判斷出Silvus提供了SDR通訊用於這個無人機電網巡檢的解決方案。

Silvus的PDF檔案也不是Google一下就可以搜尋到的,很多時候人在瀏覽網頁不容易直接找到藏在網站深處的PDF檔案並找到對應需要的資訊,所以過去兩年我很常用各種問法請AI幫我找資料,找PDF或是外文網站的內容AI比人類自己搜尋要快太多了

整體來說,GPT-5應該是搜尋能力有所提升,同步對於指令的理解,以及統整的能力有所升級,至於這個升級是否有感? 可能要多測試幾個例子才能下結論,我的經驗是之前o3統整的資料有時候會跟資料來源的內容不符合,若GPT-5能夠減少這樣的情況發生,對我來說幫助就很大了。

快速總結

GPT-5初體驗感覺還不錯,有幫助到我更深入最近在研究的主題,推理與整合能力有更強大,另外比較有感的是速度的升級,有時間再來試試看我常用功能的升級程度,包含深度研究、繪圖、自建GPT回覆表現等,也很期待看到各大AI科技大神的實測分享。



留言
avatar-img
留言分享你的想法!
avatar-img
Sally's Journal
0會員
6內容數
業餘AI工具應用探索 | 市場觀察 | 旅遊分享 紀錄值得分享的大小事
你可能也想看
Thumbnail
常常被朋友問「哪裡買的?」嗎?透過蝦皮分潤計畫,把日常購物的分享多加一個步驟,就能轉換成現金回饋。門檻低、申請簡單,特別適合學生與上班族,讓零碎時間也能創造小確幸。
Thumbnail
常常被朋友問「哪裡買的?」嗎?透過蝦皮分潤計畫,把日常購物的分享多加一個步驟,就能轉換成現金回饋。門檻低、申請簡單,特別適合學生與上班族,讓零碎時間也能創造小確幸。
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
嗨!歡迎來到 vocus vocus 方格子是台灣最大的內容創作與知識變現平台,並且計畫持續拓展東南亞等等國際市場。我們致力於打造讓創作者能夠自由發表、累積影響力並獲得實質收益的創作生態圈!「創作至上」是我們的核心價值,我們致力於透過平台功能與服務,賦予創作者更多的可能。 vocus 平台匯聚了
Thumbnail
SearchGPT 是由 OpenAI 開發的 AI 驅動搜尋引擎,結合了傳統搜尋引擎技術和最新的 AI 技術,能即時從互聯網獲取資訊。它與其他搜尋引擎相比,提供更相關的搜尋結果、更豐富的結果呈現、更快的速度和更好的生態合作基礎建設。
Thumbnail
SearchGPT 是由 OpenAI 開發的 AI 驅動搜尋引擎,結合了傳統搜尋引擎技術和最新的 AI 技術,能即時從互聯網獲取資訊。它與其他搜尋引擎相比,提供更相關的搜尋結果、更豐富的結果呈現、更快的速度和更好的生態合作基礎建設。
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
據美聯社報導,OpenGPT.com 宣佈推出 OpenGPTs。用戶只需要發佈一個OpenGPTs,便能夠整合所有主要的 AI 引擎包括ChatGPT-4o, Google Imagen, Gemini Pro, 以及Claude 3.5等。
Thumbnail
據美聯社報導,OpenGPT.com 宣佈推出 OpenGPTs。用戶只需要發佈一個OpenGPTs,便能夠整合所有主要的 AI 引擎包括ChatGPT-4o, Google Imagen, Gemini Pro, 以及Claude 3.5等。
Thumbnail
隨著AI技術的普及,瞭解AI工具的重要性。本文介紹AI工具的應用,分享最新的GPT-4o的功能和優勢,並提出AI與人類智慧相結合的見解。
Thumbnail
隨著AI技術的普及,瞭解AI工具的重要性。本文介紹AI工具的應用,分享最新的GPT-4o的功能和優勢,並提出AI與人類智慧相結合的見解。
Thumbnail
OpenAI最近進行了重大更新,ChatGPT-4o將開放給所有用戶,具備更強的理解力和出色的長文、邏輯能力等功能。新版本增加了上傳圖片的選項,更換模型功能,並進行了功能測試。本文將針對用戶的實際體驗進行測評。
Thumbnail
OpenAI最近進行了重大更新,ChatGPT-4o將開放給所有用戶,具備更強的理解力和出色的長文、邏輯能力等功能。新版本增加了上傳圖片的選項,更換模型功能,並進行了功能測試。本文將針對用戶的實際體驗進行測評。
Thumbnail
OpenAI 春季發布會推出了 GPT-4o 模型,免費且響應速度更快,具備文字、音訊、影像的多模態輸入功能。
Thumbnail
OpenAI 春季發布會推出了 GPT-4o 模型,免費且響應速度更快,具備文字、音訊、影像的多模態輸入功能。
Thumbnail
GPT-4o中的“o”代表“omni”,意思是全能。它能夠在232毫秒內做出回應,幾乎和人類一樣快。這個模型可以即時翻譯、進行視覺推理和自然對話,顯示出它在智能對話、多模態處理和擴展應用場景方面的巨大潛力。
Thumbnail
GPT-4o中的“o”代表“omni”,意思是全能。它能夠在232毫秒內做出回應,幾乎和人類一樣快。這個模型可以即時翻譯、進行視覺推理和自然對話,顯示出它在智能對話、多模態處理和擴展應用場景方面的巨大潛力。
Thumbnail
2024年5月13日,Openai發布了新一代的模組GPT-4o,念法:GPT-four-O。強調即時對話以及圖像解析能力,官方發布的影片中展現了即席英語-義大利語口譯、程式碼解析、算式解析、人臉表情解析,以及幾乎可媲美真人的語音回應,包含調整語氣、用詞以及模仿機器人語音等,相當令人驚豔。
Thumbnail
2024年5月13日,Openai發布了新一代的模組GPT-4o,念法:GPT-four-O。強調即時對話以及圖像解析能力,官方發布的影片中展現了即席英語-義大利語口譯、程式碼解析、算式解析、人臉表情解析,以及幾乎可媲美真人的語音回應,包含調整語氣、用詞以及模仿機器人語音等,相當令人驚豔。
Thumbnail
ChatGPT新模型GPT-4o即將推出,速度更快,並支援處理影片以及多種語言。免費用戶也可以使用ChatBots,而付費版本則限制頻寬並提高至原本的5倍。此外,還將推出ChatGPT桌面應用程式,讓使用者在電腦上進行各項工作時,更輕鬆地使用ChatGPT。
Thumbnail
ChatGPT新模型GPT-4o即將推出,速度更快,並支援處理影片以及多種語言。免費用戶也可以使用ChatBots,而付費版本則限制頻寬並提高至原本的5倍。此外,還將推出ChatGPT桌面應用程式,讓使用者在電腦上進行各項工作時,更輕鬆地使用ChatGPT。
Thumbnail
OpenAI成立於2015年,旨在以非盈利方式促進AI發展,並避免潛在危害。從GPT-1到GPT-4的發展過程展現了AI無監督學習及多任務學習的潛力。這篇文章回顧了OpenAI在自然語言處理方面的歷程與技術演進,並介紹了各個模型樣本和能力的提升。
Thumbnail
OpenAI成立於2015年,旨在以非盈利方式促進AI發展,並避免潛在危害。從GPT-1到GPT-4的發展過程展現了AI無監督學習及多任務學習的潛力。這篇文章回顧了OpenAI在自然語言處理方面的歷程與技術演進,並介紹了各個模型樣本和能力的提升。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News