GPT-5在昨晚發佈了,我的工作時常會使用ChatGPT幫我蒐集總結研究資訊,今天就打鐵趁熱直接來實測,比較看看GPT-5模型是否有感升級。
首先先來看看OpenAI官方是如何論述GPT-5,OpenAI 說GPT-5是"OpenAI 有史以來最聰明、最快速、最實用的模型”,而且”涵蓋 4o、OpenAI o 系列的推理能力、智慧體與進階數學能力”。現在看LLM模型發表有種在看每年手機發表的既視感,每一次都是更好用、更快、更聰明,不過跟手機的差別是,大多數人現在不會每年升級自己的手機,但LLM模型不一樣,LLM模型升級是可以馬上體驗的。

不廢話馬上開始實測,我最近在研究無人機巡檢這個領域,主要是想看看全球現在發展的情況以及相關的供應鏈、規格、落地案例等等,我請ChatGPT幫我找資料,因為我很注重內容的真實性,4o模型時常會有AI幻覺的問題,所以這類的研究我會用o3模型或是深度研究功能,內容會根據搜尋資料給出統整的回覆,對於研究使用幫助比較大。
這個實測我的詢問是限縮一些條件,要ChatGPT找到對應的案例,這邊我給的條件是: 無人機可飛行30-70公里、使用SDR通訊模組、應用在巡檢的案例。
與前幾天我用o3反覆詢問得到的結果相比,GPT-5竟然找出一個之前都沒有被找到的案例,經過我的確認,GPT提供了3個資料來源都沒問題,分別來自無人機商業網站、無人機廠商、及通訊系統廠商的資料,交叉比對確認3筆資料來源是都是在講同一個案例,顯示GPT-5在推理跟統整的能力有更上一層樓。

我來拆解一下為什麼GPT-5找到PAU的例子而o3沒有找到,以下是GPT-5提供的3個資料來源的大致內容:
- Silvus: Silvus本身是SDR提供廠商,這是一份PDF檔案,內容是類似給公司內部員工的一個成果總結檔案,裡面有提到PAU是Silvus的合作夥伴關係,Silvus提供SDR幫助PAU進行電網巡檢
- 無人機商業網站: 說明PAU使用SwissDrones無人機在美國進行BVLOS巡檢操作,也提到SwissDrones無人機的最大航程可飛行62英里
- SwissDrones: 說明SwissDrones與PAU合作在美國進行BVLOS巡檢操作
資料來源2跟3說明這個案例的真實性,涵蓋PAU、SwissDrones在美國進行BVLOS巡檢的內容,我認為關鍵在資料來源1能夠與資料來源2跟3正確地串在一起,邏輯思考鏈是: PAU跟SwissDrones有BVLOS電網巡檢的方案 > Silvus 是PAU BVLOS電網巡檢的通訊方案提供商 >所以可以判斷出Silvus提供了SDR通訊用於這個無人機電網巡檢的解決方案。
Silvus的PDF檔案也不是Google一下就可以搜尋到的,很多時候人在瀏覽網頁不容易直接找到藏在網站深處的PDF檔案並找到對應需要的資訊,所以過去兩年我很常用各種問法請AI幫我找資料,找PDF或是外文網站的內容AI比人類自己搜尋要快太多了。
整體來說,GPT-5應該是搜尋能力有所提升,同步對於指令的理解,以及統整的能力有所升級,至於這個升級是否有感? 可能要多測試幾個例子才能下結論,我的經驗是之前o3統整的資料有時候會跟資料來源的內容不符合,若GPT-5能夠減少這樣的情況發生,對我來說幫助就很大了。
快速總結
GPT-5初體驗感覺還不錯,有幫助到我更深入最近在研究的主題,推理與整合能力有更強大,另外比較有感的是速度的升級,有時間再來試試看我常用功能的升級程度,包含深度研究、繪圖、自建GPT回覆表現等,也很期待看到各大AI科技大神的實測分享。