
OpenAI 與 Instacart 在 ChatGPT 中推出了全新的雜貨購物整合體驗,讓消費者能在對話中構思餐點、生成採買清單,甚至直接完成下單,全程無需離開聊天介面。這個功能延伸自雙方早先的合作基礎;早在兩年多以前,Instacart 便導入由 ChatGPT 支援的Ask Instacart 功能,而現在這項功能是透過 OpenAI Instant Checkout 無縫結帳,而無需離開聊天介面,讓購物者能以自然語言提出菜單規劃或飲食限制相關的詢問。
自從今年10月的OpenAI發表,我就一直對這項發展感到好奇。這類由人工智慧代理協助使用者跨平台採購的能力,已成為 OpenAI 近期的重要策略方向。最近的開發者日也特別強調「應用程式整合至 ChatGPT 內」(ChatGPT with APP) 的願景。
從 OpenAI 10月的發表中,ChatGPT 可以與 Booking.com、Canva、Coursera、Expedia、Figma、Spotify、Zillow 等應用程式互動,而後續也陸續宣布與 Target、Intuit 等企業合作。
OpenAI 的核心理念,是讓使用者在自然語言的對話情境中,動態加入不同的第三方應用程式,使 ChatGPT 以語意理解提供跨工具的操作建議。 ChatGPT 內直接啟用 Canva 製作品牌海報,再要求 Canva 根據海報自動生成簡報內容。
也能透過 ChatGPT 呼叫 Zillow 顯示匹茲堡的待售房屋,並在互動式地圖上進行追問。後續也加入更多應用如 DoorDash、OpenTable、Target、Uber 都將加入OpenAI的生態。
Google 與 Microsoft
相較於 OpenAI 積極拓展第三方應用集成的策略,Microsoft 與 Google 在此領域的動作目前相對保守,核心差異主要來自產品定位與生態策略。
Microsoft 以 Copilot 為核心的工作場景,整合 Microsoft 365 內外(例如 Salesforce, SAP 等)的應用程式;而 Google 的發展路線明顯聚焦於整合自家的產品生態系,例如 Workspace Studio 與 Gemini Agent。 因為 Microsoft 與 Google 比較少生活上的應用,Microsoft 還說的通,畢竟它們主要是面向企業。
Google 的發展重心則落在 Workspace Studio 與 Gemini Agent,專注於整合 Gmail、Drive、Calendar 等自家產品。Workspace 的代理設計主要服務企業工作流程,而非一般消費者的日常生活需求。雖然 Google 有 Google Maps, Youtube。但相較於 OpenAI 的「跨應用操作」,Google 的 Gemini 目前仍較局限在 Google 生態系內。
Google 難以撼動 Microsoft 在企業市場的既有地位,如果能在這一領域結合廣告與資料能力,或許能形成差異化,只是目前仍未形成明顯的產品策略強化。
在我個人的使用經驗上(即便我都只是用免費版),OpenAI 的 ChatGPT 在自然語言互動中的穩定度、語意掌握與對話節奏,仍普遍較為成熟;Google Gemini 偶爾會出現搶拍、語言判斷錯誤或回應不連貫,導致在對話驅動的跨應用場景中較難想像其具備同等能力。
聊天驅動的無邊界作業環境
若未來 AI Agent 的使用情境以「聊天驅動代理」為核心入口,OpenAI 的布局顯然更早、更具體。Google 雖具備強大技術實力,但在日常生活中的跨應用整合想像目前仍較不明顯。Google 確實擁有強大產品,如 Google Maps,也能在未來與 Gemini Agent 深度整合。然而,要在日常聊天中自然觸發跨應用生活需求的代理行為,目前仍較難看到具體產品方向。
這也使得 OpenAI 所描繪的「以對話為中心的無邊界作業環境」更具前瞻性想像。若真的像 Musk 所預言,未來將不再依賴傳統作業系統,而由雲端 AI 所驅動,只有AI入口。
那麼只要是可連網的任何裝置,不論是手機、電腦、家電,甚至是新型態的互動硬體,只要能夠啟動一個聊天介面,就能驅動智慧代理的運作。
OpenAI 在這條路上已展現清晰方向,畢竟我們市井小民誰會成天一直叫 Nano Banana 幫你生圖呢?當然是生活的應用比較實際啊~
Google 當然也具備技術實力,仍有機會成為關鍵玩家的能力,但其產品策略與整合方式目前尚未完全與這個願景對齊。















