理想的AI載具是什麼?

更新於 發佈於 閱讀時間約 4 分鐘
raw-image

這篇文章會跟大家介紹,為什麼我覺得ChatGPT的多模態輸入輸出其實是最重要的一個功能之一,讓AI往成為真正人工智慧代理人的路上前進了一大步,我們也會稍微探討(想像)一下,所謂的理想的AI載具到底應該是怎樣的?

最近的AI新聞仍是非常熱鬧,首先是OpenAI 的Dev Day 登場,宣布了針對ChatGPT的幾個大的更新,包括了升級的GPT4 Turbo, 更長的上下文, 還有眾所矚目的人人都能打造自己的ChatGPT的GPTs. 不過對我來說,最有趣的新聞其實是多模態的ChatGPT。

所謂的多模態是什麼? 多模態(Multimodality)是指利用多種方式或渠道來傳遞信息或進行溝通。在人機交互中,多模態系統能夠同時處理人類的多種感官輸入,如視覺、聽覺、觸覺等,以及多種輸出形式,包括視覺顯示、語音、觸覺反饋等。而套在現在的 GPT4 上面,多模態的ChatGPT則是可以讓我們輸入 圖片/檔案, 讓我們可以直接透過語音跟ChatGPT交談,然後ChatGPT也可以輸出圖片 & 語音(需要透過APP)。透過ChatGPT的Code interpreter 這個功能,你可以讓ChatGPT 幫你分析表格數字,並且自動產出各式各樣的表單或是圖表,而透過Dall-E的功能,則是能夠解放你的想像力,讓AI幫你描繪腦海中的圖片。

為什麼這些功能整合在一個介面很重要呢? 想像一下這就好像你在使用iPhone/Android 手機的時候,很多功能都需要在不同的APP之中切換來切換去,舉例來說我們想要匯款給一個賣家,我們需要從LINE上面把他的匯款帳號剪下來,然後到銀行的APP中貼上做匯款,這是一個摩擦力很大的動作,而有很多優秀的購物APP 如蝦皮/MOMO等等,就會盡力去降低這樣的摩擦力(透過用信用卡/支付/或是把銀行匯款功能整合進來),讓你可以支付的動作一鍵完成,降低你的摩擦力,那麼你就會更容易去使用這個功能,將來買的東西就會更多。

原本的ChatGPT 在處理繪圖的時候,需要特別開啟一個新的交談視窗,而請它分析數據的時候,又需要特別開啟新的交談視窗,請它上網查詢最新資料的時候又需要開一個...然後每個不同的視窗之間,你都需要重新提供整個交談的完整資訊,這就好像你聘請一個真人小秘書,但是交代不同任務的時候,明明是同一件大任務的細項,可是請他寫報告/整理圖表/去查詢市場資訊等等,都需要重頭交代起,應該會讓你很難忍受吧? 這也是為什麼把這些不同形式的輸入輸出整合在一個同樣的介面裡面如此的重要,今天你交代ChatGPT 上網查詢最新的數據資料,並且針對這些資料做整理做出圖表,最後再產生出一幅圖來搭配這些資料,我們不在需要在不同的介面/APP之間做搬運工,而是就像是交代一個真人小秘書一樣,它可自己知道前因後果,前後的資訊,並且一次就幫你處理到位 (當然會需要很多溝通微調就是了)。


raw-image


說到這邊就不得不提另一個很重要的事情,就是ChatGPT的語音介面,交談是一個比起手動打字摩擦力低很多的行動,所有的人類生下來就很自然的學習到了用語言彼此溝通交談,而手寫跟閱讀則是經年累月累積下來的能力,我的預期是,將來完美的智慧語音代理人,就能夠像一個真人一樣自然地跟你交談,並且記住整個交談中的內容,適時的判斷何時該提供你那些資訊。一個完美的人工智慧代理人能夠跟人類一樣,接受到五感帶來的資訊,並且也能夠跟人類一樣透過語言還有聲音來表達。

那麼,透過這樣的發想還有邏輯思考下來? 將來完美的AI的硬體會是怎樣的長相呢? 首先AI要能夠看到你所看到的,所以從這邊來思考,所謂的AR/VR Lens 也就是智慧型眼鏡可能是一個最佳的媒介,畢竟它能夠及時地看到你所看到的,而聽覺的部分就是有麥克風可以聽到你所聽到的,但又要能夠透過耳機/或是AR眼鏡或許開發骨傳導的技術來把聲音即使反饋給你。 最後最後,還是需要一個介面能夠呈現圖片還有文字,這部分就比較多的想像了,長期來說或許AR眼鏡就能夠直接投影出來,但我想短期內可能還是靠著跟手機的搭配是最合適的。 或許一個完美的AI 硬體不是單一的一個硬體,而是類似我們敘述的這樣,一系列能夠搭配人類五感的硬體,你所看見的聽見的,AI都能夠即時看見即時處理,然後又能夠即時的給你反饋。

以上,就是簡短的對於所謂AI硬體的想像,看了很多的網路文章以後,我自己的想法是這樣。這應該會是將來許多科技大公司積極投入(積極實驗?)的方向,畢竟Apple靠著iPhone賺了這麼多錢,所有的科技公司都在積極地尋找下一個iPhone moment & iPhone business. 那麼,你對於這樣的產品的想像,又是怎樣的呢?


留言
avatar-img
留言分享你的想法!
avatar-img
技術PM路易斯的沙龍
50會員
35內容數
技術PM的AI實驗室,是以輕鬆的角度深入簡出的探討各種生成式AI工具的使用。無論你是想理解AI到底是怎麼運作的? 想知道有那些好用的生成式AI工具? 或者是對AI繪圖有興趣的,都歡迎加入我們的AI實驗室一起輕鬆地玩耍,我們邊玩邊學,學習跟AI一起共創新的可能。
2023/12/23
SDXL Turbo主打可以1 step就產生一定品質的圖片 (圖片品質比SDXL甚至SD 1.5還要低),完全是以速度取勝,那麼SDXL Turbo這個技術代表的是怎樣的突破呢? 究竟秒出圖的技術能夠有什麼實際的應用呢? 這就是我們這篇想要探討的。
Thumbnail
2023/12/23
SDXL Turbo主打可以1 step就產生一定品質的圖片 (圖片品質比SDXL甚至SD 1.5還要低),完全是以速度取勝,那麼SDXL Turbo這個技術代表的是怎樣的突破呢? 究竟秒出圖的技術能夠有什麼實際的應用呢? 這就是我們這篇想要探討的。
Thumbnail
2023/11/01
本篇文章是 以ChatGPT翻譯華頓商學院教授Ethan Mollick的文章,並且稍微加上修飾而來的,是一篇相當好的該如何使用AI的引言,分享給各位。 我們學到的就是,只要使用AI,你就會學會如何使用AI。你只需大量使用AI,直到你弄清楚它的優點和缺點,就可以成為你領域的AI應用專家。
Thumbnail
2023/11/01
本篇文章是 以ChatGPT翻譯華頓商學院教授Ethan Mollick的文章,並且稍微加上修飾而來的,是一篇相當好的該如何使用AI的引言,分享給各位。 我們學到的就是,只要使用AI,你就會學會如何使用AI。你只需大量使用AI,直到你弄清楚它的優點和缺點,就可以成為你領域的AI應用專家。
Thumbnail
2023/10/22
本篇文章是翻譯自 AI大神 吳恩達 Andrew Ng 的電子信件,吳恩達是史丹福大學計算機科學系和電氣工程系的客座教授,曾任斯坦福人工智慧實驗室主任。他與達芙妮·科勒一起創建了在線教育平台Coursera。本篇文章吳恩達談到AI與邊緣運算。
Thumbnail
2023/10/22
本篇文章是翻譯自 AI大神 吳恩達 Andrew Ng 的電子信件,吳恩達是史丹福大學計算機科學系和電氣工程系的客座教授,曾任斯坦福人工智慧實驗室主任。他與達芙妮·科勒一起創建了在線教育平台Coursera。本篇文章吳恩達談到AI與邊緣運算。
Thumbnail
看更多
你可能也想看
Thumbnail
沙龍一直是創作與交流的重要空間,這次 vocus 全面改版了沙龍介面,就是為了讓好內容被好好看見! 你可以自由編排你的沙龍首頁版位,新版手機介面也讓每位訪客都能更快找到感興趣的內容、成為你的支持者。 改版完成後可以在社群媒體分享新版面,並標記 @vocus.official⁠ ♥️ ⁠
Thumbnail
沙龍一直是創作與交流的重要空間,這次 vocus 全面改版了沙龍介面,就是為了讓好內容被好好看見! 你可以自由編排你的沙龍首頁版位,新版手機介面也讓每位訪客都能更快找到感興趣的內容、成為你的支持者。 改版完成後可以在社群媒體分享新版面,並標記 @vocus.official⁠ ♥️ ⁠
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
每年4月、5月都是最多稅要繳的月份,當然大部份的人都是有機會繳到「綜合所得稅」,只是相當相當多人還不知道,原來繳給政府的稅!可以透過一些有活動的銀行信用卡或電子支付來繳,從繳費中賺一點點小確幸!就是賺個1%~2%大家也是很開心的,因為你們把沒回饋變成有回饋,就是用卡的最高境界 所得稅線上申報
Thumbnail
這篇文章會跟大家介紹,為什麼我覺得ChatGPT的多模態輸入輸出其實是最重要的一個功能之一,讓AI往成為真正人工智慧代理人的路上前進了一大步,我們也會稍微探討(想像)一下,所謂的理想的AI載具到底應該是怎樣的?
Thumbnail
這篇文章會跟大家介紹,為什麼我覺得ChatGPT的多模態輸入輸出其實是最重要的一個功能之一,讓AI往成為真正人工智慧代理人的路上前進了一大步,我們也會稍微探討(想像)一下,所謂的理想的AI載具到底應該是怎樣的?
Thumbnail
近年來,對話式AI取得了顯著的進展,而ChatGPT正處於這場革命的前沿。ChatGPT由OpenAI開發,它是一種基於先進語言模型的AI,利用深度學習技術進行互動和類人對話。在本文中,我們將深入探討ChatGPT的能力、應用、影響以及對各個行業和領域的影響,展示它在改變我們與AI互動方式方面的潛
Thumbnail
近年來,對話式AI取得了顯著的進展,而ChatGPT正處於這場革命的前沿。ChatGPT由OpenAI開發,它是一種基於先進語言模型的AI,利用深度學習技術進行互動和類人對話。在本文中,我們將深入探討ChatGPT的能力、應用、影響以及對各個行業和領域的影響,展示它在改變我們與AI互動方式方面的潛
Thumbnail
最近 ChatGPT 推出新功能,可以上傳聲音跟影像,不知道你開始玩了嗎?我想說可以藉由這個英文新聞來學一些很實用的單字用法,分享如下~
Thumbnail
最近 ChatGPT 推出新功能,可以上傳聲音跟影像,不知道你開始玩了嗎?我想說可以藉由這個英文新聞來學一些很實用的單字用法,分享如下~
Thumbnail
ChatGPT的魅力,不只是文字 近年來,AI技術的進步已經超越了我們的想像。當我們提到「chatgpt是什麼」時,可能首先想到的是文字聊天。 但現在,ChatGPT不僅可以「看」,還可以「聽」和「說」!這說明Chatgpt已經從一個單純的文字AI工具,進化成為一個多媒體AI助手! ChatGP
Thumbnail
ChatGPT的魅力,不只是文字 近年來,AI技術的進步已經超越了我們的想像。當我們提到「chatgpt是什麼」時,可能首先想到的是文字聊天。 但現在,ChatGPT不僅可以「看」,還可以「聽」和「說」!這說明Chatgpt已經從一個單純的文字AI工具,進化成為一個多媒體AI助手! ChatGP
Thumbnail
在科技日新月異的今天,OpenAI再次帶來了令人震撼的消息。今年10月,OpenAI宣布將通過API向ChatGPT Plus和企業版用戶提供全新的文本生成圖片產品——DALL·E 3,這一創新不僅意味著ChatGPT將開啟多模態輸出模式,更代表著用戶將能夠通過文字輸入,直接在ChatGPT中生成各
Thumbnail
在科技日新月異的今天,OpenAI再次帶來了令人震撼的消息。今年10月,OpenAI宣布將通過API向ChatGPT Plus和企業版用戶提供全新的文本生成圖片產品——DALL·E 3,這一創新不僅意味著ChatGPT將開啟多模態輸出模式,更代表著用戶將能夠通過文字輸入,直接在ChatGPT中生成各
Thumbnail
歡迎您踏入ChatGPT的世界!這份全面的指南將帶領您探索如何創造出清晰且有效的ChatGPT提示,以激發出引人入勝且充滿資訊的對話。 從學習有效提示的基本原則,到掌握如何建立清晰且簡潔提示的技巧,本專題將提供您所需的知識與技能,讓您的ChatGPT對話能達到新的高度。
Thumbnail
歡迎您踏入ChatGPT的世界!這份全面的指南將帶領您探索如何創造出清晰且有效的ChatGPT提示,以激發出引人入勝且充滿資訊的對話。 從學習有效提示的基本原則,到掌握如何建立清晰且簡潔提示的技巧,本專題將提供您所需的知識與技能,讓您的ChatGPT對話能達到新的高度。
Thumbnail
上次跟大家介紹了ChatGPT的手機APP的相關功能和優點。 這次我們要來詳細介紹它的應用方式,還有衍生出來的特殊用途,肯定能讓你提高效率與更好的使用人工智能。
Thumbnail
上次跟大家介紹了ChatGPT的手機APP的相關功能和優點。 這次我們要來詳細介紹它的應用方式,還有衍生出來的特殊用途,肯定能讓你提高效率與更好的使用人工智能。
Thumbnail
最近,企業越來越注重提升業務績效,尤其是在繁忙的商業環境中。所以,為了讓業務開發更加簡便和高效,在現代商業世界中出現了各種各樣的新技術,其中一種就是聊天機器人。ChatGPT是如今最受歡迎的聊天機器人之一,它能夠與用戶自然溝通,並給出有用資訊。在此篇文章中我們將探討如何結合ChatGPT實現業務開發
Thumbnail
最近,企業越來越注重提升業務績效,尤其是在繁忙的商業環境中。所以,為了讓業務開發更加簡便和高效,在現代商業世界中出現了各種各樣的新技術,其中一種就是聊天機器人。ChatGPT是如今最受歡迎的聊天機器人之一,它能夠與用戶自然溝通,並給出有用資訊。在此篇文章中我們將探討如何結合ChatGPT實現業務開發
Thumbnail
本篇文章在分享親身體驗使用AI輔助創作的過程。文章中可以看到作者第一手的經驗與描述,如何運用ChatGPT、Midjourney、Speech to Text、Autotag等眾多工具來進行輔助,以及最終的成果
Thumbnail
本篇文章在分享親身體驗使用AI輔助創作的過程。文章中可以看到作者第一手的經驗與描述,如何運用ChatGPT、Midjourney、Speech to Text、Autotag等眾多工具來進行輔助,以及最終的成果
Thumbnail
這段時間進行了一連串測試,也和幾位「真人」進行討論(不過仍然是透過網路,所以我並不確定傳給我的文字是對方寫的,或是ChatGPT寫的)。截至目前最大的感想就是「過猶不及」: 有一部份人將ChatGPT視為無所不能的工具,什麼都想讓它試試能不能做到;有些人則將ChatGPT視為炒作、趕流行,只是湊個熱
Thumbnail
這段時間進行了一連串測試,也和幾位「真人」進行討論(不過仍然是透過網路,所以我並不確定傳給我的文字是對方寫的,或是ChatGPT寫的)。截至目前最大的感想就是「過猶不及」: 有一部份人將ChatGPT視為無所不能的工具,什麼都想讓它試試能不能做到;有些人則將ChatGPT視為炒作、趕流行,只是湊個熱
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News