進化為GPT-4o 可以聊天兼翻譯,圖片辨識大有進展。不用十年,不到兩年AI已可取代許多人類庶務

更新於 發佈於 閱讀時間約 6 分鐘

2024年5月13日,Openai發布了新一代的模組GPT-4o,念法:GPT-four-O。強調即時對話以及圖像解析能力,官方發布的影片中展現了即席英語-義大利語口譯、程式碼解析、算式解析、人臉表情解析,以及幾乎可媲美真人的語音回應,包含調整語氣、用詞以及模仿機器人語音等,相當令人驚豔。

官方發布影片

26分鐘的影片中,主持人技術長穆拉蒂(Mira Murati)介紹到希望能夠讓人們更直覺地使用速度更快的GPT-4o,接下來兩名工程師分別以不同的方式展示新一代GPT-4o的能力,包括用對話請GPT-4o提供放鬆建議,並且故意喘氣讓她偵測自己的語速,請她用不同的情緒講故事等等。



圖片生成能力進化

先前我試用GPT-4的文章,提到GPT-4還無法調整圖片格式,新一代的GPT-4o已經可以調整圖片格式,也能夠去背及調整長寬比。但因為一次指令還是只能出一張圖,所以要調校很多次才能出現理想的照片。

我請ChatGPT生成四組貓咪的圖片,看能不能用在我新的貓貓系列書上。

Chat GPT-4o生成圖片

Chat GPT-4o生成圖片


一開始的這組有點太Q版了,因此我請他調整寫實一點、身體長一點,經過幾次後,出現比較適合的風格。

GPT-4o生成圖片

GPT-4o生成圖片


然後我再請他提供透明背景的png格式,第一次有點失敗,圖像都破了。

GPT-4o去除圖片背景

GPT-4o去除圖片背景


只好再請他製作一次,這次圖像本身沒有破碎,可是邊緣有點粗糙。

GPT-4o去除圖片背景

GPT-4o去除圖片背景

如果放在深色背景的環境下,看得很清楚貓咪周圍有白色的色塊。

GPT-4o去背圖片

GPT-4o去背圖片


用文字對話調校圖片,其實還不是那麼直覺,正確來講是有點困難,可能還是送去給專門AI修圖的軟體製作會好一點。

GPT-4o圖片生成對話畫面

GPT-4o圖片生成對話畫面


GPT-4o比GPT-4聰明嗎?

根據介紹,GPT-4o還是在GPT-4的基礎上去優化,也就是還沒有調校到完美的境界。我用同一個問題,也就是請問臺灣文學作家影響力前十的排行,得出來不一樣的答案,可以看出來GPT-4o是較為精準的,因為GPT-4把魯迅排在第一名就是有點奇怪,魯迅從來沒來過臺灣啊?

GPT-4回復有關臺灣影響力前十名作家

魯迅 - 雖然他是中國作家,但魯迅的作品對華語文學圈,包括台灣,有著深遠的影響。

白先勇 - 以其細膩的筆觸描繪出多元的愛情與人性,著有《台北人》等經典作品。

三毛 - 知名的流浪作家,以《撒哈拉的故事》等作品聞名,其獨特的生活經歷和深情敘事風格深受讀者喜愛。

李昂 - 知名的女性作家,作品常探討女性主義與性別議題,如《牽阮的手》。

張系國 - 以描寫台灣鄉土人情為主,其作品反映了台灣社會與文化的變遷。

鍾肇政 - 以創作台灣本土化的小說見長,作品豐富,風格多變。

朱天心 - 其作品深入挖掘家族和歷史記憶,如《古都》等作品廣受好評。

郭強生 - 以小說和散文見長,作品常反映出台灣社會底層的生活實況。

吳明益 - 以其深刻的人文關懷和精緻的文字著稱,著有《天橋上的魔術師》等作品。

詹宏志 - 雖然他以企業家身份更為人所知,但他的書籍和對台灣文化的貢獻也值得關注。


GPT-4o回復有關臺灣影響力前十名作家

  1. 白先勇
    • 他的小說集《台北人》被翻譯成多種語言,包括英語、法語、德語、日語等。
  2. 余光中
    • 他的詩集《鄉愁》被翻譯成多種語言,包括英語、法語、西班牙語等。
  3. 龍應台
    • 她的散文集《大江大海一九四九》和其他作品被翻譯成多種語言,包括英語、德語、法語、日語等。
  4. 李昂
    • 她的小說《殺夫》被翻譯成多種語言,包括英語、德語、法語、日語、韓語等。
  5. 朱天文
    • 她的小說《荒人手記》和其他作品被翻譯成多種語言,包括英語、法語、德語、日語等。
  6. 朱天心
    • 她的小說《古都》被翻譯成多種語言,包括英語、法語、德語、日語等。
  7. 王文興
    • 他的小說《家變》被翻譯成多種語言,包括英語、法語、德語、日語等。
  8. 七等生
    • 他的小說《逆旅》被翻譯成多種語言,包括英語、法語、德語、日語等。
  9. 陳映真
    • 他的社會寫實主義作品被翻譯成多種語言,包括英語、法語、德語、日語等。
  10. 張大春
    • 他的小說《尋人啟事》和其他作品被翻譯成多種語言,包括英語、法語、德語、日語等。

備註:第10原本是寫平路,但因為代表作品一直寫錯被我糾正,後來GPT-4o自己換成張大春。

小結

這次發布的GPT-4o又可以看出來文本生成AI的進展又往前跨了一大步,我相信一年以後再回來看,幾乎可達到真人對話的效果,而且根本比正常人類聰明。

手機上安裝GPT來進行實時對話,是本次發布的一大亮點,但目前因為流量過載一直沒實際測試成功,等到測試後再跟大家分享。如果即時口譯好用又正確度高的話,去旅遊就很方便了,未來甚至有可能作為多數會議的多語即席口譯,只有非常重要或機敏性質的會議才需要使用真人口譯。


留言
avatar-img
留言分享你的想法!
職場法蘭克-avatar-img
2024/06/12
根據黑眼圈的說明,看起來是有在進步了。
德意志黑眼圈-avatar-img
發文者
2024/10/07
職場法蘭克 幾個月前的文章,現在看市面上又有很多新的應用。特別在翻譯這一塊,我想幾年內AI很快就可以達到日常生活同步口譯的效果。
avatar-img
德意志黑眼圈
107會員
71內容數
分享德國生活、創作及閱讀心得、感情疑難雜症問事。 職場戀愛小說為付費單元,其他都開放閱讀,歡迎留言交流想法。 合作邀約請來信:himamaklar@gmail.com
德意志黑眼圈的其他內容
2024/05/03
試用GoingBus服務加入YouTube Premium享受優惠價,在YouTube上暢覽各種影片! 這篇文章也介紹了試用Audyo文字轉語音以及Fliki文字轉影片的AI功能,歡迎大家一起試試看。
Thumbnail
2024/05/03
試用GoingBus服務加入YouTube Premium享受優惠價,在YouTube上暢覽各種影片! 這篇文章也介紹了試用Audyo文字轉語音以及Fliki文字轉影片的AI功能,歡迎大家一起試試看。
Thumbnail
2024/04/24
自從幸運地獲得了透過GoingBus共享帳號試用GPT Plus的機會,我就用我有限的心智及能力來思考如何透過GPT-4創造更大的可能。工具對於能善用的人來說,能創造更大的價值,對於不能利用的人來說,等於無用。
Thumbnail
2024/04/24
自從幸運地獲得了透過GoingBus共享帳號試用GPT Plus的機會,我就用我有限的心智及能力來思考如何透過GPT-4創造更大的可能。工具對於能善用的人來說,能創造更大的價值,對於不能利用的人來說,等於無用。
Thumbnail
2024/04/24
現在推出的訂閱服務這麼多種,每一種都要訂下去的話,每個月的基本開銷真的不小。現在利用GoingBus共享串流影音帳號的服務,可以用將近四折的價格使用GPT Plus,開啟多項新的服務功能。
Thumbnail
2024/04/24
現在推出的訂閱服務這麼多種,每一種都要訂下去的話,每個月的基本開銷真的不小。現在利用GoingBus共享串流影音帳號的服務,可以用將近四折的價格使用GPT Plus,開啟多項新的服務功能。
Thumbnail
看更多
你可能也想看
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
「欸!這是在哪裡買的?求連結 🥺」 誰叫你太有品味,一發就讓大家跟著剁手手? 讓你回購再回購的生活好物,是時候該介紹出場了吧! 「開箱你的美好生活」現正召喚各路好物的開箱使者 🤩
Thumbnail
介紹朋友新開的蝦皮選物店『10樓2選物店』,並分享方格子與蝦皮合作的分潤計畫,註冊流程簡單,0成本、無綁約,推薦給想增加收入的讀者。
Thumbnail
介紹朋友新開的蝦皮選物店『10樓2選物店』,並分享方格子與蝦皮合作的分潤計畫,註冊流程簡單,0成本、無綁約,推薦給想增加收入的讀者。
Thumbnail
OpenAI最近進行了重大更新,ChatGPT-4o將開放給所有用戶,具備更強的理解力和出色的長文、邏輯能力等功能。新版本增加了上傳圖片的選項,更換模型功能,並進行了功能測試。本文將針對用戶的實際體驗進行測評。
Thumbnail
OpenAI最近進行了重大更新,ChatGPT-4o將開放給所有用戶,具備更強的理解力和出色的長文、邏輯能力等功能。新版本增加了上傳圖片的選項,更換模型功能,並進行了功能測試。本文將針對用戶的實際體驗進行測評。
Thumbnail
GPT-4o中的“o”代表“omni”,意思是全能。它能夠在232毫秒內做出回應,幾乎和人類一樣快。這個模型可以即時翻譯、進行視覺推理和自然對話,顯示出它在智能對話、多模態處理和擴展應用場景方面的巨大潛力。
Thumbnail
GPT-4o中的“o”代表“omni”,意思是全能。它能夠在232毫秒內做出回應,幾乎和人類一樣快。這個模型可以即時翻譯、進行視覺推理和自然對話,顯示出它在智能對話、多模態處理和擴展應用場景方面的巨大潛力。
Thumbnail
OpenAI在5/13春季發表會上宣佈,將免費向ChatGPT推出最新的GPT-4o模型和更多功能。免費用戶將可享受GPT-4o的智慧和高級工具,並有使用量限制。文章介紹了GPT-4o的功能和未來優化,並提到新的ChatGPT桌面應用程式和外觀改變。
Thumbnail
OpenAI在5/13春季發表會上宣佈,將免費向ChatGPT推出最新的GPT-4o模型和更多功能。免費用戶將可享受GPT-4o的智慧和高級工具,並有使用量限制。文章介紹了GPT-4o的功能和未來優化,並提到新的ChatGPT桌面應用程式和外觀改變。
Thumbnail
2024年5月13日,Openai發布了新一代的模組GPT-4o,念法:GPT-four-O。強調即時對話以及圖像解析能力,官方發布的影片中展現了即席英語-義大利語口譯、程式碼解析、算式解析、人臉表情解析,以及幾乎可媲美真人的語音回應,包含調整語氣、用詞以及模仿機器人語音等,相當令人驚豔。
Thumbnail
2024年5月13日,Openai發布了新一代的模組GPT-4o,念法:GPT-four-O。強調即時對話以及圖像解析能力,官方發布的影片中展現了即席英語-義大利語口譯、程式碼解析、算式解析、人臉表情解析,以及幾乎可媲美真人的語音回應,包含調整語氣、用詞以及模仿機器人語音等,相當令人驚豔。
Thumbnail
ChatGPT新模型GPT-4o即將推出,速度更快,並支援處理影片以及多種語言。免費用戶也可以使用ChatBots,而付費版本則限制頻寬並提高至原本的5倍。此外,還將推出ChatGPT桌面應用程式,讓使用者在電腦上進行各項工作時,更輕鬆地使用ChatGPT。
Thumbnail
ChatGPT新模型GPT-4o即將推出,速度更快,並支援處理影片以及多種語言。免費用戶也可以使用ChatBots,而付費版本則限制頻寬並提高至原本的5倍。此外,還將推出ChatGPT桌面應用程式,讓使用者在電腦上進行各項工作時,更輕鬆地使用ChatGPT。
Thumbnail
近日,OpenAI再度掀起AI領域的巨浪,宣布ChatGPT正式進化成GPT-4。這一次的更新不僅僅讓ChatGPT變得更聰明,還引入了圖像辨識和文本輸入功能,使得ChatGPT成為一個多模態的工具。本文將深入探討ChatGPT 4的新功能、付費方案以及其在不同領域的應用。
Thumbnail
近日,OpenAI再度掀起AI領域的巨浪,宣布ChatGPT正式進化成GPT-4。這一次的更新不僅僅讓ChatGPT變得更聰明,還引入了圖像辨識和文本輸入功能,使得ChatGPT成為一個多模態的工具。本文將深入探討ChatGPT 4的新功能、付費方案以及其在不同領域的應用。
Thumbnail
美國時間 2023 年 11 月 6 日,OpenAI 在美國舊金山舉行了首屆開發者大會。大會上,OpenAI 展示了一系列新產品和服務,其中最引人注目的是 GPT-4 Turbo。 什麼是GPT-4 Turbo GPT-4 Turbo 是 GPT-4 的更強大版本,具有以下改進: 模
Thumbnail
美國時間 2023 年 11 月 6 日,OpenAI 在美國舊金山舉行了首屆開發者大會。大會上,OpenAI 展示了一系列新產品和服務,其中最引人注目的是 GPT-4 Turbo。 什麼是GPT-4 Turbo GPT-4 Turbo 是 GPT-4 的更強大版本,具有以下改進: 模
Thumbnail
「ChatGpt新版本GPT-4」 3月15日chatgpt的新版本GPT-4問世了,它有100兆個參數是原本的570倍,前一版GPT-3.5只能理解文字,而GPT-4是多模態模型,可以同時理解圖像、聲音、文本和影片,簡單來說 ➡️萬物皆可作為輸入和輸出 *GPT-4 能解決的10種問題: ✅了解圖
Thumbnail
「ChatGpt新版本GPT-4」 3月15日chatgpt的新版本GPT-4問世了,它有100兆個參數是原本的570倍,前一版GPT-3.5只能理解文字,而GPT-4是多模態模型,可以同時理解圖像、聲音、文本和影片,簡單來說 ➡️萬物皆可作為輸入和輸出 *GPT-4 能解決的10種問題: ✅了解圖
Thumbnail
3月15日,Open AI發表了最新一版的AI:GPT-4。新版本的GPT-4效能更強是肯定的,答題正確率更高也非常合理,但這些對我們一般人來說感知並不大。對我們來說,真正值得關注的重點只有一個:GPT-4它竟然可以看得懂圖了!要知道,能看得懂圖的新AI,能多做的事豈止一件兩件?
Thumbnail
3月15日,Open AI發表了最新一版的AI:GPT-4。新版本的GPT-4效能更強是肯定的,答題正確率更高也非常合理,但這些對我們一般人來說感知並不大。對我們來說,真正值得關注的重點只有一個:GPT-4它竟然可以看得懂圖了!要知道,能看得懂圖的新AI,能多做的事豈止一件兩件?
Thumbnail
GPT-4.0(生成型預訓練變換模型4.0)在台灣時間2023年3月16日發表於youtube網站,並詳細描述了這次不同於先前的GPT-3.5有哪些不一樣的功能。僅僅一天,影片就迎來了192萬次的觀看。那麼,這次的發表有哪些重點呢?AI是否又更進化了?我們就來瞧瞧。
Thumbnail
GPT-4.0(生成型預訓練變換模型4.0)在台灣時間2023年3月16日發表於youtube網站,並詳細描述了這次不同於先前的GPT-3.5有哪些不一樣的功能。僅僅一天,影片就迎來了192萬次的觀看。那麼,這次的發表有哪些重點呢?AI是否又更進化了?我們就來瞧瞧。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News