進化為GPT-4o 可以聊天兼翻譯,圖片辨識大有進展。不用十年,不到兩年AI已可取代許多人類庶務

更新於 發佈於 閱讀時間約 6 分鐘

2024年5月13日,Openai發布了新一代的模組GPT-4o,念法:GPT-four-O。強調即時對話以及圖像解析能力,官方發布的影片中展現了即席英語-義大利語口譯、程式碼解析、算式解析、人臉表情解析,以及幾乎可媲美真人的語音回應,包含調整語氣、用詞以及模仿機器人語音等,相當令人驚豔。

官方發布影片

26分鐘的影片中,主持人技術長穆拉蒂(Mira Murati)介紹到希望能夠讓人們更直覺地使用速度更快的GPT-4o,接下來兩名工程師分別以不同的方式展示新一代GPT-4o的能力,包括用對話請GPT-4o提供放鬆建議,並且故意喘氣讓她偵測自己的語速,請她用不同的情緒講故事等等。



圖片生成能力進化

先前我試用GPT-4的文章,提到GPT-4還無法調整圖片格式,新一代的GPT-4o已經可以調整圖片格式,也能夠去背及調整長寬比。但因為一次指令還是只能出一張圖,所以要調校很多次才能出現理想的照片。

我請ChatGPT生成四組貓咪的圖片,看能不能用在我新的貓貓系列書上。

Chat GPT-4o生成圖片

Chat GPT-4o生成圖片


一開始的這組有點太Q版了,因此我請他調整寫實一點、身體長一點,經過幾次後,出現比較適合的風格。

GPT-4o生成圖片

GPT-4o生成圖片


然後我再請他提供透明背景的png格式,第一次有點失敗,圖像都破了。

GPT-4o去除圖片背景

GPT-4o去除圖片背景


只好再請他製作一次,這次圖像本身沒有破碎,可是邊緣有點粗糙。

GPT-4o去除圖片背景

GPT-4o去除圖片背景

如果放在深色背景的環境下,看得很清楚貓咪周圍有白色的色塊。

GPT-4o去背圖片

GPT-4o去背圖片


用文字對話調校圖片,其實還不是那麼直覺,正確來講是有點困難,可能還是送去給專門AI修圖的軟體製作會好一點。

GPT-4o圖片生成對話畫面

GPT-4o圖片生成對話畫面


GPT-4o比GPT-4聰明嗎?

根據介紹,GPT-4o還是在GPT-4的基礎上去優化,也就是還沒有調校到完美的境界。我用同一個問題,也就是請問臺灣文學作家影響力前十的排行,得出來不一樣的答案,可以看出來GPT-4o是較為精準的,因為GPT-4把魯迅排在第一名就是有點奇怪,魯迅從來沒來過臺灣啊?

GPT-4回復有關臺灣影響力前十名作家

魯迅 - 雖然他是中國作家,但魯迅的作品對華語文學圈,包括台灣,有著深遠的影響。

白先勇 - 以其細膩的筆觸描繪出多元的愛情與人性,著有《台北人》等經典作品。

三毛 - 知名的流浪作家,以《撒哈拉的故事》等作品聞名,其獨特的生活經歷和深情敘事風格深受讀者喜愛。

李昂 - 知名的女性作家,作品常探討女性主義與性別議題,如《牽阮的手》。

張系國 - 以描寫台灣鄉土人情為主,其作品反映了台灣社會與文化的變遷。

鍾肇政 - 以創作台灣本土化的小說見長,作品豐富,風格多變。

朱天心 - 其作品深入挖掘家族和歷史記憶,如《古都》等作品廣受好評。

郭強生 - 以小說和散文見長,作品常反映出台灣社會底層的生活實況。

吳明益 - 以其深刻的人文關懷和精緻的文字著稱,著有《天橋上的魔術師》等作品。

詹宏志 - 雖然他以企業家身份更為人所知,但他的書籍和對台灣文化的貢獻也值得關注。


GPT-4o回復有關臺灣影響力前十名作家

  1. 白先勇
    • 他的小說集《台北人》被翻譯成多種語言,包括英語、法語、德語、日語等。
  2. 余光中
    • 他的詩集《鄉愁》被翻譯成多種語言,包括英語、法語、西班牙語等。
  3. 龍應台
    • 她的散文集《大江大海一九四九》和其他作品被翻譯成多種語言,包括英語、德語、法語、日語等。
  4. 李昂
    • 她的小說《殺夫》被翻譯成多種語言,包括英語、德語、法語、日語、韓語等。
  5. 朱天文
    • 她的小說《荒人手記》和其他作品被翻譯成多種語言,包括英語、法語、德語、日語等。
  6. 朱天心
    • 她的小說《古都》被翻譯成多種語言,包括英語、法語、德語、日語等。
  7. 王文興
    • 他的小說《家變》被翻譯成多種語言,包括英語、法語、德語、日語等。
  8. 七等生
    • 他的小說《逆旅》被翻譯成多種語言,包括英語、法語、德語、日語等。
  9. 陳映真
    • 他的社會寫實主義作品被翻譯成多種語言,包括英語、法語、德語、日語等。
  10. 張大春
    • 他的小說《尋人啟事》和其他作品被翻譯成多種語言,包括英語、法語、德語、日語等。

備註:第10原本是寫平路,但因為代表作品一直寫錯被我糾正,後來GPT-4o自己換成張大春。

小結

這次發布的GPT-4o又可以看出來文本生成AI的進展又往前跨了一大步,我相信一年以後再回來看,幾乎可達到真人對話的效果,而且根本比正常人類聰明。

手機上安裝GPT來進行實時對話,是本次發布的一大亮點,但目前因為流量過載一直沒實際測試成功,等到測試後再跟大家分享。如果即時口譯好用又正確度高的話,去旅遊就很方便了,未來甚至有可能作為多數會議的多語即席口譯,只有非常重要或機敏性質的會議才需要使用真人口譯。


avatar-img
105會員
98內容數
分享德國生活、創作及閱讀心得、感情疑難雜症問事。 職場戀愛小說為付費單元,其他都開放閱讀,歡迎留言交流想法。 合作邀約請來信:himamaklar@gmail.com
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
德意志黑眼圈 的其他內容
試用GoingBus服務加入YouTube Premium享受優惠價,在YouTube上暢覽各種影片! 這篇文章也介紹了試用Audyo文字轉語音以及Fliki文字轉影片的AI功能,歡迎大家一起試試看。
自從幸運地獲得了透過GoingBus共享帳號試用GPT Plus的機會,我就用我有限的心智及能力來思考如何透過GPT-4創造更大的可能。工具對於能善用的人來說,能創造更大的價值,對於不能利用的人來說,等於無用。
現在推出的訂閱服務這麼多種,每一種都要訂下去的話,每個月的基本開銷真的不小。現在利用GoingBus共享串流影音帳號的服務,可以用將近四折的價格使用GPT Plus,開啟多項新的服務功能。
Microsoft Bing影像建立工具已經推出一段時間,之前看到不少實測文章,雖然可調整選項不多,應該說是幾乎沒有,但是產生的圖片品質不錯,也有1024*1024的解析度。這次來試用看看,用中文描述的產出結果,還不錯!
大家好,因為銷售實在緩慢,事隔4個月後才跟大家回報最新進度。 基本上沒有售出單本書,而是透過KENP Read (Kindle edition normalized pages read)有獲得閱讀,再依據頁數結算支付的版稅。 這次的版稅結算結果是...... 在澳洲的Amazon及日本的Am
收到了Amazon KDP的版稅通知Email,看了幾眼想說是不是詐騙,沒想到我的人生也有解鎖收到外文書版稅成就的一天。 信上沒有寫多少錢,只寫說請點擊連結確認付款報告(Payment Report)。仔細看了連結的網址不是奇怪的釣魚連結,點進去登入Amazon KDP平台,看到了版稅資料...
試用GoingBus服務加入YouTube Premium享受優惠價,在YouTube上暢覽各種影片! 這篇文章也介紹了試用Audyo文字轉語音以及Fliki文字轉影片的AI功能,歡迎大家一起試試看。
自從幸運地獲得了透過GoingBus共享帳號試用GPT Plus的機會,我就用我有限的心智及能力來思考如何透過GPT-4創造更大的可能。工具對於能善用的人來說,能創造更大的價值,對於不能利用的人來說,等於無用。
現在推出的訂閱服務這麼多種,每一種都要訂下去的話,每個月的基本開銷真的不小。現在利用GoingBus共享串流影音帳號的服務,可以用將近四折的價格使用GPT Plus,開啟多項新的服務功能。
Microsoft Bing影像建立工具已經推出一段時間,之前看到不少實測文章,雖然可調整選項不多,應該說是幾乎沒有,但是產生的圖片品質不錯,也有1024*1024的解析度。這次來試用看看,用中文描述的產出結果,還不錯!
大家好,因為銷售實在緩慢,事隔4個月後才跟大家回報最新進度。 基本上沒有售出單本書,而是透過KENP Read (Kindle edition normalized pages read)有獲得閱讀,再依據頁數結算支付的版稅。 這次的版稅結算結果是...... 在澳洲的Amazon及日本的Am
收到了Amazon KDP的版稅通知Email,看了幾眼想說是不是詐騙,沒想到我的人生也有解鎖收到外文書版稅成就的一天。 信上沒有寫多少錢,只寫說請點擊連結確認付款報告(Payment Report)。仔細看了連結的網址不是奇怪的釣魚連結,點進去登入Amazon KDP平台,看到了版稅資料...
你可能也想看
Google News 追蹤
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
ChatGPT-4o已經開放給部分用戶使用了!! 兩周前,Open AI剛發布的ChatGPT-4o版本,令人驚豔!! 從原本只有文字的應用,就已經引起驚天動地的AI浪潮與各種應用如雨後春筍般的大量露出,還來不及學會各種應用時,長出眼睛跟耳朵的GPT4o竟然說來就來,而且還可以免費使用、體驗!?
Thumbnail
OpenAI最近進行了重大更新,ChatGPT-4o將開放給所有用戶,具備更強的理解力和出色的長文、邏輯能力等功能。新版本增加了上傳圖片的選項,更換模型功能,並進行了功能測試。本文將針對用戶的實際體驗進行測評。
Thumbnail
OpenAI 春季發布會推出了 GPT-4o 模型,免費且響應速度更快,具備文字、音訊、影像的多模態輸入功能。
Thumbnail
GPT-4o中的“o”代表“omni”,意思是全能。它能夠在232毫秒內做出回應,幾乎和人類一樣快。這個模型可以即時翻譯、進行視覺推理和自然對話,顯示出它在智能對話、多模態處理和擴展應用場景方面的巨大潛力。
Thumbnail
OpenAI在5/13春季發表會上宣佈,將免費向ChatGPT推出最新的GPT-4o模型和更多功能。免費用戶將可享受GPT-4o的智慧和高級工具,並有使用量限制。文章介紹了GPT-4o的功能和未來優化,並提到新的ChatGPT桌面應用程式和外觀改變。
Thumbnail
ChatGPT新模型GPT-4o即將推出,速度更快,並支援處理影片以及多種語言。免費用戶也可以使用ChatBots,而付費版本則限制頻寬並提高至原本的5倍。此外,還將推出ChatGPT桌面應用程式,讓使用者在電腦上進行各項工作時,更輕鬆地使用ChatGPT。
Thumbnail
近日,OpenAI再度掀起AI領域的巨浪,宣布ChatGPT正式進化成GPT-4。這一次的更新不僅僅讓ChatGPT變得更聰明,還引入了圖像辨識和文本輸入功能,使得ChatGPT成為一個多模態的工具。本文將深入探討ChatGPT 4的新功能、付費方案以及其在不同領域的應用。
Thumbnail
隨著理財資訊的普及,越來越多台灣人不再將資產侷限於台股,而是將視野拓展到國際市場。特別是美國市場,其豐富的理財選擇,讓不少人開始思考將資金配置於海外市場的可能性。 然而,要參與美國市場並不只是盲目跟隨標的這麼簡單,而是需要策略和方式,尤其對新手而言,除了選股以外還會遇到語言、開戶流程、Ap
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
OpenAI 繼上週發表新的人工智慧模型「GPT-4o mini」,由 AI 驅動的搜尋引擎 SearchGPT 原型也隨之發布,該引擎能結合來自網路的即時資訊,讓使用者像與 ChatGPT 交談一樣搜尋。 透過 SearchGPT,用戶能以自然語言提出問題(與使用 ChatGPT 交談方式相同
Thumbnail
ChatGPT-4o已經開放給部分用戶使用了!! 兩周前,Open AI剛發布的ChatGPT-4o版本,令人驚豔!! 從原本只有文字的應用,就已經引起驚天動地的AI浪潮與各種應用如雨後春筍般的大量露出,還來不及學會各種應用時,長出眼睛跟耳朵的GPT4o竟然說來就來,而且還可以免費使用、體驗!?
Thumbnail
OpenAI最近進行了重大更新,ChatGPT-4o將開放給所有用戶,具備更強的理解力和出色的長文、邏輯能力等功能。新版本增加了上傳圖片的選項,更換模型功能,並進行了功能測試。本文將針對用戶的實際體驗進行測評。
Thumbnail
OpenAI 春季發布會推出了 GPT-4o 模型,免費且響應速度更快,具備文字、音訊、影像的多模態輸入功能。
Thumbnail
GPT-4o中的“o”代表“omni”,意思是全能。它能夠在232毫秒內做出回應,幾乎和人類一樣快。這個模型可以即時翻譯、進行視覺推理和自然對話,顯示出它在智能對話、多模態處理和擴展應用場景方面的巨大潛力。
Thumbnail
OpenAI在5/13春季發表會上宣佈,將免費向ChatGPT推出最新的GPT-4o模型和更多功能。免費用戶將可享受GPT-4o的智慧和高級工具,並有使用量限制。文章介紹了GPT-4o的功能和未來優化,並提到新的ChatGPT桌面應用程式和外觀改變。
Thumbnail
ChatGPT新模型GPT-4o即將推出,速度更快,並支援處理影片以及多種語言。免費用戶也可以使用ChatBots,而付費版本則限制頻寬並提高至原本的5倍。此外,還將推出ChatGPT桌面應用程式,讓使用者在電腦上進行各項工作時,更輕鬆地使用ChatGPT。
Thumbnail
近日,OpenAI再度掀起AI領域的巨浪,宣布ChatGPT正式進化成GPT-4。這一次的更新不僅僅讓ChatGPT變得更聰明,還引入了圖像辨識和文本輸入功能,使得ChatGPT成為一個多模態的工具。本文將深入探討ChatGPT 4的新功能、付費方案以及其在不同領域的應用。