2023 「生成式AI大爆發」與展望

閱讀時間約 4 分鐘

生成式AI大爆發

2023,這一年,生成式AI迎來前所未有的爆發式成長。

就在去年11月ChatGPT橫空出世,開啟了AI新紀元,而OpenAI也在本月召首屆開發者大會。

有鑑於AI領域真的進步太快,內容太多太繁雜,故這篇文章也僅能對這一年最熱門的生成式AI領域做個簡略的介紹及展望,首先就依生成哪種類型的內容來分類,並簡單介紹一下吧!

  • 生成文字:能夠理解、分析自然語言,從而生成對話、文章等內容,這類別最廣為人知的就是OpenAI所開發的ChatGPT,也是引爆本次AI熱潮的先鋒者,得益於大型語言模型的進步,讓AI的自然語言處理能理能力有了飛躍性的質變,微軟身為OpenAI的最大投資者也將生成式AI技術應用於Copilot等產品中。另外還有另一家AI新創Anthropic開發的Cluade同樣是文字內容生成AI,也得到了來自Google、亞馬遜等巨頭的投資,而Google亦有推出屬於自己的AI應用 Bard。另外還有像是幫你預設好各種角色的聊天機器人Character.AI,感覺也滿有趣的。
  • 生成圖像:可以依據輸入的自然語言生成圖像,例如像是Midjourney, Stable Diffusion, Dall-E,Leonard.Ai, Adobe Firefly, TensorArt等等AI繪圖應用。
  • 生成語音、音樂:可以依據輸入的自然語言生成音樂、生成語音。生成音樂的例如像是MusicLM, MusicGen, Soundraw等等應用。生成語音的像是Eleven Labs , 剪映等等。
  • 生成影像:可以依據輸入的自然語言生成影像或將圖像轉變成影像,例如像是Runway Gen2, moonvalley等等。還有生成虛擬化身的 AI,像是Heygen。
  • 生成遊戲:生成遊戲中的場景或角色等,像是 NVIDIA ACE for Gaming。
  • 多模態模型:可以同時處理及理解多種不同模態(modality)數據的模型,包括文字、圖像、語音、動作、影像等。這類模型可以同時處理各不同類型的數據輸入,從而更全面地理解和生成內容。例如:Meta的ImageBind、Google的Gemini及Palm-E等。透過不同感官的輸入,AI能夠更好地理解和模擬人類的溝通模式,從而實現更自然、有效的人機交互。

從數位到實體

得益於AI自然語言處理能力的大幅進步,使得人類能夠以自然語言跟AI交流,僅僅輸入簡單的文字就可以生成一篇文章、一幅畫、一部影片等,能以人類望塵莫及的速度生產內容,但似乎並非每種自然語言都能有效精確地與AI溝通,在AI的世界,似乎讓英語的優勢更加增強了1。英語的優先性再加上AI的大量快速生產能力,可能會讓AI對人類的文化產生塑造或影響,也讓本就內容爆炸的時代,更加爆炸了。而AI也產生虛假內容的風險。

具有創造虛擬內容能力的AI,在未來也能夠進入實體世界,不過當然還需要一段時間。隨著跨模態、多模態AI的出現,AI應該也能逐漸理解現實環境,有了視覺、聽覺、觸覺等感官,再加上能夠嵌入機器人的多模態實體模型Palm-E,在未來,無人機、掃地機器人、送餐機器人、自動駕駛、智能家居、3D列印、人形機器人等等或許都會被AI化。

明年開始,AI手機、AI PC將會陸續出現,蘋果也可能在iOS18中加入AI功能。隨著Google、Meta、微軟、OpenAI、輝達等等越來越多巨頭的投入參與,可以期待接下來幾年AI還會不斷進步。

AI未來發展前景可期,就跟魔法一樣無可限量。在未來操縱與使用AI的人,或許會讓現在的我們看來與使用魔法無異吧!哈哈~!

題外話,最近鬧得沸沸揚揚、峰迴路轉的Sam Altman離開Open AI而後又回歸的事件,傳聞起因是因為Sam Altman向Open AI董事會隱瞞了人工智能突破性技術Q*(Q-Star)的存在,不過OpenAI對此事拒絕評論2


參考文章

1BBC中文:https://www.bbc.com/zhongwen/trad/science-67270190

2聯合新聞網:https://udn.com/news/story/6811/7592957

raw-image





2會員
12內容數
在科技觀察與小說創作間恣意漫步遨遊。
留言0
查看全部
發表第一個留言支持創作者!
晨醒者的漫遊時空 的其他內容
2023年,算是XR頭戴式顯示器發展滿熱鬧的一年,先是索尼在2月開售了PS VR2,接著在6月Meta及蘋果先後發表了各自的XR頭戴式顯示器。
最近玩了兩款滿好玩的遊戲,《祕境探險4》和《底特律:變人》。 我竟然都把他們給破完了,雖然只是簡單的過完一輪,不過也是難能可貴,要知道我多久沒有把一款遊戲給破完,這次居然接連破了兩款,哈哈!
糖果之心所在的房間一片漆黑,莉莉亞小心翼翼地緩緩摸索前進,腳一步一步試探性地踩著... ...
莉莉亞一行人為得到糖果之心,搭乘泡泡糖飛船前往蛋糕大聖堂... ...。
聽了波波訴說了這個世界的狀況,莉莉亞也想盡一份力,來幫助這世界的甜品免於遭到巫婆的毒手。於是莉莉亞跟著兔子波波一齊前往泡泡糖魔法師的據點,泡泡糖魔法師已經想好了對付巫婆的計畫。
某個晴朗的早晨,莉莉亞走進了她的祖父位於小鎮邊緣的古老書店。在書店中,她被一本閃耀著神秘光芒的書籍吸引住,並就此踏上了奇幻旅程。
2023年,算是XR頭戴式顯示器發展滿熱鬧的一年,先是索尼在2月開售了PS VR2,接著在6月Meta及蘋果先後發表了各自的XR頭戴式顯示器。
最近玩了兩款滿好玩的遊戲,《祕境探險4》和《底特律:變人》。 我竟然都把他們給破完了,雖然只是簡單的過完一輪,不過也是難能可貴,要知道我多久沒有把一款遊戲給破完,這次居然接連破了兩款,哈哈!
糖果之心所在的房間一片漆黑,莉莉亞小心翼翼地緩緩摸索前進,腳一步一步試探性地踩著... ...
莉莉亞一行人為得到糖果之心,搭乘泡泡糖飛船前往蛋糕大聖堂... ...。
聽了波波訴說了這個世界的狀況,莉莉亞也想盡一份力,來幫助這世界的甜品免於遭到巫婆的毒手。於是莉莉亞跟著兔子波波一齊前往泡泡糖魔法師的據點,泡泡糖魔法師已經想好了對付巫婆的計畫。
某個晴朗的早晨,莉莉亞走進了她的祖父位於小鎮邊緣的古老書店。在書店中,她被一本閃耀著神秘光芒的書籍吸引住,並就此踏上了奇幻旅程。
你可能也想看
Google News 追蹤
Thumbnail
接下來第二部分我們持續討論美國總統大選如何佈局, 以及選前一週到年底的操作策略建議 分析兩位候選人政策利多/ 利空的板塊和股票
Thumbnail
🤔為什麼團長的能力是死亡筆記本? 🤔為什麼像是死亡筆記本呢? 🤨作者巧思-讓妮翁死亡合理的幾個伏筆
Thumbnail
生成式AI,這個可能聽起來有些陌生的名詞,其實正是當前科技界的一股暖流。這種AI技術的主要特點是能夠自我學習並創造出新的內容,而不僅僅是根據既定規則或模式進行運算。這種創新的能力使得生成式AI在許多領域中都有著廣泛的應用前景,從藝術創作、遊戲設計,到醫療研究、金融預測,其潛力無窮。
Thumbnail
今年是AI大爆發的一年,從產生簡報、生成圖片,到Youtube出現AI生成的孫燕姿翻唱歌曲,無論在娛樂或提高工作生產力,生成式AI的潛力似乎才剛被發掘,還有更多應用可期待。今天要介紹幾個有名的AI繪圖服務,如果想要挑戰自己寫code產生圖片,記得看到文章最後喔(你的coding 魂被燃燒起來了嗎?)
Thumbnail
本文探討大資料對模型的影響。研究指出,大資料量對模型的語法和世界知識理解有顯著影響。固定運算資源下,DeepMind發現適應參數數量更重要,這使模型Chinchilla以較小規模但更多訓練資料,在實際任務中優於Gopher模型。這說明增大模型的規模已不具有太大意義,應增加訓練資料。
Thumbnail
本文探討了大型語言模型中的特殊現象,包括頓悟現象,大模型的隱藏知識引導,以及模型越大對某些問題的理解越偏離的U型曲線。文章強調,當模型不夠理想時,我們需要更好地引導模型或了解問題的本質,而非只是增加模型的大小。
Thumbnail
去年底 ChatGPT 橫空出世,流暢的對答表現與驚人的資料統整力,讓人們震驚原來 AI 已經有如此超「人」能力。而 Midjourney 的出現,也讓很多人轉職成詠唱詩人,動動嘴就能畫好一幅畫(精準點說是打打鍵盤)。這些生成式AI 猛然打入人們的生活。
Thumbnail
去年阿財有分享過自動駕駛技術各個解決方案的路線選擇,當時我就有提到過我認為傳統車廠為什麼不走純視覺路線的可能原因,這邊再稍微分享一下: 首先在講純視覺之前先了解一下目前純視覺是如何計算深度的,目前用相機拍到的影像計算深度有單目視覺、雙目視覺、運動結構恢復(sfm)等再搭配AI模型,可以搜尋Pseud
2023年當紅的科技關鍵字,想必與「生成式AI」(AI-generated)脫不了關係;若不是生成式AI,那應該就是以它為主開發出的ChatGPT了。
Thumbnail
無論是疫情後的 PC 需求疲軟,或者是加密貨幣不再使用顯卡挖礦,都對 NVIDIA 的業績造成了巨大的影響。所幸,近期 NVIDIA 又搭上了一波新的風向,由生成式 AI 所帶動的 AI 應用熱潮,讓大家又開始對於 NVIDIA 的未來業績寄予厚望
Thumbnail
接下來第二部分我們持續討論美國總統大選如何佈局, 以及選前一週到年底的操作策略建議 分析兩位候選人政策利多/ 利空的板塊和股票
Thumbnail
🤔為什麼團長的能力是死亡筆記本? 🤔為什麼像是死亡筆記本呢? 🤨作者巧思-讓妮翁死亡合理的幾個伏筆
Thumbnail
生成式AI,這個可能聽起來有些陌生的名詞,其實正是當前科技界的一股暖流。這種AI技術的主要特點是能夠自我學習並創造出新的內容,而不僅僅是根據既定規則或模式進行運算。這種創新的能力使得生成式AI在許多領域中都有著廣泛的應用前景,從藝術創作、遊戲設計,到醫療研究、金融預測,其潛力無窮。
Thumbnail
今年是AI大爆發的一年,從產生簡報、生成圖片,到Youtube出現AI生成的孫燕姿翻唱歌曲,無論在娛樂或提高工作生產力,生成式AI的潛力似乎才剛被發掘,還有更多應用可期待。今天要介紹幾個有名的AI繪圖服務,如果想要挑戰自己寫code產生圖片,記得看到文章最後喔(你的coding 魂被燃燒起來了嗎?)
Thumbnail
本文探討大資料對模型的影響。研究指出,大資料量對模型的語法和世界知識理解有顯著影響。固定運算資源下,DeepMind發現適應參數數量更重要,這使模型Chinchilla以較小規模但更多訓練資料,在實際任務中優於Gopher模型。這說明增大模型的規模已不具有太大意義,應增加訓練資料。
Thumbnail
本文探討了大型語言模型中的特殊現象,包括頓悟現象,大模型的隱藏知識引導,以及模型越大對某些問題的理解越偏離的U型曲線。文章強調,當模型不夠理想時,我們需要更好地引導模型或了解問題的本質,而非只是增加模型的大小。
Thumbnail
去年底 ChatGPT 橫空出世,流暢的對答表現與驚人的資料統整力,讓人們震驚原來 AI 已經有如此超「人」能力。而 Midjourney 的出現,也讓很多人轉職成詠唱詩人,動動嘴就能畫好一幅畫(精準點說是打打鍵盤)。這些生成式AI 猛然打入人們的生活。
Thumbnail
去年阿財有分享過自動駕駛技術各個解決方案的路線選擇,當時我就有提到過我認為傳統車廠為什麼不走純視覺路線的可能原因,這邊再稍微分享一下: 首先在講純視覺之前先了解一下目前純視覺是如何計算深度的,目前用相機拍到的影像計算深度有單目視覺、雙目視覺、運動結構恢復(sfm)等再搭配AI模型,可以搜尋Pseud
2023年當紅的科技關鍵字,想必與「生成式AI」(AI-generated)脫不了關係;若不是生成式AI,那應該就是以它為主開發出的ChatGPT了。
Thumbnail
無論是疫情後的 PC 需求疲軟,或者是加密貨幣不再使用顯卡挖礦,都對 NVIDIA 的業績造成了巨大的影響。所幸,近期 NVIDIA 又搭上了一波新的風向,由生成式 AI 所帶動的 AI 應用熱潮,讓大家又開始對於 NVIDIA 的未來業績寄予厚望