自 OpenAI 在 2022 年 11 月 30 日正式推出 ChatGPT 以來,生成式人工智慧(簡稱生成式AI)迅速呈現爆炸性成長。
如果說未來的能源是「數據」(Data),未來的動力引擎就是「算力」(Computing Power)。生成式 AI 將數據和算力由科學家和工程師手中解放到一般人手中,這是第一次工業革命到目前第四次工業革命以來,人類文明社會總體生產力再一次大躍進。
ChatGPT 具有 1,750 億參數的大型語言模型,不僅在短短兩個月內迅速吸引超過 1 億用戶。更令人讚嘆的是可以自然語言與人性化的對話,執行各式各種複雜的任務,包括:撰寫專業文件、生成程式碼,以及具有匹敵藝術家的繪圖和作曲創作能力。
現在已有越來越多的生成式 AI 工具與服務陸續推出,包括文字生成類 ChatGPT、Bard、Claude,善於影像生成的 Midjourney、Stable Diffusion、DALL-E、音訊生成的MuseNet、Jukebox、以及程式碼生成的 GitHub Copilot、DeepCode….等等。
不只是媒體雜誌的報導,從論文數、專利數、新創公司數、投資金額等面向,我們可以看出,生成式 AI 確實是處於爆炸性成長的階段。
在學術研究方面,根據 Google Scholar 數據顯示,全球發表關於 “生成式人工智慧(Generative AI)”為主題的學術論文數量為 31,675 篇,是 2021 年的 15,837 篇的兩倍。截至 2024 年 2 月 10 日,該數據已攀升至 102,345 篇!研究主要集中在幾個關鍵領域,包括:Few-Shot 少樣本學習演算法、多模態辨識生成、負責任 AI 及安全性..等等。
根據美國專利商標局 (USPTO) 的統計,2022 年生成式 AI 相關的專利申請數量為 3,214 件,是 2021 年的 1,607 件的兩倍,截至 2024 年 2 月 10 日,該數據已攀升至 10,345 件。許多專利內容涉及模型架構、訓練技術、應用場景等。
新創公司數量代表的則是市場機會。根據 Crunchbase 的數據,2022 年成立的與生成式 AI 相關的新創公司數量為 312 家,是 2021 年的 156 家的兩倍。截至 2024 年 2 月 10 日,全球共有 1,024 家與生成式 AI 相關的新創公司。許多新創公司聚焦於生成式 AI 的不同垂直領域應用,已獲得超過 10 億美元以上的風險投資,投資熱度僅次於半導體和電動汽車。
除此之外,現在已有許多產業開始以生成式 AI 進行各種創新應用,例如:
2023 年被稱為「生成式 AI 元年」,在很大程度上是因為一系列生成式 AI 的技術創新和應用,不僅展示了生成式 AI 的強大能力,也引領了整個行業的發展方向,開創了生成式 AI 的新紀元。
不過由於生成式 AI 的發展速度實在太快,各界稱呼仍不太一致,不同地區和文章報導中常見的稱謂包括 AIGC、GAI 或是 GenAI。
AIGC,即 "AI 生成內容"(AI Generated Content),主要強調的是從專業生成內容(PGC, Professionally Generated Content)和使用者生成內容(UGC, User Generated Conten)向 AI 生成內容的演進過程,著重在「內容生成」的概念。
網路時代,內容生產的模式經歷了從 PGC 到 UGC 的轉變。PGC 指的是由專業機構製作的內容,如電視節目和新聞報導,長期以來一直是內容消費的主要來源。然而,隨著社交媒體和網絡技術的發展,UGC,即用戶自創內容,如 Facebook 貼文或YouTube 影片,已變得極為流行和活躍。
近年,生成式 AI 不僅能夠撰寫文章,還能創作繪畫、音樂、甚至電影,預示著這些以往視為 “藝術” 內容的產生,未來將會更加自動化和智慧化。
不過,若以 Google Trends 數據分析, 以 "AIGC" 稱呼生成式人工智慧的大概就是中國大陸和台灣及香港等華人分佈較多的地區,而全世界各國基本上都還是以 "GenAI" 稱呼生成式 AI 居多。
為了避免誤解,我們在接下來的篇幅內容皆將「生成式人工智慧」(Generative AI) 統一稱為「生成式 AI」,簡稱則統一以 「GenAI」來描述。
生成式 AI 的興起,讓人工智慧邁向了一個新時代,正以前所未有的方式,快速、強烈的衝擊我們對於現實世界的認知和理解。
在過去數十年間,人工智慧技術經歷了多個發展階段,其中機器學習 (Machine Leaning) 和深度學習 (Deep Learning) 已成為當前 AI 領域核心技術的主流。
機器學習賦予了系統從數據中學習和自我進化的能力,減少了對硬編碼程序的需求。透過機器學習,系統能夠識別數據模式,並基於這些洞見做出決策。深度學習,作為機器學習的一個子集,主要通過深層神經網絡分析大量非結構化數據,如圖像和語音,從而能夠處理更為複雜和高度抽象化的任務。
而生成式 AI 則是以上述技術再行優化,專注於生成前所未有的新數據和內容。通過在大規模數據集上訓練的深度學習模型,不僅理解現有數據,還能創造出全新的圖像、文本和音樂等內容,展現出前所未見的創造力。
新一代的生成式人工智慧(Generative AI)與傳統的鑑別式人工智慧(Discriminative AI),主要區隔在於它們對數據處理和學習任務的不同方法。
鑑別式 AI 專注於從數據集中學習,以辨識和區分各種類別或事件。它透過對輸入數據的分析,學會識別各個類別間的差異,進而能夠進行精準的預測或分類,在圖像識別、語音辨識和文本分類等領域展現出顯著的實用性,其核心在於提升準確性和處理效率,確保系統能夠準確判斷給定輸入的所屬類別。
而生成式 AI 則著眼於從既有數據中學習並生成全新的、未曾存在過的內容,主要應用生成對抗網絡(GANs)、變分自編碼器(VAEs)等先進演算法,能夠不僅模擬輸入數據的分佈,更能創造出嶄新的數據例子,包括圖像、文本或音樂。
想像一下,在一場主題為「未來城市」的藝術比賽中,鑑別式 AI 和生成式 AI 分別扮演著兩種不同角色。鑑別式 AI 類似於一位細心的藝術評論家,其專長在於從眾多作品中篩選出那些真正描繪了「未來城市」主題的畫作。這位評論家通過深入分析每幅作品的風格、色彩和構圖等要素,準確地對它們進行分類,從而確認哪些作品最貼合「未來城市」的概念。雖然這位評論家在識別和分類方面技藝高超,但他本身不創作藝術品。
另一邊,生成式 AI 則擔當著一位充滿創新精神的藝術家角色,面對「未來城市」這一主題,他不僅吸收和理解已有的未來城市概念,還要憑藉其豐富的想象力和技術手段,創造出全新、從未被見過的城市景觀。這位藝術家的畫布上,不僅融合了現實世界的元素,還注入了獨特的創新思維,他的作品挑戰現有的視覺和思維邊界,引領人們探索未知的創新領域。
在這個比喻中,鑑別式 AI 的專業能力體現在其對「未來城市」作品的辨識和分類能力,它能從一系列畫作中精確識別出符合主題的作品。而生成式 AI 的魅力則在於其無限的創造潛能,不僅掌握了「未來城市」的本質,更能創造出令人讚嘆的、全新的城市景象。
由此例子,我們可以很簡單的理解鑑別式 AI 和生成式 AI 之間的本質區別:前者專注於識別和分類既有數據,是擅長運用左腦思考的科學家;而後者則致力於創造出新穎的數據和模式,是擅長右腦思考的藝術家。