一、什麼是生成式AI(Generative AI;Gen AI)
生成式AI(Generative AI;Gen AI)是一種能「自動創造」新內容的AI。它不只是被動回應,而是根據你的指令、問題或描述,自己產生出從沒出現過的文字、圖片、聲音、音樂、影片等內容
生活實例:
- 使用ChatGPT請它寫故事、改作文、撰寫摘要,AI根據你的問題,新創造出一段你沒見過的文字內容
- 使用Midjourney、DALL-E等AI繪圖工具,只要輸入關鍵字,AI馬上畫出完全沒出現在現實的藝術圖片
- 工作中需要寫報告、做PPT、整理重點,透過NotebookLM將所有資料來源綜整摘要,輸入到Gamma,就可以自動產生PPT
- 只要輸入文字、網址、PPT、PDF,FlexClip就可以自動生成短影片
二、生成式AI(Generative AI;Gen AI)特色
1.生成內容多元且具創意
一開始的時候Gen AI只能生成文字,現在除了生成文字以外,Gen AI還能生出圖片、音樂、程式碼、影片、簡報等適用許多創作型應用2.詢問一模一樣問題,每次回覆內容可能會不同
即使你重複向Gen AI(像ChatGPT)問完全一樣的問題,它所產生的答案常常會有差異,文字內容、用詞、結構不盡相同。這是因為生成式AI在作答時會根據機率(和隨機性)來組句,不會像傳統搜尋或資料庫每次只給你一模一樣的答覆,讓每次互動都充滿多樣性與創意
3.AI不僅會不準,還會胡說八道
AI可能會一本正經、真心不騙地告訴你一個錯誤的答案,結果根本在胡說八道,這種現象就是所謂的 AI幻覺(Hallucination),在生成式 AI 現有的技術尚無法避免,這也是為什麼,在萬物皆 AI 的時代,了解AI幻覺非常重要
4.具備「短期記憶」功能
早期的Gen AI並不具備記憶功能,但現在的生成式AI通常有「對話上下文」記憶。在一個對話中,AI會根據你和它之前的提問 vs 回覆內容作推理
例如你先問A,接著說「再請重述一次」,AI能知道你指的是前面提過的A。但這種記憶只侷限在當次對話範圍,一旦重新開始一個新對話,「記憶」就會重設
5.多模態能力
最新的Gen AI不只會處理文字,還能同時處理圖像、語音、影片、PDF等多種形態資料以附件形式上傳,可以同時輸入圖片和問題,讓AI分析圖上內容,再以語言回覆你,或是幫你把文字轉成影音、把語音轉成文字,應用更加多元
6.即時更新與外部資料連結
新的Gen AI有些對超過模型訓練資料以外的提問,會自動對網頁進行搜索比對,讓回答更貼近實際需求,簡單來說就是現在的LLM已轉變成LLM+搜尋引擎,例如Perplexity、ChatGPT
7.Gen AI回答總是很有溫度
Gen AI系統上被設定不能說出「不適當的回答」,包括暴力內容、歧視或偏見言論、不實、誤導性資訊(假消息)、情色、具有煽動或攻擊性的言詞等
所以Gen AI 就像是溫暖小天使,越來越多使用者將生成式AI當成數位心理陪伴來聊天、紓壓,且科技演變下後續Gen AI會有長期記憶功能,它根據你的對話習慣、問題、喜好調整溝通方式,愈來愈像真正懂你的sweet heart
8.專用型AI愈來愈多,模型專長也不太一樣
通用型AI模型(General AI Model),指被設計來處理「各種類型問題」的大型AI模型,訓練過程使用極大量、多領域、多主題的資料
專用型AI模型(Domain-specific AI Model),為特定領域或專業任務「量身打造」的AI,特定領用可能是醫療、財金、法律等,專業任務可能是邏輯推理、數學計算、程式除錯
專業任務
例如OpenAI語言模型主要分類:
1.GPT系列(GPT-4o、GPT-4、GPT-4.5、GPT-4o mini等)
屬於「通用型模型」,強調多模態(文字、聲音、圖像)、回應靈活、可應付一般問答、聊天、內容生成、即時對話等應用
2.o系列(o1、o3-mini、o4-mini等)
屬於「推理/專業型模型」,特別針對邏輯推理、多步決策、數學運算、科學計算、程式設計、專業分析等有更高精準度與細緻度
特定領域
例如SIERRA用在各式客服機器人,Hebbia AI用在法律財務等,這類型的AI就會有特定專業領域的知識與使用特性
延伸閱讀:
1. AI胡說八道的背後:大語言模型(LLM)幻覺率排行與你必知的防範方法