人工智慧(Artificial Intelligence, AI) 這個名詞近年來無處不在,從科幻電影到日常應用,AI 都扮演著越來越重要的角色。但 AI 到底是什麼?它包含了哪些技術?跟著我進入AI世界。首先先把最常聽到的幾個關鍵詞有系統地做個解釋,有助於後續的學習,如果對於以下內容的說明仍然不能明白的,歡迎留言發問。
1. 機器學習(Machine Learning)
- 定義: 讓電腦系統從大數據中自主學習,而不需明確地被編寫程式來執行特定任務。
- 進一步區分:
- 監督學習(Supervised learning):從有標籤的數據中學習,例如垃圾郵件分類。
- 無監督學習(Un-supervised learning):從無標籤的數據中尋找模式,例如客戶分群。
- 強化學習(Reinforcement learning):通過與環境互動,學習最佳的行動策略,例如 AlphaGo。
2. 深度學習(Deep Learning)
- 定義: 機器學習的一個分支,模仿人腦的神經網絡,來學習複雜的模式。
- 應用:圖像辨識: 人臉辨識、物體偵測。 自然語言處理: 機器翻譯、語音辨識。 生成模型: 生成圖像、音樂。
3. 類神經網絡(Artificial Neural Network)
- 定義: 模仿人腦結構,由許多互相連接的節點組成,用來處理資訊。
4. 卷積神經網路(Convolutional Neural Network, CNN)
- 定義: 一種特殊的神經網絡,擅長處理圖像數據。
- 應用:圖像分類、物體偵測、圖像分割 等。
5. 生成對抗網路(Generative Adversarial Network, GAN)
- 定義: 由兩個神經網絡組成,一個生成器和一個判別器,透過不斷的競爭,生成逼真的數據。
- 應用:生成圖像、影片,例如 Deepfakes。數據增強。
6. 擷取擴增生成RAG (Retrieval-Augmented Generation)
- 定義: 一種結合了資訊檢索和生成模型的技術,讓 AI 能夠從大量文本中找到相關資訊,並生成具有資訊性的回應。
- 應用:聊天機器人、問答系統。
7. 大語言模型LLM(Large Language Model)
- 定義: 在海量文本數據上訓練出來的模型,能夠生成人類水平的文本。
- 定義: 由 OpenAI 開發的一款大型語言模型,能夠進行流暢且富有邏輯的對話,完成各種文本生成任務。
- 定義: 由 Meta(Facebook母公司)開發的大型語言模型,在開放原始碼的基礎上進行訓練,旨在促進 AI 研究。
- 定義: 由 Google 開發的最新一代大型語言模型,強調多模態能力,能夠處理文本、圖像、音訊等多種形式的數據。
總結
這 10 個關鍵詞是了解 AI 的基礎,你可自行再去針對這十個關鍵詞做更深度的了解,將有助於未來對於AI領域的學習。希望這篇文章能幫助你開啟AI學習之旅!
如果你還想深入了解哪個關鍵詞,也可以在下方留言詢問,我再以最白話的方式為你提供詳細解釋。
補充說明:
- Llama: 雖然Llama是開源模型,但其性能在某些方面接近甚至超越了ChatGPT-4o。
- Gemini: 作為 Google 的最新力作,Gemini 強調多模態能力,有望在 AI 領域帶來新的突破。
- 市場上還有許多公司團體努力在推出自家的大語言模型LLM,這我稍後再以另一篇文章來列舉說明。