AI相關學習 簡報+教材+網路資料 重點整理(專有名詞篇) CCChen 20250124
分析文件: AI三日班 簡報+教材+網路資料
分析工具: NotebookLM
使用提示詞:
根據來源所有文件內容, 提供一份表格化資料彙整, 共需要7大主題(人工智慧AI+機器學習ML+電腦視覺CV+深度學習DL+自然語言處理NLP+大規模語言模型LLM+生成式AI), 每個主題需要10個核心重要專有名詞, 表格格式: 第一格為主題, 第二格為專有名詞(英文+中文+縮寫), 第三格為專有名詞的重點說明(100字內)
根據您提供的所有文件內容,我將整理一份表格,包含七大主題(人工智慧AI、機器學習ML、電腦視覺CV、深度學習DL、自然語言處理NLP、大型語言模型LLM、生成式AI),每個主題列出10個核心重要專有名詞,並提供重點說明。
主題 (Theme) 專有名詞 (Key Terms) 重點說明 (Key Explanations)
人工智慧 (AI)
1. Artificial Intelligence (AI) 人工智慧
廣泛的概念,指讓機器具備像人類一樣的智慧能力,包括學習、推理、問題解決等。目標是使機器能夠執行通常需要人類智能才能完成的任務。1...
2. Weak AI (Weak AI, Narrow AI) 弱人工智慧
也稱為應用型人工智慧 (applied AI),指專注於執行特定任務的人工智慧,例如語音辨識或圖像分類。目前大多數的AI應用都屬於弱人工智慧。4...
3. Strong AI (Strong AI, General AI) 強人工智慧
也稱為通用人工智慧(AGI),指具有像人類一樣的廣泛認知能力的人工智慧,能夠從經驗中學習,並在不同領域中應用知識。目前尚未實現。4...
4. Responsible AI 負責任人工智慧
以安全、可靠和道德的方式開發、評估和部署AI系統的方法。強調公平性、可靠性、安全性、隱私、包容性、透明度和問責性。6...
5. AI Ethics 人工智慧倫理
探討AI發展與應用所涉及的道德和社會問題,包括偏見、隱私、歧視和責任等。目的是確保AI的發展符合倫理規範,並對社會有益。10
6. AI Governance 人工智慧治理
制定AI政策、法規和標準的過程,以確保AI的發展和應用符合法律和倫理要求。包括風險管理、透明度、問責制和監管。11
7. AI Safety 人工智慧安全
確保AI系統在各種情況下都能安全可靠地運作。包括防止AI被濫用,保護AI系統免受攻擊,以及應對AI帶來的潛在風險。10
8. Data Privacy 資料隱私
保護個人資料不被未經授權的存取、使用或洩露。在AI應用中,需要確保AI系統符合相關的隱私法規,尊重個人資料的自主權。12...
9. AI Bias 人工智慧偏見
AI系統在訓練或使用過程中,可能產生的不公平或歧視性的結果。偏見可能來自於訓練數據、演算法或系統設計。需要採取措施減輕偏見,確保AI系統的公平性。1...
10. AI Transparency 人工智慧透明度
AI系統的決策過程應該是可理解和可解釋的。這有助於建立對AI系統的信任,並識別潛在的問題,包括效能問題、公平性問題或非預期的結果。14
機器學習 (ML)
1. Machine Learning (ML) 機器學習
AI的一個分支,使電腦能夠從數據中學習,而無需明確的程式設計。透過演算法分析資料,學習模式,並做出預測或決策。1...
2. Supervised Learning 監督式學習
使用標記的數據來訓練模型,學習輸入和輸出之間的關係。模型會根據訓練資料的結果來調整參數。15...
3. Unsupervised Learning 非監督式學習
使用未標記的數據來訓練模型,模型會自行學習數據中的隱藏結構或模式,例如分群、降維等。15...
4. Reinforcement Learning 增強式學習
讓模型透過與環境互動來學習,並根據環境的回饋來調整行為。模型會透過獎勵和懲罰來學習最佳策略。15...
5. Training Data 訓練資料
用於訓練機器學習模型的數據集。模型會從訓練資料中學習數據中的模式和關係,以便進行預測或決策。18...
6. Feature 特徵
用來描述數據的變數或屬性。在機器學習中,特徵是用於訓練模型的輸入。好的特徵可以提高模型的效能。16...
7. Algorithm 演算法
用於訓練機器學習模型的計算方法,根據訓練資料調整模型的參數,讓模型能夠學習數據中的模式,並做出預測或決策。16
8. Model 模型
機器學習的輸出,是一個數學函數或算法,可以用來根據輸入數據進行預測或決策。模型是學習的結果,可以根據輸入進行預測。16
9. Overfitting 過度擬合
模型過於複雜,以至於過度學習了訓練數據的細節,導致模型在測試數據上的效能表現不佳。泛化能力較差。20...
10. Underfitting 欠擬合
模型過於簡單,以至於無法捕捉數據中的模式,導致模型在訓練數據和測試數據上的效能都表現不佳。模型未能從訓練數據中學習到有用的資訊。20
電腦視覺 (CV)
1. Computer Vision (CV) 電腦視覺
AI的一個領域,使電腦能夠從圖像或影片中提取有用資訊,模擬人類視覺系統,讓機器能夠“看見”、理解和解釋視覺資訊。19...
2. Image Recognition 圖像識別
辨識圖像中的物體、人物、場景等。是電腦視覺的基本任務,透過深度學習模型,可以對圖像中的內容進行分類和識別。22...
3. Object Detection 物件偵測
在圖像中找出特定物體的位置和類別。不只識別圖像中有什麼,還會標出位置,如邊界框。常用於自動駕駛、安防監控等。22...
4. Image Segmentation 圖像分割
將圖像分割成不同的區域或對象,精確標示出每個對象的邊界。可用於醫療影像分析、自動駕駛、圖像編輯等。22
5. Feature Extraction 特徵提取
從圖像中提取有用的特徵,例如邊緣、紋理、顏色等。特徵是圖像的表示,可以用於後續的圖像識別、物件偵測等任務。24...
6. Convolutional Neural Network (CNN) 卷積神經網路
深度學習中用於處理圖像數據的常用架構。透過卷積和池化操作,提取圖像中的局部特徵。在圖像分類、物件偵測等任務中表現出色。24...
7. Image Classification 圖像分類
將圖像分類到不同的預定義類別中。例如將圖像分類為貓、狗、鳥等。是電腦視覺的基本任務。17
8. Image Annotation 圖像標註
在圖像上標記出物件的位置或類別。標註是訓練電腦視覺模型的重要步驟,提供模型學習的基礎。23
9. Edge Detection 邊緣偵測
找出圖像中物體邊緣的過程。邊緣是圖像中重要的視覺特徵,可用於圖像分割、物件偵測等任務。
10. Image Analysis 圖像分析
對圖像進行各種處理和分析,提取有用的資訊,包括圖像識別、物件偵測、圖像分割等。目的是從圖像中提取有價值的資訊,並用於不同的應用。25
深度學習 (DL)
1. Deep Learning (DL) 深度學習
機器學習的一個分支,利用多層神經網路來學習數據中的複雜模式。擅長處理大量數據,能夠自動提取特徵,在許多領域取得突破性進展。1...
2. Artificial Neural Network (ANN) 人工神經網路
深度學習的基礎模型,由大量互相連接的神經元組成。模擬人腦的學習過程,透過多層次的非線性轉換,學習數據中的複雜模式。26...
3. Neuron 神經元
人工神經網路的基本單位,模擬生物神經元的功能,接收輸入訊號、進行處理,並產生輸出訊號。每個神經元都有權重和偏差值。26...
4. Activation Function 激活函數
為神經元引入非線性,使神經網路能夠學習更複雜的模式。常用的激活函數包括Sigmoid、ReLU、Tanh等。26...
5. Convolutional Neural Network (CNN) 卷積神經網路
擅長處理圖像數據的深度學習模型,透過卷積和池化操作,提取圖像特徵。廣泛應用於圖像識別、物件偵測等任務。24...
6. Recurrent Neural Network (RNN) 遞迴神經網路
擅長處理序列數據的深度學習模型,透過循環連接,捕捉序列數據中的時間依賴性。常用於自然語言處理、語音識別等任務。24...
7. Long Short-Term Memory Network (LSTM) 長短期記憶網路
RNN的一種變體,能夠更好地處理長期依賴性。克服了RNN在處理長序列時的梯度消失問題,在自然語言處理等領域中應用廣泛。24...
8. Autoencoder 自編碼器
用於學習數據的低維度表示的深度學習模型,可以用於降維、去噪等任務。包含編碼器和解碼器兩部分。24
9. Generative Adversarial Network (GAN) 生成對抗網路
用於生成新數據的深度學習模型,例如圖像、文本等。由生成器和判別器組成,透過對抗訓練的方式,生成逼真的數據。15...
10. Gradient Descent 梯度下降
用於更新模型參數的優化算法,透過迭代更新參數,使損失函數達到最小值。是深度學習中常用的訓練方法。28
自然語言處理 (NLP)
1. Natural Language Processing (NLP) 自然語言處理
AI的一個領域,讓電腦能夠理解、解釋和生成人類語言。包括語音識別、機器翻譯、文本生成等技術,目的是使機器能夠以自然、流暢的方式與人類進行交流和互動。22...
2. Text Classification 文本分類
將文本分類到不同的預定義類別中,例如將新聞文章分類為體育、政治、娛樂等。是自然語言處理的基本任務。31
3. Machine Translation 機器翻譯
將一種語言的文本自動翻譯成另一種語言。機器翻譯技術在近年來取得了顯著進展,廣泛應用於跨語言交流。22...
4. Speech Recognition 語音辨識
將語音轉換為文本的技術。是語音助理、語音輸入等應用的基礎,近年來透過深度學習技術取得了巨大進步。22...
5. Sentiment Analysis 情感分析
分析文本中的情感傾向,例如正面、負面或中性。可用於客戶反饋分析、輿情監控等。23...
6. Named Entity Recognition (NER) 命名實體識別
識別文本中的命名實體,例如人名、地名、組織機構名等。是資訊提取和知識圖譜的基礎技術。19
7. Language Model 語言模型
用於處理和生成自然語言文本的重要技術,透過學習大量文本數據,預測文本中下一個詞語的機率。30
8. Text Summarization 文本摘要
從長文本中提取關鍵資訊,生成簡短的摘要。有助於快速了解文本內容,提高資訊處理效率。31
9. Text Generation 文本生成
使用AI模型生成自然語言文本,例如文章、對話、故事等。是生成式AI的核心技術。30
10. Tokenization 斷詞
將文本分解成單詞或詞組的過程。是自然語言處理的預處理步驟,將文本轉換為模型可以處理的數據格式。
大型語言模型 (LLM)
1. Large Language Model (LLM) 大型語言模型
基於深度學習的大型語言模型,在大量文本數據上訓練而成,具有理解和生成自然語言的能力。例如GPT系列、LaMDA等。10...
2. Transformer 轉換器
一種神經網路架構,是現代自然語言處理的核心架構,透過注意力機制,提升了模型在處理長序列文本的能力,如GPT、BERT等模型都基於此架構。31...
3. Pre-training 預訓練
在大量未標記數據上訓練模型的過程,使模型學習通用的語言知識,為後續的微調奠定基礎。是大型語言模型訓練的關鍵步驟。37
4. Fine-tuning 微調
在特定任務的標記數據上調整預訓練模型的參數,使模型適應特定任務,提高模型在特定任務上的表現。37...
5. Prompt Engineering 提示工程
設計有效的提示詞,以引導大型語言模型產生期望的輸出。是使用大型語言模型的關鍵技能,能提高模型輸出結果的準確性和相關性。39
6. Context Window 上下文窗口
模型可以處理的輸入文本長度。大型語言模型的上下文窗口大小直接影響模型能夠處理的文本長度。40
7. Zero-shot Learning 零樣本學習
在沒有任何特定任務的訓練數據的情況下,模型也能夠執行特定任務的能力。是大型語言模型的重要特性,展示了模型强大的泛化能力。
8. Few-shot Learning 少樣本學習
模型只需少量的訓練數據,就能夠執行特定任務的能力。是大型語言模型的重要特性,降低了模型訓練所需的數據量。
9. Chain of Thought (CoT) 思維鏈
一種提示工程技巧,透過引導模型逐步思考,提升模型解決複雜問題的能力。37
10. Instruction Fine-tuning 指令微調
使用指令數據來微調大型語言模型,使模型能夠更好地遵循指令,提高模型在不同任務中的表現。37
生成式AI (Generative AI)
1. Generative AI 生成式AI
一類AI模型,能夠生成新的、類似於人類創作的內容,包括文本、圖像、音訊、影片、程式碼等。是近年來AI領域的熱點。3...
2. Large Language Model (LLM) 大型語言模型
生成式AI的基礎模型,經過大量文本數據訓練,能夠產生自然流暢的文本。是生成式AI的核心技術,例如ChatGPT、Bard等。10...
3. Diffusion Model 擴散模型
一種用於圖像生成的深度學習模型,透過逐步增加噪音到圖像中,然後反向去除噪音來生成新的圖像。43
4. Generative Adversarial Network (GAN) 生成對抗網路
另一種用於圖像生成的深度學習模型,透過生成器和判別器之間的對抗訓練,生成逼真的圖像。24...
5. Text-to-Image Generation 文本到圖像生成
使用AI模型,根據文本描述生成圖像的技術。例如DALL-E、Midjourney等,廣泛應用於設計、藝術等領域。30...
6. Text Generation 文本生成
使用AI模型生成自然語言文本,例如文章、對話、故事等。是生成式AI的重要應用領域。30
7. Code Generation 程式碼生成
使用AI模型生成程式碼,提升程式開發效率。例如GitHub Copilot等。42
8. Deepfake 深度偽造
使用AI模型生成的虛假圖像或影片,可能用於欺騙、誤導或惡意目的。是生成式AI帶來的潛在風險。35...
9. Data Augmentation 資料增強
使用AI技術生成新的訓練數據,以提高模型的泛化能力。是訓練深度學習模型的重要技巧。
10. Model Explainability 模型可解釋性
了解生成式AI模型如何產生輸出的能力,以便識別潛在的偏差和錯誤。是負責任AI的重要組成部分。12...
以上 分享 CCChen