50/100 小結與測驗-Autoencoder(自動編碼器) 🔄 壓縮數據,找出關鍵特徵,應用於異常檢測!

更新於 發佈於 閱讀時間約 10 分鐘

AI時代系列(1) 機器學習三部曲: 🔹 第一部:《機器學習 —— AI 智慧的啟航》


50/100 第五週:非監督學習


50. 小結與測驗-Autoencoder(自動編碼器) 🔄 壓縮數據,找出關鍵特徵,應用於異常檢測!


第 5 周 小結:非監督學習精華回顧


非監督學習強調**「不依賴標籤」,從大量資料中發現規律、結構與隱藏資訊**,是數據探索、資料壓縮和機器學習應用的重要基礎。


5.1 🎯 K-Means 聚類 快速分群,適合大數據 --- 客戶分群、圖像壓縮

5.2 🏗 階層式聚類 樹狀結構,顯示層級關係 --- 基因分析、族譜建構、商業分類

5.3 🔍 DBSCAN 密度為主,自動判斷群數 --- 空間數據分析、異常點偵測


5.4 📉 PCA 降維 保留最大變異,強化視覺化 --- 特徵萃取、資料壓縮

5.5 🎭 SVD 適合稀疏矩陣,強化推薦效果 --- 協同過濾、文本語意分析


5.6 🎨 GAN(生成對抗網路) AI 生成式學習,對抗訓練 --- 影像生成、語音合成

5.7 📚 LDA(主題模型) 文字主題挖掘,自動歸類 --- 新聞分群、論壇主題分析


5.8 🛍 Apriori / FP-Growth 發現購買習慣與關聯 --- 市場籃分析、推薦系統

5.9 🧠 SOM(自組織映射) 拓撲保留視覺化,自動分群 --- 客戶分群、模式識別


________________________________________

📝 第 5 章 測驗題(選擇題 / 問答)

________________________________________

📖 單選題


1️⃣ 以下哪個方法適合「自動找出資料密集區並偵測離群點」?


A. K-Means

B. PCA

✅ C. DBSCAN

D. GAN


✔ 答案解析: DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是基於密度的聚類方法,能有效偵測密集區和離群點。K-Means 無法處理離群點,PCA 主要用來降維,GAN 是生成模型。

________________________________________


2️⃣ 哪個技術會產生可視化的 U-Matrix?


A. K-Means

•✅ B. 自組織映射(SOM)

C. SVD

D. GAN


✔ 答案解析: 自組織映射(SOM)可以透過 U-Matrix(距離矩陣) 可視化,清楚呈現資料群聚和邊界,其他方法沒有 U-Matrix 這個概念。

________________________________________


3️⃣ Apriori 主要用在哪一個領域?


A. 圖像生成

✅ B. 市場籃分析

C. 客戶異常偵測

D. 語音合成


✔ 答案解析: Apriori 屬於關聯規則學習的經典演算法,主要用於「市場籃分析」找出購物行為中的關聯規則,典型案例如「買了尿布也會買啤酒」。

________________________________________


📖 問答題


1️⃣ 簡述 GAN 的生成器與判別器各自的角色與目標?


✅ 答案解析:


生成器(Generator, G):負責從隨機噪聲產生「逼真的假資料」來「欺騙」判別器。

判別器(Discriminator, D):負責判斷輸入的資料是真實的還是生成器產生的假資料。 👉 雙方對抗訓練,最終目標是讓生成器產出連判別器都無法辨別的高擬真資料。

________________________________________


2️⃣ LDA 如何從新聞文本中挖掘出隱藏的主題?請簡述流程。


✅ 答案解析:


LDA 假設每篇文章由多個潛在主題組成,每個主題由多個關鍵詞構成。


流程:

1. 建立詞袋模型(Bag of Words)

2. LDA 進行機率推斷,為每篇文章計算「主題分佈」

3. 產生主題-詞語分佈與文件-主題分佈


結果:可以知道哪些新聞屬於政治、科技、體育等主題。

________________________________________


Autoencoder(自動編碼器)基礎與實作


🌟 什麼是 Autoencoder?


一種 神經網路架構

屬於非監督學習

由「編碼器」和「解碼器」組成

功能:自動學習數據中的核心特徵,達到降維、壓縮與異常偵測

________________________________________

🧠 運作流程:


階段 說明

編碼(Encoder) 把高維資料壓縮成低維特徵

瓶頸層(Bottleneck) 最小特徵表示

解碼(Decoder) 嘗試還原原始資料

損失函數(Loss) 比較原始資料與重建資料的誤差(如 MSE)

________________________________________


💻 Python 範例(TensorFlow/Keras)


python


import numpy as np

from tensorflow.keras.models import Model

from tensorflow.keras.layers import Input, Dense

from tensorflow.keras.datasets import mnist

import matplotlib.pyplot as plt


# 載入數據

(x_train, _), (x_test, _) = mnist.load_data()

x_train = x_train.astype('float32') / 255.

x_train = x_train.reshape(-1, 28*28)

x_test = x_test.astype('float32') / 255.

x_test = x_test.reshape(-1, 28*28)


# 建構Autoencoder

input_img = Input(shape=(784,))

encoded = Dense(32, activation='relu')(input_img)

decoded = Dense(784, activation='sigmoid')(encoded)


autoencoder = Model(input_img, decoded)

autoencoder.compile(optimizer='adam', loss='mse')

autoencoder.fit(x_train, x_train, epochs=10, batch_size=256, shuffle=True, validation_data=(x_test, x_test))


# 測試重建效果

decoded_imgs = autoencoder.predict(x_test)


plt.figure(figsize=(10, 4))

for i in range(5):

# 原圖

plt.subplot(2, 5, i+1)

plt.imshow(x_test[i].reshape(28,28), cmap='gray')

plt.axis('off')

# 重建圖

plt.subplot(2, 5, i+6)

plt.imshow(decoded_imgs[i].reshape(28,28), cmap='gray')

plt.axis('off')

plt.show()

________________________________________


📈 Autoencoder 應用:


✅ 數據降維與壓縮

✅ 異常檢測(Reconstruction Error 高者為異常)

✅ 圖像去雜訊(Denoising Autoencoder)

✅ 特徵萃取

________________________________________


📌 結論與亮點


非監督學習不需標籤,善於發掘潛在結構與模式


從分群(KMeans、DBSCAN)、降維(PCA、SVD)、生成(GAN)、到推薦與關聯分析(Apriori)


Autoencoder 更是深度學習中非監督學習的重要技術,廣泛應用於工業異常偵測、資安和金融領域

________________________________________


📌 本章口號總結:


✅ 讓 AI 自己去探索、歸納、理解數據!

________________________________________




留言
avatar-img
留言分享你的想法!
avatar-img
Hansen W的沙龍
0會員
87內容數
AIHANS沙龍是一個結合AI技術實戰、產業策略與自我成長的知識平台,主題涵蓋機器學習、生成式AI、創業經驗、財務規劃及哲學思辨。這裡不只提供系統化學習資源與實作案例,更強調理性思維與行動力的結合。無論你是AI初學者、創業者,還是追求人生升維的行者,都能在這裡找到前進的方向與志同道合的夥伴。
Hansen W的沙龍的其他內容
2025/05/28
SOM透過競爭學習與鄰域更新,把高維資料映射至2D網格並維持拓撲,可一眼看出群落、邊界與異常。無需標籤,特別適合客戶分群、金融風險、基因與市場行為探索,並支援降維與特徵萃取,U-Matrix視覺化使模式更直觀,是快速理解資料隱藏結構的神經網路利器。
Thumbnail
2025/05/28
SOM透過競爭學習與鄰域更新,把高維資料映射至2D網格並維持拓撲,可一眼看出群落、邊界與異常。無需標籤,特別適合客戶分群、金融風險、基因與市場行為探索,並支援降維與特徵萃取,U-Matrix視覺化使模式更直觀,是快速理解資料隱藏結構的神經網路利器。
Thumbnail
2025/05/28
Apriori逐層掃描,FP-Growth以FP-Tree壓縮,大幅加速挖掘購物籃規則。透過支持度、信賴度、提升度,快速找出「買A也買B」的黃金組合,優化推薦與行銷策略,並支援交叉銷售、庫存佈局及客群洞察,驅動精準營銷與利潤提升。
Thumbnail
2025/05/28
Apriori逐層掃描,FP-Growth以FP-Tree壓縮,大幅加速挖掘購物籃規則。透過支持度、信賴度、提升度,快速找出「買A也買B」的黃金組合,優化推薦與行銷策略,並支援交叉銷售、庫存佈局及客群洞察,驅動精準營銷與利潤提升。
Thumbnail
2025/05/28
LDA 主題模型宛如無師自通的內容編輯,可在龐大文本中自動抽取「隱藏主題」與關鍵詞,輸出文章-主題及主題-詞權重分佈,助你快速完成新聞分類、輿情監測與自動標籤。結合 TF-IDF 前處理與 pyLDAvis 視覺化,能進一步提升解析深度與趨勢洞察力。
Thumbnail
2025/05/28
LDA 主題模型宛如無師自通的內容編輯,可在龐大文本中自動抽取「隱藏主題」與關鍵詞,輸出文章-主題及主題-詞權重分佈,助你快速完成新聞分類、輿情監測與自動標籤。結合 TF-IDF 前處理與 pyLDAvis 視覺化,能進一步提升解析深度與趨勢洞察力。
Thumbnail
看更多
你可能也想看
Thumbnail
介紹朋友新開的蝦皮選物店『10樓2選物店』,並分享方格子與蝦皮合作的分潤計畫,註冊流程簡單,0成本、無綁約,推薦給想增加收入的讀者。
Thumbnail
介紹朋友新開的蝦皮選物店『10樓2選物店』,並分享方格子與蝦皮合作的分潤計畫,註冊流程簡單,0成本、無綁約,推薦給想增加收入的讀者。
Thumbnail
當你邊吃粽子邊看龍舟競賽直播的時候,可能會順道悼念一下2300多年前投江的屈原。但你知道端午節及其活動原先都與屈原毫無關係嗎?這是怎麼回事呢? 本文深入探討端午節設立初衷、粽子、龍舟競渡與屈原自沉四者。看完這篇文章,你就會對端午、粽子、龍舟和屈原的四角關係有新的認識喔。那就讓我們一起解開謎團吧!
Thumbnail
當你邊吃粽子邊看龍舟競賽直播的時候,可能會順道悼念一下2300多年前投江的屈原。但你知道端午節及其活動原先都與屈原毫無關係嗎?這是怎麼回事呢? 本文深入探討端午節設立初衷、粽子、龍舟競渡與屈原自沉四者。看完這篇文章,你就會對端午、粽子、龍舟和屈原的四角關係有新的認識喔。那就讓我們一起解開謎團吧!
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
Thumbnail
人工智慧是什麼? 人工智慧(Artificial Intelligence, AI) 簡單來說,就是讓機器模仿人類的思考、學習和決策的能力。它就像是一個聰明的電腦程序,可以執行許多原本需要人類智慧才能完成的工作,例如: 語音辨識: 讓電腦聽懂人類的語言,像是 Siri、Google As
Thumbnail
人工智慧是什麼? 人工智慧(Artificial Intelligence, AI) 簡單來說,就是讓機器模仿人類的思考、學習和決策的能力。它就像是一個聰明的電腦程序,可以執行許多原本需要人類智慧才能完成的工作,例如: 語音辨識: 讓電腦聽懂人類的語言,像是 Siri、Google As
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
Thumbnail
AI的世界充滿了創新和潛力,涵蓋了許多領域,包括但不限於機器學習,自然語言處理、電腦視覺和機器人技術。AI對人類社會的影響是複雜而多層面的,既帶來了巨大的機遇,也提出了新的挑戰。社會需要在技術發展和倫理規範之間找到平衡,確保AI技術的應用能夠真正造福人類。
Thumbnail
AI的世界充滿了創新和潛力,涵蓋了許多領域,包括但不限於機器學習,自然語言處理、電腦視覺和機器人技術。AI對人類社會的影響是複雜而多層面的,既帶來了巨大的機遇,也提出了新的挑戰。社會需要在技術發展和倫理規範之間找到平衡,確保AI技術的應用能夠真正造福人類。
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
科技發達,AI智能也越來越發達。 蠢孩子,我每篇小說的圖片都是用AI製作的唷!!
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
最新的AI趨勢讓人眼花撩亂,不知要如何開始學習?本文介紹了作者對AI的使用和體驗,以及各類AI工具以及推薦的選擇。最後強調了AI是一個很好用的工具,可以幫助人們節省時間並提高效率。鼓勵人們保持好奇心,不停止學習,並提出了對健康生活和開心生活的祝福。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
數位化時代中,人工智能(AI)已成為推動創新和進步的關鍵力量。本文探討AI的現狀、挑戰以及未來可能性,並提出負責任地發展和使用AI的思考。
Thumbnail
AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域,包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性,還可解決複雜的問題和挑戰。
Thumbnail
AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域,包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性,還可解決複雜的問題和挑戰。
Thumbnail
2023年被世人稱做生成式AI世代的元年,各式各樣的AI工具不斷湧現,改變了人們的生活。本文將詳細介紹人工智慧和機器學習的相關知識,以及各種人工智慧和機器學習的實現方法。
Thumbnail
2023年被世人稱做生成式AI世代的元年,各式各樣的AI工具不斷湧現,改變了人們的生活。本文將詳細介紹人工智慧和機器學習的相關知識,以及各種人工智慧和機器學習的實現方法。
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News