iPAS-初級AI應用規劃師-機器學習基本原理

更新於 發佈於 閱讀時間約 4 分鐘

什麼是機器學習?從基本原理說起

機器學習(Machine Learning)是一種讓電腦從資料中學習並改進表現的技術,而無需人類逐一編寫具體指令。想像一下,你教一個小孩認識「貓」和「狗」,不是直接告訴他每張圖片的答案,而是給他看許多例子,讓他自己找出規律。


這個想法最早由Arthur Samuel在1959年提出。他開發了一個國際象棋程式,通過反覆對弈,讓程式自己學會更好的下棋策略。後來,Tom M. Mitchell在1997年的《Machine Learning》一書中給出了經典定義:「如果一個電腦程式能從經驗(E)中學習,針對某些任務(T),並以性能(P)來評估,當經驗(E)增加時,它在任務(T)上的表現也隨之提升,這就是機器學習。」

這個定義包含三個關鍵要素:

  • 經驗(E):資料或互動,例如圖片、交易記錄。
  • 任務(T):具體目標,例如分類圖片或預測房價。
  • 性能(P):衡量標準,例如準確率或錯誤率。


機器學習的四大類型:

1. 監督學習(Supervised Learning)

監督學習就像有個老師在旁邊指導。它使用帶標籤的資料(輸入和正確輸出)來訓練模型,讓模型學會預測或分類。例如,給模型看標記為「垃圾郵件」或「非垃圾郵件」的電子郵件,讓它學會分辨新郵件,精度高,但需要大量標記資料,成本不低。

  • 訓練步驟:
  1. 標記訓練資料並定義輸出變數。
  2. 將資料用於演算法訓練,學習輸入與輸出之間的關聯。
  3. 訓練好模型後輸入新資料,模型即可預測輸出變數。
  • 使用時機:
    • 當擁有已分類的資料,並希望 AI 系統能夠學習輸入與輸出之間的關係,以對新資料進行分類或預測時。
  • 應用場景:
    • 分類:支持向量機(SVM)用於分類識別垃圾郵件。
    • 回歸:線性回歸(Linear Regression)預測房價。

 

2. 半監督學習(Semi-supervised Learning)

半監督學習是一種監督學習的折衷方案,結合少量標記資料和大量未標記資料來訓練。當標記資料稀缺時,它假設未標記資料也有一定結構,從而推廣學習,可降低標籤成本,但效果取決於未標籤資料的品質。

  • 訓練步驟:
  1. 標記部分資料。
  2. 標記資料用於訓練模型,未標記資料則增強模型性能。
  3. 訓練好的模型可開始運用於新範圍。
  • 使用時機:
    • 當標籤資料少,但無標籤資料充足時。
  • 應用場景:
    • 文本分類:自我訓練(Self-training)用少量標記文章分類大量未標記內容。
    • 圖像識別:生成對抗網絡(GAN)提升少量標記圖像的模型性能。

 

3. 無監督學習(Unsupervised Learning)

無監督學習沒有標籤資料,目標是發現資料中的隱藏模式。例如,把顧客分成不同消費群體,但事先不知道有哪些群體,優點是無需標記,但結果需要人工解釋。

  • 訓練步驟:
  1. 提供未標籤的資料給演算法。
  2. 演算法自行推斷資料的結構。
  3. 演算法識別出類似屬性的資料群組,提供分群結果。
  • 使用時機:
    • 當不知道如何進行分類,或是想發掘不同分類的方法時。
  • 應用場景:
  1. 聚類(Clustering):K-means Clustering將資料分成若干組(群集),使得同一組內的資料相似,而不同組之間的資料差異較大,例如將顧客分為不同消費群體。
  2. 降維(Dimensionality Reduction):自動編碼器(Autoencoders)資料可視化(如PCA),降維的目標是將高維度資料(包含許多特徵)簡化為低維度表示,同時保留最重要的訊息。這在日常生活中常用於資料壓縮、可視化或提高處理效率。


4. 強化學習(Reinforcement Learning)

強化學習模仿人類試錯學習。模型(代理)與環境互動,根據行動結果獲得獎勵或懲罰,目標是最大化長期收益,可適應動態環境,但訓練過程可能不穩定。

  • 訓練步驟:
  1. 演算法在環境中採取行動。
  2. 模型會接收到獎勵或懲罰。
  3. 演算法優化一系列的行為,目標是最大化可獲得的獎勵。
  • 使用時機:
    • 當任務需要在動態環境中進行交互式學習時。
  • 應用場景:
    • 遊戲:Q學習(Q-Learning)AlphaGo學習圍棋。
    • 機器人控制:深度Q網絡(DQN)學習抓取物體。


機器學習的實現過程:從資料到模型

  1. 資料預處理:清洗資料、處理缺失值、標準化特徵,確保資料品質。
  2. 模型選擇:根據任務(分類或回歸)和資料選模型。
  3. 訓練:用資料調整模型參數,最小化誤差。
  4. 評估:用測試資料檢查模型性能,避免過擬合。
  5. 持續學習:部署後根據新資料更新模型。

以上資料均來自網路公開資料參考及個人想法綜合整理,因科技發展迅速,資訊不一定絕對正確,請讀者以自己的想法為主,也歡迎留言討論喔!

我是TN科技筆記,如果喜歡這篇文章,歡迎愛心、留言、轉發給朋友給我支持鼓勵!!沙龍內有更多科技文章等著各位喔!


大家好,我是TN,喜歡分享科技領域相關資訊,希望各位不吝支持與交流!
留言
avatar-img
留言分享你的想法!

































































有關資料隱私與安全的重點: 資料隱私風險對企業的影響、企業應對資料隱私風險的策略、資料安全議題、AI 導入時的資安注意事項
面對AI科技發展日新月異,經濟部於2025年推出「AI應用規劃師」產業人才能力鑑定(iPAS),由經濟部核發能力鑑定證書
有關資料隱私與安全的重點: 資料隱私風險對企業的影響、企業應對資料隱私風險的策略、資料安全議題、AI 導入時的資安注意事項
面對AI科技發展日新月異,經濟部於2025年推出「AI應用規劃師」產業人才能力鑑定(iPAS),由經濟部核發能力鑑定證書
你可能也想看
Google News 追蹤
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
Thumbnail
這是一篇介紹如何使用AI來生成貓貓圖片的文章,作者透過幾個軟體的使用經驗,分享了AI生成圖片的效果以及注意事項。文章內容豐富,並且有各種關鍵字和描述,可以吸引潛在讀者。
Thumbnail
人工智慧是什麼? 人工智慧(Artificial Intelligence, AI) 簡單來說,就是讓機器模仿人類的思考、學習和決策的能力。它就像是一個聰明的電腦程序,可以執行許多原本需要人類智慧才能完成的工作,例如: 語音辨識: 讓電腦聽懂人類的語言,像是 Siri、Google As
Thumbnail
AI的世界充滿了創新和潛力,涵蓋了許多領域,包括但不限於機器學習,自然語言處理、電腦視覺和機器人技術。AI對人類社會的影響是複雜而多層面的,既帶來了巨大的機遇,也提出了新的挑戰。社會需要在技術發展和倫理規範之間找到平衡,確保AI技術的應用能夠真正造福人類。
在人工智能的發展歷程中,早期的研究主要側重於將解決問題的規則輸入計算機,試圖通過啟蒙運動理性的思路模擬人類的智能行為。然而,這條路逐漸變得艱難,因為規則過於繁多,無法應對複雜的情境和語境。在這個背景下,一些科學家轉向了神經網絡算法,試圖模擬人腦的感知能力。
機器學習是什麼? 簡單來說,機器學習就是訓練機器尋找Function的一段過程,而這個Function可以幫助我們解決我們遇到的問題,或是幫助我們
大語言模型能夠生成文本,因此被認為是生成式人工智慧的一種形式。 人工智慧的學科任務,是製作機器,使其能執行需要人類智慧才能執行的任務,例如理解語言,便是模式,做出決策。 除了大語言模型,人工智慧也包含了深度學習以及機器學習。 機器學習的學科任務,是透過演算法來實踐AI。 特別
Thumbnail
AI,全稱人工智慧,是指讓電腦或機器具備類似人類的智慧和能力的科學和技術。AI 可以幫助我們解決各種問題,提高效率,創造價值,甚至改變世界。但是,你知道 AI 是如何運作的嗎?你知道 AI 的歷史和未來嗎?你知道 AI 的優點和挑戰嗎?在這篇文章中,我將帶你一起認識 AI 的基本概念和發展。
Thumbnail
AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域,包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性,還可解決複雜的問題和挑戰。
Thumbnail
2023年被世人稱做生成式AI世代的元年,各式各樣的AI工具不斷湧現,改變了人們的生活。本文將詳細介紹人工智慧和機器學習的相關知識,以及各種人工智慧和機器學習的實現方法。
Thumbnail
本文介紹了人工智慧(AI)及機器學習(ML)的基本概念和關係,探討了數據在機器學習中的重要性,以及深度學習和生成式人工智慧的應用。
Thumbnail
這是一篇介紹如何使用AI來生成貓貓圖片的文章,作者透過幾個軟體的使用經驗,分享了AI生成圖片的效果以及注意事項。文章內容豐富,並且有各種關鍵字和描述,可以吸引潛在讀者。
Thumbnail
人工智慧是什麼? 人工智慧(Artificial Intelligence, AI) 簡單來說,就是讓機器模仿人類的思考、學習和決策的能力。它就像是一個聰明的電腦程序,可以執行許多原本需要人類智慧才能完成的工作,例如: 語音辨識: 讓電腦聽懂人類的語言,像是 Siri、Google As
Thumbnail
AI的世界充滿了創新和潛力,涵蓋了許多領域,包括但不限於機器學習,自然語言處理、電腦視覺和機器人技術。AI對人類社會的影響是複雜而多層面的,既帶來了巨大的機遇,也提出了新的挑戰。社會需要在技術發展和倫理規範之間找到平衡,確保AI技術的應用能夠真正造福人類。
在人工智能的發展歷程中,早期的研究主要側重於將解決問題的規則輸入計算機,試圖通過啟蒙運動理性的思路模擬人類的智能行為。然而,這條路逐漸變得艱難,因為規則過於繁多,無法應對複雜的情境和語境。在這個背景下,一些科學家轉向了神經網絡算法,試圖模擬人腦的感知能力。
機器學習是什麼? 簡單來說,機器學習就是訓練機器尋找Function的一段過程,而這個Function可以幫助我們解決我們遇到的問題,或是幫助我們
大語言模型能夠生成文本,因此被認為是生成式人工智慧的一種形式。 人工智慧的學科任務,是製作機器,使其能執行需要人類智慧才能執行的任務,例如理解語言,便是模式,做出決策。 除了大語言模型,人工智慧也包含了深度學習以及機器學習。 機器學習的學科任務,是透過演算法來實踐AI。 特別
Thumbnail
AI,全稱人工智慧,是指讓電腦或機器具備類似人類的智慧和能力的科學和技術。AI 可以幫助我們解決各種問題,提高效率,創造價值,甚至改變世界。但是,你知道 AI 是如何運作的嗎?你知道 AI 的歷史和未來嗎?你知道 AI 的優點和挑戰嗎?在這篇文章中,我將帶你一起認識 AI 的基本概念和發展。
Thumbnail
AI 是人工智能 (Artificial Intelligence) 的縮寫。它指一種模擬、模仿人類智能的技術與系統。主要使機器能夠執行需要人類智慧才能完成的任務。應用於各領域,包括自動駕駛車輛、語音助手、推薦系統、金融分析、醫學診斷、工業自動化等。不僅可提高效率和準確性,還可解決複雜的問題和挑戰。
Thumbnail
2023年被世人稱做生成式AI世代的元年,各式各樣的AI工具不斷湧現,改變了人們的生活。本文將詳細介紹人工智慧和機器學習的相關知識,以及各種人工智慧和機器學習的實現方法。