【深智書摘】機器學習（machine learning）是什麼？

更新於 2025/02/17發佈於 2023/02/18閱讀時間約 6 分鐘

人們透過機器學習（machine learning），試著讓電腦能夠從大量資料中學習成長，不僅可以運用在生活各方面的功能提升，甚至還能透過這些既有的資料，起到鑑往知來的效果，處在當今資訊爆炸的時代，正是你開始學機器學習的最好時機！

1. 機器學習的特點

機器學習是關於電腦基於資料建構機率統計模型，並運用模型對資料進行預測與分析的一門學科。機器學習也稱為統計機器學習(statistical machine learning）。

機器學習的主要特點是：

（1）機器學習以電腦及網路為平臺，是建立在電腦及網路上的；
（2）機器學習以資料為研究標的，是資料驅動的學科；
（3）機器學習的目的是對資料進行預測與分析；
（4）機器學習以方法為中心，機器學習方法建構模型並應用模型進行預測與分析；
（5）機器學習是機率論、統計學、資訊理論、計算理論、最佳化理論及電腦科學等多個領域的交叉學科，並且在發展中逐步形成獨自的理論系統與方法論。

赫爾伯特⋅ 西蒙（Herbert A. Simon）曾對「學習」舉出以下定義：「如果一個系統能夠透過執行某個過程改進它的性能，這就是學習。」按照這一觀點，機器學習就是電腦系統透過運用資料及統計方法提高系統性能的機器學習。

2. 機器學習的標的

機器學習研究的標的是資料(data)。它從資料出發，提取資料的特徵，抽象出資料的模型，發現資料中的知識，又回到對資料的分析與預測中去。作為機器學習的標的，資料是多樣的，包括存在於電腦及網路上的各種數字、文字、影像、視訊、音訊資料以及它們的組合。

機器學習關於資料的基本假設是同質資料具有一定的統計規律性，這是機器學習的前提。這裡的同質資料是指具有某種共同性質的資料，例如英文文章，網際網路網頁，資料庫中的資料等。由於它們具有統計規律性，所以可以用機率統計方法處理它們。比如，可以用隨機變數描述資料中的特徵，用機率分佈描述資料的統計規律。在機器學習中，以變數或變數組表示資料。資料分為由連續變數和離散變數表示的類型。

3. 機器學習的目的

機器學習用於對資料的預測與分析，特別是對未知新資料的預測與分析。對資料的預測可以使電腦更加智慧化，或說使電腦的某些性能得到提高；對資料的分析可以讓人們獲取新的知識，給人們帶來新的發現。

對資料的預測與分析是透過建構機率統計模型實現的。機器學習總的目標就是考慮學習什麼樣的模型和如何學習模型，以使模型能對資料進行準確地預測與分析，同時也要考慮盡可能地提高學習效率。

4. 機器學習的方法

機器學習的方法是基於資料建構機率統計模型從而對資料進行預測與分析。機器學習由監督學習(supervised learning)、非監督學習(unsupervised learning)、和強化學習(reinforcement learning)等組成。

機器學習方法可以概括如下：從給定的、有限的，用於學習的訓練資料（training data）集合出發，假設資料是獨立同分佈產生的；並且假設要學習的模型屬於某個函數的集合，稱為假設空間（hypothesis space）；應用某個評價準則（evaluation criterion），從假設空間中選取一個最佳模型，使它對已知的訓練資料及未知的測試資料（test data）在替定的評價準則下有最佳的預測；最佳模型的選取由演算法實現。這樣，機器學習方法包括模型的假設空間，模型選擇的準則，以及模型學習的演算法。稱其為機器學習方法的三要素，簡稱為模型（model）、策略（strategy）、演算法（algorithm）。

實現機器學習方法的步驟如下：

（1）得到一個有限的訓練資料集合；
（2）確定包含所有可能的模型的假設空間，即學習模型的集合；
（3）確定模型選擇的準則，即學習的策略；
（4）實現求解最佳模型的演算法，即學習的演算法；
（5）透過學習方法選擇最佳模型；
（6）利用學習的最佳模型對新資料進行預測或分析。

5. 機器學習的研究

機器學習研究一般包括機器學習方法，機器學習理論及機器學習應用三個方面。機器學習方法的研究旨在開發新的學習方法；機器學習理論的研究在於探求機器學習方法的有效性與效率，以及機器學習的基本理論問題；機器學習應用的研究主要考慮將機器學習方法應用到實際問題中去，解決實際問題。

6. 機器學習的重要性。

近二十年來，機器學習無論是在理論還是在應用方面都獲得了巨大的發展，有許多重大突破，機器學習已被成功地應用到人工智慧、圖型辨識、資料探勘、自然語言處理、語音處理、計算視覺、資訊檢索、生物資訊等許多電腦應用領域中，並且成為這些領域的核心技術。人們確信，機器學習將在今後的科學發展和技術應用中發揮越來越大的作用。

機器學習學科在科學技術中的重要性主要表現在以下幾個方面：

（1）機器學習是處理巨量資料的有效方法。我們處於一個資訊爆炸的時代。巨量資料的處理與利用是人們必然的需求。現實中的資料不但規模大，而且常常具有不確定性，機器學習往往是處理這類資料最強有力的工具。
（2）機器學習是計算機智慧化的有效方法。智慧化是電腦發展的必然趨勢，也是電腦技術研究與開發的主要目標。近幾十年來，人工智慧等領域的研究證明，利用機器學習模仿人類智慧的方法，雖有一定的局限性，還是實現這一目標的最有效方法。
（3）機器學習是電腦科學發展的重要組成部分。可以認為電腦科學由三維組成：系統、計算、資訊。機器學習主要屬於資訊這一維，並在其中有著核心作用。

《理論到實作都一清二楚 - 機器學習原理深究》

本文擷取自《理論到實作都一清二楚 - 機器學習原理深究》，本書收錄了關於機器學習最重要的統計應用及數學原理，全書分成了監督學習和無監督學習，以及深度學習三大區塊。不論您是機器學習相關學習者；從事資訊檢索、自然語言處理等領域的學生與研究人員；或是從事機器學習的專業研究人員，這都是一本深入淺出的實用書籍。

為什麼會看到廣告

#機器學習

深智數位的沙龍

9會員

25內容數

留言

留言分享你的想法！

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

‌

‌
‌

深智數位的沙龍的其他內容

【深智書摘】睽違八年終於更新！Qt6.0 帶給您嶄新視覺開發體驗

Qt是軟體開發領域中非常著名的C++視覺化開發平台，能夠為應用程式開發者提供建立專業圖形化使用者介面所需的所有功能。QT有很完整的硬體、作業系統、視窗元件的處理，它是完全物件導向的，很容易擴充，並且可應用於元件程式設計，也是目前流行的Linux 桌面環境KDE 的基礎。

#QT #python #Linux

【深智書摘】金融資料的定量分析 - Pandas 運算套件

正所謂「套件」如其名，Pandas 運算套件在資料處理領域的受歡迎程度完全可與善於賣萌的大熊貓相媲美。當然，Pandas 的名稱其實來自經濟學術語—面板資料 (panel data)。眾所皆知，金融領域存在巨量的資料處理與分析，而Pandas 運算套件就是當時就職於AQR Capi

#python #財金風險 #FRM

【深智書摘】一頭鑽入6G世界：智慧超表面！

最近，RIS因其能夠透過智慧地重構無線傳播環境來增強無線網路的容量和覆蓋範圍的潛力而受到極大關注，被認為是6G通訊網路中一項有前途的技術。在此背景下，廣大研究者和企業對RIS進行了大量的研究，包括實現其可重構性的硬體材料、設定的波束成形技術和資源設定技術等。智慧超表面基本原理發展歷史和研究現狀

#6G #5G #書摘

【深智書摘】Git與GitHub差在哪？動手學GitHub！

有此一說：身為軟體開發工程師，你可以沒有Facebook，但不能沒有GitHub。如果Git給予軟體開發工程師版本控制的能力，那麼GitHub則帶領你遨遊開源世界的美麗。全世界最大的原始碼管理平台與開放原始碼社群檢視公開軟體套件內程式碼，理解邏輯並正確使用搜尋方便的套件與相關資源加速軟體開發

#GitHub #書摘 #謝政廷

【深智書摘】卷積神經網路（CNN）的發展與結構

　　卷積神經網路（Convolutional Neural Networks，CNN），其應用包括影像辨識、自然語言處理（NLP）等領域。若能從其發展至今的脈絡開始了解，必定可以更進一步地理解專案的想法，將該技術掌握得更得心應手。以下就其發展和結構分別詳細說明。 1. LeNet

#書摘 #PyTorch #深度學習

【深智書摘】Kubernetes的定位、優勢與基本知識

Kubernetes是什麼？ 1. Kubernetes是Google嚴格保密十幾年的秘密武器——Borg的一個開放原始碼版本。 2. Kubernetes是一個開放的開發平台。 3. Kubernetes是一個完備的分散式系統支撐平台。

#Docker #Kubernetes #書摘

【深智書摘】睽違八年終於更新！Qt6.0 帶給您嶄新視覺開發體驗

#QT #python #Linux

【深智書摘】金融資料的定量分析 - Pandas 運算套件

#python #財金風險 #FRM

【深智書摘】一頭鑽入6G世界：智慧超表面！

#6G #5G #書摘

【深智書摘】Git與GitHub差在哪？動手學GitHub！

#GitHub #書摘 #謝政廷

【深智書摘】卷積神經網路（CNN）的發展與結構

#書摘 #PyTorch #深度學習

【深智書摘】Kubernetes的定位、優勢與基本知識

#Docker #Kubernetes #書摘

你可能也想看

Google News 追蹤

觀音山吉祥洲的沙龍

2024/12/05

純手工鑄造轉經輪筒身製作現場進度實況✦臺灣薩迦寺金剛乘六大本尊心咒「轉經輪牆」建設計畫｜觀音山與您共同成就殊勝功德行

臺灣薩迦寺住持龍德嚴淨仁波切 (確吉蔣稱金剛上師) 開示：「轉經輪牆將圍繞臺灣薩迦寺的主體建築一圈。在轉動經輪的同時，繞了藏經閣、金剛法堂大雄寶殿，常住三寶、傳承祖師三根本的壇城功德都蘊含在其中，非常殊勝。」

#觀音山中華大悲法藏佛教會 #龍德嚴淨仁波切 #確吉蔣稱金剛上師

雷課探險家 : 知識分享區 !

2024/11/24

小紅書申訴機制全攻略：如何有效提高申訴成功率

探索小紅書的社群審核機制以及如何有效申訴避免帳號被限制的策略。文章提供了清晰的申訴步驟、注意事項以及模板，幫助用戶提高申訴成功率。若您正面臨任何社群規範問題，這些實用技巧將助您渡過難關，保障您的發言權與使用權益。立即瞭解如何應對小紅書的審核挑戰。

#小紅書經營 #小紅書 #中國大陸行銷

Shelly chez moi 雪梨家

2024/11/12

【好書推薦】為什麼優質女生多單身？《戀愛市場學》

那些電影跟戲劇沒有教我們的事，這本書提供妳其實很需要的理性觀點！

#女性 #閱讀 #閱讀心得

唐志偉的沙龍

2024/10/23

機器學習、LLM與RAG的組合：打造AI科技的第一步

在當今的科技世界裡，機器學習已經成為我們生活中不可或缺的一部分。從你每天使用的手機應用程式，到網購時的商品推薦，這些背後都依賴於機器學習技術。機器學習的核心是讓電腦能夠自主學習，透過大量數據來進行模式分析，進而作出預測或決策。

Christy Chin的沙龍

2024/08/10

【掌握AI全面發展趨勢，避免資訊不對稱損害你的利益！】

學習生成式AI，不僅僅是掌握幾個工具，而是從全方位了解AI的發展範疇及其潛力。我經常在企業教授AI課程時，會遇到HR詢問：某些工具用不上，可以不教嗎？當然可以，但如果同仁不了解生成式AI在「數位內容」上的廣泛應用，又如何掌握大語言模型的發展邊界？

#學習 #生成式AI #課程

Learn AI 不 BI

2024/07/31

AI 證照考試準備資料 | AI 的各種服務

Microsoft Azure AI 900 證照，把準備資料整理分享給大家。 AI 是可模仿人類行為與能力的軟體，主要的工作包含：機器學習：這通常是 AI 系統的基礎，且是「指導」電腦模型進行預測並從資料中得出結論的方式電腦視覺：透過相機、影片和影像，以視覺方式解譯世界的 AI 功能

#AI #machinelearning #Azure

林的文章集中地

2024/07/30

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習 #人工智慧 #數據

普普文創

2024/07/30

【文創漫談】人工智慧與機器學習 | 如何利用AI | 增強能力

人工智慧是什麼？人工智慧（Artificial Intelligence, AI）簡單來說，就是讓機器模仿人類的思考、學習和決策的能力。它就像是一個聰明的電腦程序，可以執行許多原本需要人類智慧才能完成的工作，例如：語音辨識：讓電腦聽懂人類的語言，像是 Siri、Google As

#文創漫談 #人工智慧與機器學習 #如何利用AI

郭昱晴

2024/05/22

三大議題質詢文化部郭昱晴：嚴防狼師、支持書店、資深影視工作者擴大關懷

立法委員郭昱晴今(27)針對文化部業務報告，以三大議題提出質詢，包括「戲曲學校性平案」涉案教師仍在業界為所欲為、「獨立書店訪視員爭議」從遴選制度到評估專業度皆受質疑，以及「資深影視從業人員關懷」依舊沒有進度。

#繼續努力專業問政 #文化部 #戲曲學院

哈斯的煉金工房

2024/04/25

陪你讀書 28｜心靈的深淵：致鬱系《殺人鬼藤子》系列

致鬱系（イヤミス）是由評論家霜月蒼於二○○七年提出的一種推理小說類型，指的是那些讀完後讓人心情沮喪、餘味不佳的作品，其主題通常圍繞在人內心的陰暗面。森澤藤子，一個遭到父母虐待、同學欺凌，在悲慘的日子裡苦苦掙扎的少女。她始終以為自己的人生就只能在底層打滾，再無翻身的可能。

#幸福 #同學 #殺人

觀音山吉祥洲的沙龍

2024/12/05

純手工鑄造轉經輪筒身製作現場進度實況✦臺灣薩迦寺金剛乘六大本尊心咒「轉經輪牆」建設計畫｜觀音山與您共同成就殊勝功德行

#觀音山中華大悲法藏佛教會 #龍德嚴淨仁波切 #確吉蔣稱金剛上師

雷課探險家 : 知識分享區 !

2024/11/24

小紅書申訴機制全攻略：如何有效提高申訴成功率

#小紅書經營 #小紅書 #中國大陸行銷

Shelly chez moi 雪梨家

2024/11/12

【好書推薦】為什麼優質女生多單身？《戀愛市場學》

那些電影跟戲劇沒有教我們的事，這本書提供妳其實很需要的理性觀點！

#女性 #閱讀 #閱讀心得

唐志偉的沙龍

2024/10/23

機器學習、LLM與RAG的組合：打造AI科技的第一步

Christy Chin的沙龍

2024/08/10

【掌握AI全面發展趨勢，避免資訊不對稱損害你的利益！】

#學習 #生成式AI #課程

Learn AI 不 BI

2024/07/31

AI 證照考試準備資料 | AI 的各種服務

#AI #machinelearning #Azure

林的文章集中地

2024/07/30

人工智慧與機器學習

本文介紹了人工智慧（AI）及機器學習（ML）的基本概念和關係，探討了數據在機器學習中的重要性，以及深度學習和生成式人工智慧的應用。

#學習 #人工智慧 #數據

普普文創

2024/07/30

【文創漫談】人工智慧與機器學習 | 如何利用AI | 增強能力

#文創漫談 #人工智慧與機器學習 #如何利用AI

郭昱晴

2024/05/22

三大議題質詢文化部郭昱晴：嚴防狼師、支持書店、資深影視工作者擴大關懷

#繼續努力專業問政 #文化部 #戲曲學院

哈斯的煉金工房

2024/04/25

陪你讀書 28｜心靈的深淵：致鬱系《殺人鬼藤子》系列

#幸福 #同學 #殺人