【深智書摘】機器學習(machine learning)是什麼?

閱讀時間約 6 分鐘
人們透過機器學習(machine learning),試著讓電腦能夠從大量資料中學習成長,不僅可以運用在生活各方面的功能提升,甚至還能透過這些既有的資料,起到鑑往知來的效果,處在當今資訊爆炸的時代,正是你開始學機器學習的最好時機!

1. 機器學習的特點

機器學習是關於電腦基於資料建構機率統計模型,並運用模型對資料進行預測與分析的一門學科。機器學習也稱為統計機器學習(statistical machine learning)。
機器學習的主要特點是:
(1)機器學習以電腦及網路為平臺,是建立在電腦及網路上的;
(2)機器學習以資料為研究標的,是資料驅動的學科;
(3)機器學習的目的是對資料進行預測與分析;
(4)機器學習以方法為中心,機器學習方法建構模型並應用模型進行預測與分析;
(5)機器學習是機率論、統計學、資訊理論、計算理論、最佳化理論及電腦科學等多個領域的交叉學科,並且在發展中逐步形成獨自的理論系統與方法論。
赫爾伯特⋅ 西蒙(Herbert A. Simon)曾對「學習」舉出以下定義:「如果一個系統能夠透過執行某個過程改進它的性能,這就是學習。」按照這一觀點,機器學習就是電腦系統透過運用資料及統計方法提高系統性能的機器學習。

2. 機器學習的標的

機器學習研究的標的是資料(data)。它從資料出發,提取資料的特徵,抽象出資料的模型,發現資料中的知識,又回到對資料的分析與預測中去。作為機器學習的標的,資料是多樣的,包括存在於電腦及網路上的各種數字、文字、影像、視訊、音訊資料以及它們的組合。
機器學習關於資料的基本假設是同質資料具有一定的統計規律性,這是機器學習的前提。這裡的同質資料是指具有某種共同性質的資料,例如英文文章,網際網路網頁,資料庫中的資料等。由於它們具有統計規律性,所以可以用機率統計方法處理它們。比如,可以用隨機變數描述資料中的特徵,用機率分佈描述資料的統計規律。在機器學習中,以變數或變數組表示資料。資料分為由連續變數和離散變數表示的類型。

3. 機器學習的目的

機器學習用於對資料的預測與分析,特別是對未知新資料的預測與分析。對資料的預測可以使電腦更加智慧化,或說使電腦的某些性能得到提高;對資料的分析可以讓人們獲取新的知識,給人們帶來新的發現。
對資料的預測與分析是透過建構機率統計模型實現的。機器學習總的目標就是考慮學習什麼樣的模型和如何學習模型,以使模型能對資料進行準確地預測與分析,同時也要考慮盡可能地提高學習效率。

4. 機器學習的方法

機器學習的方法是基於資料建構機率統計模型從而對資料進行預測與分析。機器學習由監督學習(supervised learning)、非監督學習(unsupervised learning)、和強化學習(reinforcement learning)等組成。
機器學習方法可以概括如下:從給定的、有限的,用於學習的訓練資料(training data)集合出發,假設資料是獨立同分佈產生的;並且假設要學習的模型屬於某個函數的集合,稱為假設空間(hypothesis space);應用某個評價準則(evaluation criterion),從假設空間中選取一個最佳模型,使它對已知的訓練資料及未知的測試資料(test data)在替定的評價準則下有最佳的預測;最佳模型的選取由演算法實現。這樣,機器學習方法包括模型的假設空間,模型選擇的準則,以及模型學習的演算法。稱其為機器學習方法的三要素,簡稱為模型(model)、策略(strategy)、演算法(algorithm)。
實現機器學習方法的步驟如下:
(1)得到一個有限的訓練資料集合;
(2)確定包含所有可能的模型的假設空間,即學習模型的集合;
(3)確定模型選擇的準則,即學習的策略;
(4)實現求解最佳模型的演算法,即學習的演算法;
(5)透過學習方法選擇最佳模型;
(6)利用學習的最佳模型對新資料進行預測或分析。

5. 機器學習的研究

機器學習研究一般包括機器學習方法,機器學習理論及機器學習應用三個方面。機器學習方法的研究旨在開發新的學習方法;機器學習理論的研究在於探求機器學習方法的有效性與效率,以及機器學習的基本理論問題;機器學習應用的研究主要考慮將機器學習方法應用到實際問題中去,解決實際問題。

6. 機器學習的重要性。

近二十年來,機器學習無論是在理論還是在應用方面都獲得了巨大的發展,有許多重大突破,機器學習已被成功地應用到人工智慧、圖型辨識、資料探勘、自然語言處理、語音處理、計算視覺、資訊檢索、生物資訊等許多電腦應用領域中,並且成為這些領域的核心技術。人們確信,機器學習將在今後的科學發展和技術應用中發揮越來越大的作用。
機器學習學科在科學技術中的重要性主要表現在以下幾個方面:
(1)機器學習是處理巨量資料的有效方法。我們處於一個資訊爆炸的時代。巨量資料的處理與利用是人們必然的需求。現實中的資料不但規模大,而且常常具有不確定性,機器學習往往是處理這類資料最強有力的工具。
(2)機器學習是計算機智慧化的有效方法。智慧化是電腦發展的必然趨勢,也是電腦技術研究與開發的主要目標。近幾十年來,人工智慧等領域的研究證明,利用機器學習模仿人類智慧的方法,雖有一定的局限性,還是實現這一目標的最有效方法。
(3)機器學習是電腦科學發展的重要組成部分。可以認為電腦科學由三維組成:系統、計算、資訊。機器學習主要屬於資訊這一維,並在其中有著核心作用。
《理論到實作都一清二楚 - 機器學習原理深究》
本文擷取自《理論到實作都一清二楚 - 機器學習原理深究》,本書收錄了關於機器學習最重要的統計應用及數學原理,全書分成了監督學習和無監督學習,以及深度學習三大區塊。不論您是機器學習相關學習者;從事資訊檢索、自然語言處理等領域的學生與研究人員;或是從事機器學習的專業研究人員,這都是一本深入淺出的實用書籍。
為什麼會看到廣告
8會員
25內容數
留言0
查看全部
發表第一個留言支持創作者!
你可能也想看
三大議題質詢文化部 郭昱晴:嚴防狼師、支持書店、資深影視工作者擴大關懷立法委員郭昱晴今(27)針對文化部業務報告,以三大議題提出質詢,包括「戲曲學校性平案」涉案教師仍在業界為所欲為、「獨立書店訪視員爭議」從遴選制度到評估專業度皆受質疑,以及「資深影視從業人員關懷」依舊沒有進度。
Thumbnail
avatar
郭昱晴
2024-05-22
陪你讀書|心靈的深淵:致鬱系《殺人鬼藤子》系列致鬱系(イヤミス)是由評論家霜月蒼於二○○七年提出的一種推理小說類型,指的是那些讀完後讓人心情沮喪、餘味不佳的作品,其主題通常圍繞在人內心的陰暗面。 森澤藤子,一個遭到父母虐待、同學欺凌,在悲慘的日子裡苦苦掙扎的少女。她始終以為自己的人生就只能在底層打滾,再無翻身的可能。
Thumbnail
avatar
哈斯的採購人生
2024-04-25
【書評】卡片盒筆記法=點子製造機:申克·艾倫斯《卡片盒筆記法》用自己的話來寫出自己理解的內容,這種能力是每個寫作者都需要具備的基本技能。
Thumbnail
avatar
微讀
2023-12-12
私法人購買住宅用房屋許可制完整解析及申請書表平均地權條例子法規即將於今(112)年 7 月 1 日正式上路,這次平均地權條例其中一項修正重點,就是限制私法人購買住宅用房屋,必須取得內政部的許可方可購買,本文將完整解析私法人購屋許可制之詳細內容,讓大家瞭解規定以及對自身的影響,並提供申請書表供大家下載參考! 繼續閱讀:https://cpac
Thumbnail
avatar
蔡佳峻
2023-08-07
有聲書製作發行(寫給作者)「有聲作品」是小說/文學/漫畫創作者的一項發行選擇型式 眼睛總是在忙,耳朵永遠有空 連續幾年,大家都在說台灣的有聲市場起飛,台灣的收聽群眾的確一直在增加,小說/故事演播、廣播劇改編,是圖文創作者在實體書本、電子書、電視劇、電影以外的的發行型式。在許多國家,因為有聲劇帶起了收聽數,促成電視劇電影爭取改
Thumbnail
avatar
憶裳思思
2023-07-10
【深智書摘】AI 2.0 - 5年前出現的TF接班人—JAX—重磅出世在AI已經全民運動的年代,Google還是希望有一個更小巧精美的深度學習套件讓大家都能快速上手──JAX就這麼誕生了。 現在,你真的可以放心的進入JAX的世界,當你上手之後,不論是CNN、RNN、NLP或是GAN,全部可以又快又好又清楚的做出來
Thumbnail
avatar
深智數位
2023-02-23
這本書神難譯,但是好有趣!──催淚純愛電影《僕愛君愛》:《致我深愛的每個妳》/《致深愛妳的那個我》原著小說(下)這部作品有很多細節可以討論,我很佩服作者為這個故事的世界觀制定了一套很合乎邏輯的理論,至少我這個文科女子沒有看出什麼破綻。看完電影的時候,我聽到其他觀眾邊走邊討論劇情,大部分的人都認為要兩部一起看才能完全看懂,但理論的部分可能還是要看小說了。畢竟小說裡面用了好幾頁解釋的事情,字幕就只有一、二句。 沒
Thumbnail
avatar
小譯者的日常
2023-02-11
這本書神難譯,但是好有趣!──催淚純愛電影《僕愛君愛》:《致我深愛的每個妳》/《致深愛妳的那個我》原著小說(上)嗨,年假結束了,大家都胖了一圈嗎?(笑) 今天要跟大家分享一件很開心的事。我三年前的譯作改編成電影版,而且還引進台灣了。去年我得知電影版要在日本上映,已經覺得很激動,沒想到在灌籃高手與阿凡達雙面夾擊的情況下,竟然引進台灣,真的是眼淚都要流下來了。 編輯日前邀請我去參加媒體試映,開心拍完照之後我就進入
Thumbnail
avatar
小譯者的日常
2023-02-10
書本|我們的身邊都有一位《82 年生的金智英》如果下輩子到來前可以選擇,你想當男生還是女生? 一直到現在都還存在於這個社會之中,《82 年生的金智英》帶給女性很大的共鳴,也推薦給男性閱讀,讀完能深刻體會到女性面對社會輿論與那些「理所當然」的種種,下次在面對另一半或女性友人、同事時也能多一點的體貼。
Thumbnail
avatar
文字避風港
2022-05-16