【AI 人工智慧】特徵工程

2024/11/12 更新2020/11/13 發佈閱讀 3 分鐘

在機器學習裡面，為了要追求更好的表現，我們除了要選出最適當的演算法來應對不同場景外，同時，在將原始資料蒐集好後，我們該如何從中萃取出重要且有用的資訊，是非常重要的一件事情，這就是所謂的”特徵工程”，今天我們就來針對這個主題談談吧！

所謂的”特徵工程”，指的是將原始資料裡重要的特徵抽取出來，而被抽取出來的特徵可以很好的描述原始資料，並進而使整個機器學習的演算法有更好的表現，這就是特徵工程所期望達到之目的。

而在執行面上，這樣一個流程往往需要大量的領域專家（domain expert）以及領域知識(domain knowledge)，因為唯有對某特定領域有深入了解的人，才容易找出資料裡重要的特徵。

一般來說，特徵工程不只非常倚靠經驗，它也是個非常花時間以及勞力的一個過程（*），但這也是整個AI系統能否表現的比其他系統出色的關鍵點之一，有好的特徵工程，不只能提高準確度，也可能大大降低模型複雜度並減少所需要的電腦資源。

那麼我們要如何去學習這樣一個很吃經驗的技巧呢？其實在很多數據比賽平台上面，如Kaggle、KDD，有著各式各樣不同領域的資料集，同時也有許多高手在上面分享許多他們多年特徵工程之技巧，或許特徵工程這門學問無法有系統性的成為一本教科書，但我們可以藉由大量去閱讀不同專家的小技巧從中學習，我想這是增進特徵工程功力的不二法門之一吧！

最後，我想要補充的是一個在資料領域裡常被流傳的一段話，“數據和特徵決定了機器學習的上限，而模型和算法只是逼近這個上限而已”（*），這段話其實點出了數據以及特徵這兩個因素對導入AI之重要性，也是在實務上往往會被忽略的細節之一。

（*）根據資料顯示，這個過程可能長達整個專案一半的時間

（*）原文為data and characteristics determine the upper limit of machine learning, and models and algorithms just approach this upper limit.

＊本文由知名AI講師-Isaac Lee 李厚均所撰寫
文章轉載自我們共同經營的粉絲頁-小李談數智https://www.facebook.com/isaac60103

更多圖解內容可以到耀西圖像視覺化教室看看https://www.facebook.com/YoshiGraphics

#Artificialintelligence

#人工智慧

留言

Liao Yoshi的沙龍

12會員

33內容數

Liao Yoshi的沙龍的其他內容

2020/11/17

【AI公司】Mobileye

說到人工智慧對於汽車產業的變革，那就不得不提我們時常聽到的自駕車的應用，但大家知道許多知名自駕車廠商裡的防撞系統，都源自於一家非常有名的以色列公司嗎？今天我們就來好好介紹一下這家公司吧!

2020/11/17

【AI公司】Mobileye

2020/11/17

【AI大師】傑佛瑞·辛頓（Geoffrey Hinton）

提到這幾年AI人工智慧會那麼火紅的原因，就不得不提”深度學習”*這個領域的重大突破及創新，使得原本被冷落好一陣子的人工智慧又再次興起，都要歸功於 Geoffrey Hinton 這個被稱作「Deep Learning”之父的人...

2020/11/17

【AI大師】傑佛瑞·辛頓（Geoffrey Hinton）

2020/11/17

【AI大師】艾倫・圖靈（Alan Turing）

「有時候，被世人遺棄的人，才能成就讓人想像不到的大事。」（*），相信看過電影”模仿遊戲”的人應該對這句話不陌生吧！這是由20世纪最偉大的科學家之一艾倫．圖靈（Alan Turing）曾說過的名言。那麼這個被稱為是計算機科學之父以及人工智慧之父的天才到底是怎麼樣一個人呢？

2020/11/17

【AI大師】艾倫・圖靈（Alan Turing）

看更多

你可能也想看

方格子 vocus 官方沙龍

新成員登場 ✨「野格團」持續召募中，歡迎加入創作的集體派對 .ᐟ.ᐟ.ᐟ

創作不只是個人戰，在 vocus ，也可以是一場集體冒險、組隊升級。最具代表性的創作者社群「vocus 野格團」，現在有了更強大的新夥伴加入！除了大家熟悉的「官方主題沙龍」，這次我們徵召了 8 位領域各異的「個人主題專家」，將再度嘗試創作的各種可能，和格友們激發出更多未知的火花。

#創作#創作者推薦#靈感

2026/03/24

方格子 vocus 官方沙龍

新成員登場 ✨「野格團」持續召募中，歡迎加入創作的集體派對 .ᐟ.ᐟ.ᐟ

#創作#創作者推薦#靈感

2026/03/24

方格子 vocus 官方沙龍

【野格團開箱｜上篇】首波新成員登場！5 題靈魂拷問，直擊「個人主題專家」的創作後台🔥

vocus 最具指標性的創作者社群──「野格團」， 2026 年春季，這支充滿專業、熱情的團隊再次擴編，迎來了 8 位實力堅強的「個人主題專家」新成員 💫💫💫 從投資理財、自我成長、閱讀書評到電影戲劇，他們各自帶著獨特的「創作超能力」準備在格友大廳與大家見面。

#創作#創作者推薦#靈感

2026/03/25

方格子 vocus 官方沙龍

【野格團開箱｜上篇】首波新成員登場！5 題靈魂拷問，直擊「個人主題專家」的創作後台🔥

#創作#創作者推薦#靈感

2026/03/25

李政旺的沙龍

專家經驗和機器學習取得的「權重」的差異，以及可能的整合方式。

在資料科學中常可以聽到「權重」，可藉由專家經驗和機器學習取得「權重」，但他們差別是什麼？在透過演算法決定權重的想法相對盛行的現今，又如何整合兩種途徑的結果？

#資料科學#資料分析#專家經驗

2023/07/02

李政旺的沙龍

專家經驗和機器學習取得的「權重」的差異，以及可能的整合方式。

#資料科學#資料分析#專家經驗

2023/07/02

技術PM路易斯的沙龍

[AI小學堂(一)]人工智慧AI vs 機器學習 vs 深度學習

我們這個系列就是希望以非常科普的角度來解釋人工智慧。本篇要釐清人工智慧(AI: Artificial Intelligence)，機器學習 Machine Learning, 深度學習Deep Learning，另外還有類神經網路，到底互相是什麼關係呢?

#AI#DeepLearning#人工智慧

2023/05/27

技術PM路易斯的沙龍

[AI小學堂(一)]人工智慧AI vs 機器學習 vs 深度學習

#AI#DeepLearning#人工智慧

2023/05/27

跟著軌軌來讀書的沙龍

讀《人工智慧在台灣》學習如何跟上人工智慧讓AI真的幫上忙

這是一本講述人工智慧的發展，以及企業在導入人工智慧會遇到的困境，和擁抱人工智慧所需要具備的條件，給身在台灣的各位一個思考的方向，是一本很值得一讀的書。

#人工智慧#學習#資訊

2023/05/11

跟著軌軌來讀書的沙龍

讀《人工智慧在台灣》學習如何跟上人工智慧讓AI真的幫上忙

#人工智慧#學習#資訊

2023/05/11

深智數位的沙龍

【深智書摘】機器學習（machine learning）是什麼？

人們透過機器學習（machine learning），試著讓電腦能夠從大量資料中學習成長，不僅可以運用在生活各方面的功能提升，甚至還能透過這些既有的資料，起到鑑往知來的效果，處在當今資訊爆炸的時代，正是你開始學機器學習的最好時機！

#機器學習

2023/02/18

深智數位的沙龍

【深智書摘】機器學習（machine learning）是什麼？

#機器學習

2023/02/18

史塔克實驗室的沙龍

機器學習裡面的特徵是什麼？

兼回答觀眾來信問題經過上一次的文章之後，棒棒的觀眾們依然有問題丟過來有些觀眾的問題都滿認真的，也不好像其他節目一樣在節目上講講就沒了，所以依然用文章的方式帶給大家一點東西。我們先來看看觀眾疑問： 1. 是不是機器人預測的結果，都是依照revenue? 特徵是什麼? 特徵提取又是什麼？

2022/01/07

2022/01/07

在機器學習裡面，為了要追求更好的表現，我們除了要選出最適當的演算法來應對不同場景外，同時，在將原始資料蒐集好後，我們該如何從中萃取出重要且有用的資訊，是非常重要的一件事情，這就是所謂的”特徵工程”，今天我們就來針對這個主題談談吧...

#Artificialintelligence#人工智慧

2020/11/13

Liao Yoshi的沙龍

【AI 人工智慧】特徵工程

#Artificialintelligence#人工智慧

2020/11/13

Liao Yoshi的沙龍

【AI 人工智慧】模型可解釋性

儘管深度學習這陣子非常的成功，效果也非常的好，但每次提到它美中不足的地方時，可解釋性總是被拿來評論一番。今天，我們來針對模型的”可解釋性”這樣一個議題做深入的討論。所謂的「可解釋性」，就是當人工智慧演算法做決策的時候，我們是否能夠清楚了解為什麼電腦會做這樣一個決策以及判斷...

#人工智慧#Artificialintelligence

2020/11/11

Liao Yoshi的沙龍

【AI 人工智慧】模型可解釋性

#人工智慧#Artificialintelligence

2020/11/11

自營家的沙龍

人工智慧AI以行銷目的為多

十幾年前還在上班累積操作資金的時候(沒辦法! 沒有富爸爸), 從事的是資料科學(data science)相關, 也是Oracle ERP的data architect, 並受過SAP Data Warehousing 模組的訓練

2020/01/02

2020/01/02

給產品經理的AI開發指南#2：如何管理機器學習產品？／Bastiane Huang

在設計機器學習相關產品與服務時，必須瞭解它和一般軟體開發的不同、以及過程中獨特的優先順序與需求。前一篇中探討了機器學習產品開發時，專案經理必須具有的基礎認識和挑戰，本文則延續討論相關的產品管理須知。

#BastianeHuang#AI#ML

2019/11/22

吐納商業評論的沙龍

給產品經理的AI開發指南#2：如何管理機器學習產品？／Bastiane Huang

#BastianeHuang#AI#ML

2019/11/22

吐納商業評論的沙龍

人工智慧、機器學習、深度學習解解惑／解聰文

人工智慧、機器學習、深度學習這三個名詞，都是最近經常被提起的行話；它們彼此緊密相關，但意義又不太相同，偶爾還會被誤用。本文就用白話來說明一下，這三個奇妙的東西到底是什麼。

#解聰文#人工智慧#機器學習

2018/11/20

吐納商業評論的沙龍

人工智慧、機器學習、深度學習解解惑／解聰文

#解聰文#人工智慧#機器學習

2018/11/20

追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News