【AI 人工智慧】特徵工程

閱讀時間約 2 分鐘
特徵工程
在機器學習裡面,為了要追求更好的表現,我們除了要選出最適當的演算法來應對不同場景外,同時,在將原始資料蒐集好後,我們該如何從中萃取出重要且有用的資訊,是非常重要的一件事情,這就是所謂的”特徵工程”,今天我們就來針對這個主題談談吧!
所謂的”特徵工程”,指的是將原始資料裡重要的特徵抽取出來,而被抽取出來的特徵可以很好的描述原始資料,並進而使整個機器學習的演算法有更好的表現,這就是特徵工程所期望達到之目的。
而在執行面上,這樣一個流程往往需要大量的領域專家(domain expert)以及領域知識(domain knowledge),因為唯有對某特定領域有深入了解的人,才容易找出資料裡重要的特徵。
一般來說,特徵工程不只非常倚靠經驗,它也是個非常花時間以及勞力的一個過程(*),但這也是整個AI系統能否表現的比其他系統出色的關鍵點之一,有好的特徵工程,不只能提高準確度,也可能大大降低模型複雜度並減少所需要的電腦資源。
那麼我們要如何去學習這樣一個很吃經驗的技巧呢?其實在很多數據比賽平台上面,如Kaggle、KDD,有著各式各樣不同領域的資料集,同時也有許多高手在上面分享許多他們多年特徵工程之技巧,或許特徵工程這門學問無法有系統性的成為一本教科書,但我們可以藉由大量去閱讀不同專家的小技巧從中學習,我想這是增進特徵工程功力的不二法門之一吧!
最後,我想要補充的是一個在資料領域裡常被流傳的一段話,“數據和特徵決定了機器學習的上限,而模型和算法只是逼近這個上限而已”(*),這段話其實點出了數據以及特徵這兩個因素對導入AI之重要性,也是在實務上往往會被忽略的細節之一。
(*)根據資料顯示,這個過程可能長達整個專案一半的時間
(*)原文為data and characteristics determine the upper limit of machine learning, and models and algorithms just approach this upper limit.
*本文由知名AI講師-Isaac Lee 李厚均所撰寫
文章轉載自我們共同經營的粉絲頁-小李談數智https://www.facebook.com/isaac60103
更多圖解內容可以到 耀西圖像視覺化教室看看https://www.facebook.com/YoshiGraphics
為什麼會看到廣告
11會員
33內容數
留言0
查看全部
發表第一個留言支持創作者!
你可能也想看
AI人工智慧最新消息:從野生動物保護到醫療和農業的創新突破AI人工智慧不斷改變我們的世界,文章講述包含透過AI科技監控系統,追蹤鐵軌附近的大象活動,防止因火車撞擊而死亡。運用AI人工智慧工具臨床試驗,為憂鬱症患者提供更精準藥物治療,以及透過AI人工智慧產出的無人駕駛拖拉機,使農民提供農業效率並永續土地,讓我們一同探索AI人工智慧正快速改變的產業。
Thumbnail
avatar
未來巢 | 數位轉型 x 數位科技 xAI應用
2024-05-28
AI人工智慧:開發、優勢與應用創新在當今數位時代,AI人工智慧正成為引領未來的關鍵技術之一。AI的發展不僅改變了我們與科技互動的方式,還深刻地塑造了社會、經濟和文化的格局。以下將探討AI的定義、開發階段和其帶來的優勢。
Thumbnail
avatar
一灘爛泥
2024-02-15
ai人工智慧概念股精選-原相 》2024新光證券開戶優質平台沒想到路上就有櫻花大景!南投信義鄉的「觀山休息區」,現場種有40多棵桃紅色山櫻花樹,沿著台21線都可賞絕美櫻花景,夜晚雲海繚繞時,還有機會拍到夜櫻琉璃光! 觀山休息區桃紅色山櫻花樹,吸引網友前往取景。(圖/molly888666) 觀山休息區桃紅色山櫻花樹,吸引網友前往取景。(
avatar
金色迷霧
2024-02-11
AI 人工智慧是否會取代人類工作?人工智慧對於人類工作的取代問題引起了廣泛關注。雖然有些人認為人工智慧會取代許多傳統工作,但也有人認為它將創造更多就業機會。人工智慧的應用領域廣泛,可能取代一些重複性或低技能的工作,但同時也可能創造新的工作機會。面對這個挑戰,我們應該加強科技倫理和法規的制定,提供必要的培訓和轉型支援,以及促進社會對科
avatar
So桑 | 閱讀筆記 | Notion
2023-10-22
AI人工智慧與自我意識回到”自我意識”的定義,沒有自我意識是不可能創造知識跟產生洞見的。有個流行說法是,只要AI網路節點增加到像人類大腦神經元的數量,就是"自我意識"產生的奇異點。其實這個說法很武斷,完全沒有推論與證據。 所以到底甚麼是"自我意識"? 終極的哲學三問:我是誰,我從哪裡來,我將往哪裡去,能夠回答得出來,也許
Thumbnail
avatar
藍迪韋
2023-10-16
AI人工智慧浪潮下的選股(類股分析)墜落雲端的彈起 去(2022)年1月5日台股迎來了18,619點的高點,隨著不再出現塞港、重複下單、清庫存等議題,接著通膨過高引來的3月升息潮,股市一路震盪走跌。 去年10月25日台股的近期最低點12,629點,跌破1990年的12,682點。 隨著升息逐漸進入尾聲,清庫存的腳步也可以預期,加上股市
Thumbnail
avatar
Jackie Chien
2023-02-14
ARK研究報告-Big ideas2022-AI人工智慧篇#14大家的乾媽(2020限定版)-凱瑟琳伍德的ARK基金公司每年都會提出對於未來5-10年的科技大趨勢研究報告,雖然目前ARK們的績效從2021年開始就積弱不振許久,但是ARK的研究仍是具有前瞻性、值得一讀的。ARK認為現在的投資,在未來五年後才是收割的時候。
Thumbnail
avatar
Steve觀察筆記
2022-03-19
【電影】AI人工智慧 電影:AI人工智慧 原文:A.I. Artificial Intelligence 上映:2001年 導演:Steven Allan Spielberg 評分:★★★★★ NETFLIX 12/14要下架這部電影,趁還沒下架之前重溫這部經典好片,沒想到這部電影竟然也有2.5個小時,記得小時候看得覺
Thumbnail
avatar
Abby
2021-12-07
「AI人工智慧是人類之友還是敵人?」科幻神劇西方極樂園教我們的事(2)AI人工智慧是人類之友還是敵人? 其實《西》片主要環繞在在未來人工智能已經和人類真假不分的時代,AI人究竟是人類「玩樂的工具」,還是同樣享有生命權、思想自由及天賦人權的種族?抑或是處於人類對立面的天敵?我認為這也是編劇試著透過此劇跟現代人探討的。 在科技日新月異的今天,我們不知道有哪天會再出現賈伯斯
Thumbnail
avatar
莊凱仲 Ivan
2021-11-20