【AI 人工智慧】類別不平衡

更新 發佈閱讀 2 分鐘
raw-image

今天想要跟大家分享的主題是”類別不平衡”問題,這個是實務上在導入人工智慧時,非常常見的問題,那麼什麼是”類別不平衡”呢?

當然,我個人認為如果”成本”以及”時間”允許的話,持續蒐集少量類別的資料才是最好的方法,畢竟如果是自己製造出的少數類別資料,很有可能會無法充份反應真實資料的情況。

假設我們想要根據過去的天氣資料,來預測台北明天溫度是否會超過38度,也就是說,我們將明天的溫度分成大於38度以及小於38度兩類。

然而,根據歷年來所有統計的資料來看,台北超過38度的日子其實是非常少也相當罕見的,此時,兩個類別的資料數量差距會非常大,這就是我們所謂的”類別不平衡”,或者換句話說,當某類的類別是相對於其他類別來得罕見許多。

如果我們貿然的直接將類別不平衡的資料集拿去給人工智慧做學習,那麼很有可能會讓AI學到”只會預測明天天氣低於38度”這樣的結果,表面上他好像每天的溫度預測非常的準確,但實際上他喪失了預測異常溫度的情況!這並不是我們想要的結果。

一般來說,我們會期望不同類別之間的資料量差不多,但如果真的遇到了類別不平衡,除了花更多時間以及資源去蒐集更多罕見類別資料外,也有人會利用一些方法自己去大量製造少數類別的資料,來讓類別與類別之間更加的平衡!

*本文由知名AI講師-Isaac Lee 李厚均所撰寫
文章轉載自我們共同經營的粉絲頁-小李談數智https://www.facebook.com/isaac60103

更多圖解內容可以到 耀西圖像視覺化教室看看https://www.facebook.com/YoshiGraphics

留言
avatar-img
留言分享你的想法!
avatar-img
Liao Yoshi的沙龍
12會員
33內容數
Liao Yoshi的沙龍的其他內容
2020/11/17
說到人工智慧對於汽車產業的變革,那就不得不提我們時常聽到的自駕車的應用,但大家知道許多知名自駕車廠商裡的防撞系統,都源自於一家非常有名的以色列公司嗎?今天我們就來好好介紹一下這家公司吧!
Thumbnail
2020/11/17
說到人工智慧對於汽車產業的變革,那就不得不提我們時常聽到的自駕車的應用,但大家知道許多知名自駕車廠商裡的防撞系統,都源自於一家非常有名的以色列公司嗎?今天我們就來好好介紹一下這家公司吧!
Thumbnail
2020/11/17
提到這幾年AI人工智慧會那麼火紅的原因,就不得不提”深度學習”*這個領域的重大突破及創新,使得原本被冷落好一陣子的人工智慧又再次興起,都要歸功於 Geoffrey Hinton 這個被稱作「Deep Learning”之父的人...
Thumbnail
2020/11/17
提到這幾年AI人工智慧會那麼火紅的原因,就不得不提”深度學習”*這個領域的重大突破及創新,使得原本被冷落好一陣子的人工智慧又再次興起,都要歸功於 Geoffrey Hinton 這個被稱作「Deep Learning”之父的人...
Thumbnail
2020/11/17
「有時候,被世人遺棄的人,才能成就讓人想像不到的大事。」(*),相信看過電影”模仿遊戲”的人應該對這句話不陌生吧!這是由20世纪最偉大的科學家之一艾倫.圖靈(Alan Turing)曾說過的名言。那麼這個被稱為是計算機科學之父以及人工智慧之父的天才到底是怎麼樣一個人呢?
Thumbnail
2020/11/17
「有時候,被世人遺棄的人,才能成就讓人想像不到的大事。」(*),相信看過電影”模仿遊戲”的人應該對這句話不陌生吧!這是由20世纪最偉大的科學家之一艾倫.圖靈(Alan Turing)曾說過的名言。那麼這個被稱為是計算機科學之父以及人工智慧之父的天才到底是怎麼樣一個人呢?
Thumbnail
看更多
你可能也想看
Thumbnail
●人工智慧AI+法遵 蒙老師不嫌棄,台灣法學基金會8/26研討會,指示我負責「AI+勞動法遵」的場次,要提出一篇文章發表。 因為基金會舉辦之研討會,在國內法律類型研討會中,通常是參與人數最多,這一場也不遑多讓,報名人數突破300人。 ●摸不著頭緒 說真的,我自詡科技法律很在行,但是看到「
Thumbnail
●人工智慧AI+法遵 蒙老師不嫌棄,台灣法學基金會8/26研討會,指示我負責「AI+勞動法遵」的場次,要提出一篇文章發表。 因為基金會舉辦之研討會,在國內法律類型研討會中,通常是參與人數最多,這一場也不遑多讓,報名人數突破300人。 ●摸不著頭緒 說真的,我自詡科技法律很在行,但是看到「
Thumbnail
這是一本講述人工智慧的發展,以及企業在導入人工智慧會遇到的困境,和擁抱人工智慧所需要具備的條件,給身在台灣的各位一個思考的方向,是一本很值得一讀的書。
Thumbnail
這是一本講述人工智慧的發展,以及企業在導入人工智慧會遇到的困境,和擁抱人工智慧所需要具備的條件,給身在台灣的各位一個思考的方向,是一本很值得一讀的書。
Thumbnail
越想要精確回應的結果,就越會被問題的根本給困住。
Thumbnail
越想要精確回應的結果,就越會被問題的根本給困住。
Thumbnail
今天要介紹的是簡單的文本分析,主要內容會包含處理html標籤、jieba斷詞、TF-IDF轉換與Logistic Regression和svm,透過文本探勘預測哪些文本會成為熱門文章。
Thumbnail
今天要介紹的是簡單的文本分析,主要內容會包含處理html標籤、jieba斷詞、TF-IDF轉換與Logistic Regression和svm,透過文本探勘預測哪些文本會成為熱門文章。
Thumbnail
在機器學習領域裡面,我們常常可以將問題分成兩種類型,一種是迴歸問題,而另一種則是分類問題,如何釐清我們所想要解決的問題是隸屬於那一類,是非常重要的一件事情,今天我們就來瞭解一下這兩種問題之間的差異吧!
Thumbnail
在機器學習領域裡面,我們常常可以將問題分成兩種類型,一種是迴歸問題,而另一種則是分類問題,如何釐清我們所想要解決的問題是隸屬於那一類,是非常重要的一件事情,今天我們就來瞭解一下這兩種問題之間的差異吧!
Thumbnail
今天想要跟大家分享的主題是”類別不平衡”問題,這個是實務上在導入人工智慧時,非常常見的問題,那麼什麼是”類別不平衡”呢?
Thumbnail
今天想要跟大家分享的主題是”類別不平衡”問題,這個是實務上在導入人工智慧時,非常常見的問題,那麼什麼是”類別不平衡”呢?
Thumbnail
在機器學習裡面,為了要追求更好的表現,我們除了要選出最適當的演算法來應對不同場景外,同時,在將原始資料蒐集好後,我們該如何從中萃取出重要且有用的資訊,是非常重要的一件事情,這就是所謂的”特徵工程”,今天我們就來針對這個主題談談吧...
Thumbnail
在機器學習裡面,為了要追求更好的表現,我們除了要選出最適當的演算法來應對不同場景外,同時,在將原始資料蒐集好後,我們該如何從中萃取出重要且有用的資訊,是非常重要的一件事情,這就是所謂的”特徵工程”,今天我們就來針對這個主題談談吧...
追蹤感興趣的內容從 Google News 追蹤更多 vocus 的最新精選內容追蹤 Google News