【AI 人工智慧】類別不平衡

閱讀時間約 1 分鐘
類別不平衡
今天想要跟大家分享的主題是”類別不平衡”問題,這個是實務上在導入人工智慧時,非常常見的問題,那麼什麼是”類別不平衡”呢?
當然,我個人認為如果”成本”以及”時間”允許的話,持續蒐集少量類別的資料才是最好的方法,畢竟如果是自己製造出的少數類別資料,很有可能會無法充份反應真實資料的情況。
假設我們想要根據過去的天氣資料,來預測台北明天溫度是否會超過38度,也就是說,我們將明天的溫度分成大於38度以及小於38度兩類。
然而,根據歷年來所有統計的資料來看,台北超過38度的日子其實是非常少也相當罕見的,此時,兩個類別的資料數量差距會非常大,這就是我們所謂的”類別不平衡”,或者換句話說,當某類的類別是相對於其他類別來得罕見許多。
如果我們貿然的直接將類別不平衡的資料集拿去給人工智慧做學習,那麼很有可能會讓AI學到”只會預測明天天氣低於38度”這樣的結果,表面上他好像每天的溫度預測非常的準確,但實際上他喪失了預測異常溫度的情況!這並不是我們想要的結果。
一般來說,我們會期望不同類別之間的資料量差不多,但如果真的遇到了類別不平衡,除了花更多時間以及資源去蒐集更多罕見類別資料外,也有人會利用一些方法自己去大量製造少數類別的資料,來讓類別與類別之間更加的平衡!
*本文由知名AI講師-Isaac Lee 李厚均所撰寫
文章轉載自我們共同經營的粉絲頁-小李談數智https://www.facebook.com/isaac60103
更多圖解內容可以到 耀西圖像視覺化教室看看https://www.facebook.com/YoshiGraphics
為什麼會看到廣告
11會員
33內容數
留言0
查看全部
發表第一個留言支持創作者!
Liao Yoshi的沙龍 的其他內容
今天要來跟大家介紹一間非常有趣的人工智慧公司vectordash,這是個怎麼樣的一家公司呢?讓我們來了解一下...
常常有人在問,為什麼這幾年人工智慧會突然爆紅?原因有非常的多,但如果單以”技術”的角度來看,這幾年科技的發展剛好滿足了人工智慧的三個基本需求─算法、算力及資料...
寒武紀科技(Cambricon Technologies Corporation Limited)是一家在AI晶片非常有名的新創公司。於2016年創立,期望以成為全球第一價量產商業人工智慧晶片的公司,希望藉由高性能的人工智慧晶片讓客戶帶來更多的複雜運算與應用...
今天我們來介紹一家非常有名的AI獨角獸,商湯科技(SenseTime)。 這是家由香港中文大學工程學院團隊所組成的公司,也被稱為是博士密度最高的AI公司,成立的時間僅短短的4年,就擁有超過400家的企業成為他們合作夥伴,在規模及市佔率上面完全不遜於許多大型科技公司,實力不容小覷...
隨著網路以及數位化的興起,資料比以往更加的容易傳播以及儲存,過去使用者總是需要主動式的去獲取重要的資訊,然而,現在每天數以萬計的海量資料,我們是否已經漸漸變成被動式的接收各種重要或不重要的資訊了呢?
而在非監督式學習裡面,有一個種類的學習應用場景非常的特殊,它能夠幫助我們尋找資料之間隱藏的規則,協助我們去做商業決策,這就是我們今天想來談談的主題─關聯規則學習(association rule learning)...
今天要來跟大家介紹一間非常有趣的人工智慧公司vectordash,這是個怎麼樣的一家公司呢?讓我們來了解一下...
常常有人在問,為什麼這幾年人工智慧會突然爆紅?原因有非常的多,但如果單以”技術”的角度來看,這幾年科技的發展剛好滿足了人工智慧的三個基本需求─算法、算力及資料...
寒武紀科技(Cambricon Technologies Corporation Limited)是一家在AI晶片非常有名的新創公司。於2016年創立,期望以成為全球第一價量產商業人工智慧晶片的公司,希望藉由高性能的人工智慧晶片讓客戶帶來更多的複雜運算與應用...
今天我們來介紹一家非常有名的AI獨角獸,商湯科技(SenseTime)。 這是家由香港中文大學工程學院團隊所組成的公司,也被稱為是博士密度最高的AI公司,成立的時間僅短短的4年,就擁有超過400家的企業成為他們合作夥伴,在規模及市佔率上面完全不遜於許多大型科技公司,實力不容小覷...
隨著網路以及數位化的興起,資料比以往更加的容易傳播以及儲存,過去使用者總是需要主動式的去獲取重要的資訊,然而,現在每天數以萬計的海量資料,我們是否已經漸漸變成被動式的接收各種重要或不重要的資訊了呢?
而在非監督式學習裡面,有一個種類的學習應用場景非常的特殊,它能夠幫助我們尋找資料之間隱藏的規則,協助我們去做商業決策,這就是我們今天想來談談的主題─關聯規則學習(association rule learning)...
你可能也想看
Google News 追蹤
Thumbnail
接下來第二部分我們持續討論美國總統大選如何佈局, 以及選前一週到年底的操作策略建議 分析兩位候選人政策利多/ 利空的板塊和股票
Thumbnail
🤔為什麼團長的能力是死亡筆記本? 🤔為什麼像是死亡筆記本呢? 🤨作者巧思-讓妮翁死亡合理的幾個伏筆
Thumbnail
AI人工智慧不斷改變我們的世界,文章講述包含透過AI科技監控系統,追蹤鐵軌附近的大象活動,防止因火車撞擊而死亡。運用AI人工智慧工具臨床試驗,為憂鬱症患者提供更精準藥物治療,以及透過AI人工智慧產出的無人駕駛拖拉機,使農民提供農業效率並永續土地,讓我們一同探索AI人工智慧正快速改變的產業。
Thumbnail
在當今數位時代,AI人工智慧正成為引領未來的關鍵技術之一。AI的發展不僅改變了我們與科技互動的方式,還深刻地塑造了社會、經濟和文化的格局。以下將探討AI的定義、開發階段和其帶來的優勢。
沒想到路上就有櫻花大景!南投信義鄉的「觀山休息區」,現場種有40多棵桃紅色山櫻花樹,沿著台21線都可賞絕美櫻花景,夜晚雲海繚繞時,還有機會拍到夜櫻琉璃光! 觀山休息區桃紅色山櫻花樹,吸引網友前往取景。(圖/molly888666) 觀山休息區桃紅色山櫻花樹,吸引網友前往取景。(
人工智慧對於人類工作的取代問題引起了廣泛關注。雖然有些人認為人工智慧會取代許多傳統工作,但也有人認為它將創造更多就業機會。人工智慧的應用領域廣泛,可能取代一些重複性或低技能的工作,但同時也可能創造新的工作機會。面對這個挑戰,我們應該加強科技倫理和法規的制定,提供必要的培訓和轉型支援,以及促進社會對科
根據影片的內容, 歸納出以下重點: 1. AI革命將重新定義我們的未來。AI是一項普適技術,將改變每個經濟領域。 2. AI包含兩大主要工具 - 監督式學習和生成式AI。監督式學習擅長標籤,生成式AI可以產生新內容。 3. 生成式AI如GPT是最近十年的成就。它可以根據提示文本生成新
Thumbnail
墜落雲端的彈起 去(2022)年1月5日台股迎來了18,619點的高點,隨著不再出現塞港、重複下單、清庫存等議題,接著通膨過高引來的3月升息潮,股市一路震盪走跌。 去年10月25日台股的近期最低點12,629點,跌破1990年的12,682點。 隨著升息逐漸進入尾聲,清庫存的腳步也可以預期,加上股市
Thumbnail
所謂的「人工智慧」(artificial intelligence,縮寫為AI),可以說是模仿人類與人類思維相關的認知功能的機器或計算機,例如學習和解決問題。時至今日,網路科技產業持續在尋求透過人工智慧來達成對未來的可能想像。
Thumbnail
大家的乾媽(2020限定版)-凱瑟琳伍德的ARK基金公司每年都會提出對於未來5-10年的科技大趨勢研究報告,雖然目前ARK們的績效從2021年開始就積弱不振許久,但是ARK的研究仍是具有前瞻性、值得一讀的。ARK認為現在的投資,在未來五年後才是收割的時候。
Thumbnail
AI人工智慧是人類之友還是敵人? 其實《西》片主要環繞在在未來人工智能已經和人類真假不分的時代,AI人究竟是人類「玩樂的工具」,還是同樣享有生命權、思想自由及天賦人權的種族?抑或是處於人類對立面的天敵?我認為這也是編劇試著透過此劇跟現代人探討的。 在科技日新月異的今天,我們不知道有哪天會再出現賈伯斯
Thumbnail
接下來第二部分我們持續討論美國總統大選如何佈局, 以及選前一週到年底的操作策略建議 分析兩位候選人政策利多/ 利空的板塊和股票
Thumbnail
🤔為什麼團長的能力是死亡筆記本? 🤔為什麼像是死亡筆記本呢? 🤨作者巧思-讓妮翁死亡合理的幾個伏筆
Thumbnail
AI人工智慧不斷改變我們的世界,文章講述包含透過AI科技監控系統,追蹤鐵軌附近的大象活動,防止因火車撞擊而死亡。運用AI人工智慧工具臨床試驗,為憂鬱症患者提供更精準藥物治療,以及透過AI人工智慧產出的無人駕駛拖拉機,使農民提供農業效率並永續土地,讓我們一同探索AI人工智慧正快速改變的產業。
Thumbnail
在當今數位時代,AI人工智慧正成為引領未來的關鍵技術之一。AI的發展不僅改變了我們與科技互動的方式,還深刻地塑造了社會、經濟和文化的格局。以下將探討AI的定義、開發階段和其帶來的優勢。
沒想到路上就有櫻花大景!南投信義鄉的「觀山休息區」,現場種有40多棵桃紅色山櫻花樹,沿著台21線都可賞絕美櫻花景,夜晚雲海繚繞時,還有機會拍到夜櫻琉璃光! 觀山休息區桃紅色山櫻花樹,吸引網友前往取景。(圖/molly888666) 觀山休息區桃紅色山櫻花樹,吸引網友前往取景。(
人工智慧對於人類工作的取代問題引起了廣泛關注。雖然有些人認為人工智慧會取代許多傳統工作,但也有人認為它將創造更多就業機會。人工智慧的應用領域廣泛,可能取代一些重複性或低技能的工作,但同時也可能創造新的工作機會。面對這個挑戰,我們應該加強科技倫理和法規的制定,提供必要的培訓和轉型支援,以及促進社會對科
根據影片的內容, 歸納出以下重點: 1. AI革命將重新定義我們的未來。AI是一項普適技術,將改變每個經濟領域。 2. AI包含兩大主要工具 - 監督式學習和生成式AI。監督式學習擅長標籤,生成式AI可以產生新內容。 3. 生成式AI如GPT是最近十年的成就。它可以根據提示文本生成新
Thumbnail
墜落雲端的彈起 去(2022)年1月5日台股迎來了18,619點的高點,隨著不再出現塞港、重複下單、清庫存等議題,接著通膨過高引來的3月升息潮,股市一路震盪走跌。 去年10月25日台股的近期最低點12,629點,跌破1990年的12,682點。 隨著升息逐漸進入尾聲,清庫存的腳步也可以預期,加上股市
Thumbnail
所謂的「人工智慧」(artificial intelligence,縮寫為AI),可以說是模仿人類與人類思維相關的認知功能的機器或計算機,例如學習和解決問題。時至今日,網路科技產業持續在尋求透過人工智慧來達成對未來的可能想像。
Thumbnail
大家的乾媽(2020限定版)-凱瑟琳伍德的ARK基金公司每年都會提出對於未來5-10年的科技大趨勢研究報告,雖然目前ARK們的績效從2021年開始就積弱不振許久,但是ARK的研究仍是具有前瞻性、值得一讀的。ARK認為現在的投資,在未來五年後才是收割的時候。
Thumbnail
AI人工智慧是人類之友還是敵人? 其實《西》片主要環繞在在未來人工智能已經和人類真假不分的時代,AI人究竟是人類「玩樂的工具」,還是同樣享有生命權、思想自由及天賦人權的種族?抑或是處於人類對立面的天敵?我認為這也是編劇試著透過此劇跟現代人探討的。 在科技日新月異的今天,我們不知道有哪天會再出現賈伯斯