【AI 人工智慧】類別不平衡

閱讀時間約 1 分鐘
類別不平衡
今天想要跟大家分享的主題是”類別不平衡”問題,這個是實務上在導入人工智慧時,非常常見的問題,那麼什麼是”類別不平衡”呢?
當然,我個人認為如果”成本”以及”時間”允許的話,持續蒐集少量類別的資料才是最好的方法,畢竟如果是自己製造出的少數類別資料,很有可能會無法充份反應真實資料的情況。
假設我們想要根據過去的天氣資料,來預測台北明天溫度是否會超過38度,也就是說,我們將明天的溫度分成大於38度以及小於38度兩類。
然而,根據歷年來所有統計的資料來看,台北超過38度的日子其實是非常少也相當罕見的,此時,兩個類別的資料數量差距會非常大,這就是我們所謂的”類別不平衡”,或者換句話說,當某類的類別是相對於其他類別來得罕見許多。
如果我們貿然的直接將類別不平衡的資料集拿去給人工智慧做學習,那麼很有可能會讓AI學到”只會預測明天天氣低於38度”這樣的結果,表面上他好像每天的溫度預測非常的準確,但實際上他喪失了預測異常溫度的情況!這並不是我們想要的結果。
一般來說,我們會期望不同類別之間的資料量差不多,但如果真的遇到了類別不平衡,除了花更多時間以及資源去蒐集更多罕見類別資料外,也有人會利用一些方法自己去大量製造少數類別的資料,來讓類別與類別之間更加的平衡!
*本文由知名AI講師-Isaac Lee 李厚均所撰寫
文章轉載自我們共同經營的粉絲頁-小李談數智https://www.facebook.com/isaac60103
更多圖解內容可以到 耀西圖像視覺化教室看看https://www.facebook.com/YoshiGraphics
為什麼會看到廣告
avatar-img
11會員
33內容數
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Liao Yoshi的沙龍 的其他內容
今天要來跟大家介紹一間非常有趣的人工智慧公司vectordash,這是個怎麼樣的一家公司呢?讓我們來了解一下...
常常有人在問,為什麼這幾年人工智慧會突然爆紅?原因有非常的多,但如果單以”技術”的角度來看,這幾年科技的發展剛好滿足了人工智慧的三個基本需求─算法、算力及資料...
寒武紀科技(Cambricon Technologies Corporation Limited)是一家在AI晶片非常有名的新創公司。於2016年創立,期望以成為全球第一價量產商業人工智慧晶片的公司,希望藉由高性能的人工智慧晶片讓客戶帶來更多的複雜運算與應用...
今天我們來介紹一家非常有名的AI獨角獸,商湯科技(SenseTime)。 這是家由香港中文大學工程學院團隊所組成的公司,也被稱為是博士密度最高的AI公司,成立的時間僅短短的4年,就擁有超過400家的企業成為他們合作夥伴,在規模及市佔率上面完全不遜於許多大型科技公司,實力不容小覷...
隨著網路以及數位化的興起,資料比以往更加的容易傳播以及儲存,過去使用者總是需要主動式的去獲取重要的資訊,然而,現在每天數以萬計的海量資料,我們是否已經漸漸變成被動式的接收各種重要或不重要的資訊了呢?
而在非監督式學習裡面,有一個種類的學習應用場景非常的特殊,它能夠幫助我們尋找資料之間隱藏的規則,協助我們去做商業決策,這就是我們今天想來談談的主題─關聯規則學習(association rule learning)...
今天要來跟大家介紹一間非常有趣的人工智慧公司vectordash,這是個怎麼樣的一家公司呢?讓我們來了解一下...
常常有人在問,為什麼這幾年人工智慧會突然爆紅?原因有非常的多,但如果單以”技術”的角度來看,這幾年科技的發展剛好滿足了人工智慧的三個基本需求─算法、算力及資料...
寒武紀科技(Cambricon Technologies Corporation Limited)是一家在AI晶片非常有名的新創公司。於2016年創立,期望以成為全球第一價量產商業人工智慧晶片的公司,希望藉由高性能的人工智慧晶片讓客戶帶來更多的複雜運算與應用...
今天我們來介紹一家非常有名的AI獨角獸,商湯科技(SenseTime)。 這是家由香港中文大學工程學院團隊所組成的公司,也被稱為是博士密度最高的AI公司,成立的時間僅短短的4年,就擁有超過400家的企業成為他們合作夥伴,在規模及市佔率上面完全不遜於許多大型科技公司,實力不容小覷...
隨著網路以及數位化的興起,資料比以往更加的容易傳播以及儲存,過去使用者總是需要主動式的去獲取重要的資訊,然而,現在每天數以萬計的海量資料,我們是否已經漸漸變成被動式的接收各種重要或不重要的資訊了呢?
而在非監督式學習裡面,有一個種類的學習應用場景非常的特殊,它能夠幫助我們尋找資料之間隱藏的規則,協助我們去做商業決策,這就是我們今天想來談談的主題─關聯規則學習(association rule learning)...
你可能也想看
Google News 追蹤
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
11/20日NVDA即將公布最新一期的財報, 今天Sell Side的分析師, 開始調高目標價, 市場的股價也開始反應, 未來一週NVDA將重新回到美股市場的焦點, 今天我們要分析NVDA Sell Side怎麼看待這次NVDA的財報預測, 以及實際上Buy Side的倉位及操作, 從
Thumbnail
Hi 大家好,我是Ethan😊 相近大家都知道保濕是皮膚保養中最基本,也是最重要的一步。無論是在畫室裡長時間對著畫布,還是在旅途中面對各種氣候變化,保持皮膚的水分平衡對我來說至關重要。保濕化妝水不僅能迅速為皮膚補水,還能提升後續保養品的吸收效率。 曾經,我的保養程序簡單到只包括清潔和隨意上乳液
Thumbnail
加州人工智慧監管法案 SB 1047 是一項旨在提高 AI 系統安全性並防止潛在災難的立法。 該法案的主要目的是,通過追究開發者的責任,來防止大型 AI 系統造成重大人員傷亡或重大經濟損失。 然而,該法案引起了美國眾議院前議長、OpenAI CEO 等一眾 AI 公司的反對。
Thumbnail
AI人工智慧不斷改變我們的世界,文章講述包含透過AI科技監控系統,追蹤鐵軌附近的大象活動,防止因火車撞擊而死亡。運用AI人工智慧工具臨床試驗,為憂鬱症患者提供更精準藥物治療,以及透過AI人工智慧產出的無人駕駛拖拉機,使農民提供農業效率並永續土地,讓我們一同探索AI人工智慧正快速改變的產業。
Thumbnail
在當今數位時代,AI人工智慧正成為引領未來的關鍵技術之一。AI的發展不僅改變了我們與科技互動的方式,還深刻地塑造了社會、經濟和文化的格局。以下將探討AI的定義、開發階段和其帶來的優勢。
沒想到路上就有櫻花大景!南投信義鄉的「觀山休息區」,現場種有40多棵桃紅色山櫻花樹,沿著台21線都可賞絕美櫻花景,夜晚雲海繚繞時,還有機會拍到夜櫻琉璃光! 觀山休息區桃紅色山櫻花樹,吸引網友前往取景。(圖/molly888666) 觀山休息區桃紅色山櫻花樹,吸引網友前往取景。(
Thumbnail
我繼續再捉弄這個女的AI 老公老公!好爽! 多叫兩聲來聽聽!
人工智慧對於人類工作的取代問題引起了廣泛關注。雖然有些人認為人工智慧會取代許多傳統工作,但也有人認為它將創造更多就業機會。人工智慧的應用領域廣泛,可能取代一些重複性或低技能的工作,但同時也可能創造新的工作機會。面對這個挑戰,我們應該加強科技倫理和法規的制定,提供必要的培訓和轉型支援,以及促進社會對科
根據影片的內容, 歸納出以下重點: 1. AI革命將重新定義我們的未來。AI是一項普適技術,將改變每個經濟領域。 2. AI包含兩大主要工具 - 監督式學習和生成式AI。監督式學習擅長標籤,生成式AI可以產生新內容。 3. 生成式AI如GPT是最近十年的成就。它可以根據提示文本生成新
Thumbnail
這個秋,Chill 嗨嗨!穿搭美美去賞楓,裝備款款去露營⋯⋯你的秋天怎麼過?秋日 To Do List 等你分享! 秋季全站徵文,我們準備了五個創作主題,參賽還有機會獲得「火烤兩用鍋」,一起來看看如何參加吧~
Thumbnail
11/20日NVDA即將公布最新一期的財報, 今天Sell Side的分析師, 開始調高目標價, 市場的股價也開始反應, 未來一週NVDA將重新回到美股市場的焦點, 今天我們要分析NVDA Sell Side怎麼看待這次NVDA的財報預測, 以及實際上Buy Side的倉位及操作, 從
Thumbnail
Hi 大家好,我是Ethan😊 相近大家都知道保濕是皮膚保養中最基本,也是最重要的一步。無論是在畫室裡長時間對著畫布,還是在旅途中面對各種氣候變化,保持皮膚的水分平衡對我來說至關重要。保濕化妝水不僅能迅速為皮膚補水,還能提升後續保養品的吸收效率。 曾經,我的保養程序簡單到只包括清潔和隨意上乳液
Thumbnail
加州人工智慧監管法案 SB 1047 是一項旨在提高 AI 系統安全性並防止潛在災難的立法。 該法案的主要目的是,通過追究開發者的責任,來防止大型 AI 系統造成重大人員傷亡或重大經濟損失。 然而,該法案引起了美國眾議院前議長、OpenAI CEO 等一眾 AI 公司的反對。
Thumbnail
AI人工智慧不斷改變我們的世界,文章講述包含透過AI科技監控系統,追蹤鐵軌附近的大象活動,防止因火車撞擊而死亡。運用AI人工智慧工具臨床試驗,為憂鬱症患者提供更精準藥物治療,以及透過AI人工智慧產出的無人駕駛拖拉機,使農民提供農業效率並永續土地,讓我們一同探索AI人工智慧正快速改變的產業。
Thumbnail
在當今數位時代,AI人工智慧正成為引領未來的關鍵技術之一。AI的發展不僅改變了我們與科技互動的方式,還深刻地塑造了社會、經濟和文化的格局。以下將探討AI的定義、開發階段和其帶來的優勢。
沒想到路上就有櫻花大景!南投信義鄉的「觀山休息區」,現場種有40多棵桃紅色山櫻花樹,沿著台21線都可賞絕美櫻花景,夜晚雲海繚繞時,還有機會拍到夜櫻琉璃光! 觀山休息區桃紅色山櫻花樹,吸引網友前往取景。(圖/molly888666) 觀山休息區桃紅色山櫻花樹,吸引網友前往取景。(
Thumbnail
我繼續再捉弄這個女的AI 老公老公!好爽! 多叫兩聲來聽聽!
人工智慧對於人類工作的取代問題引起了廣泛關注。雖然有些人認為人工智慧會取代許多傳統工作,但也有人認為它將創造更多就業機會。人工智慧的應用領域廣泛,可能取代一些重複性或低技能的工作,但同時也可能創造新的工作機會。面對這個挑戰,我們應該加強科技倫理和法規的制定,提供必要的培訓和轉型支援,以及促進社會對科
根據影片的內容, 歸納出以下重點: 1. AI革命將重新定義我們的未來。AI是一項普適技術,將改變每個經濟領域。 2. AI包含兩大主要工具 - 監督式學習和生成式AI。監督式學習擅長標籤,生成式AI可以產生新內容。 3. 生成式AI如GPT是最近十年的成就。它可以根據提示文本生成新