方格精選

【AI 人工智慧】ImageNet

更新於 發佈於 閱讀時間約 2 分鐘
ImageNet
在人工智慧領域裡,每年都會有許多厲害的算法被提出來,然而,資料的重要性往往被人低估甚至忽略,但有愈來愈多研究顯示,資料的品質、資料的數量與最終的結果有非常大的關係!
有鑑於此,不少企業開始努力的去思考如何蒐集有用的資料並將其轉換成新的附加價值。然而,並不是所有的機構都有能力以及足夠的資源去做資料蒐集這件事情。因此,開始有人去提倡公開資料集這麼一件事情,藉由這樣公開的手法,讓每位研究員不只能更專注在算法上之研究,同時也能加速人工智慧的發展,而在這當中最著名的案例,莫過於ImageNet這樣一個影像的資料庫了!
ImageNet是目前世界上最大的影像識別資料庫之一,他是由美國史丹佛大學計算機科學家所建立並免費公開於網路上給有興趣的人使用,那麼這個資料庫到底有多大呢?ImageNet包含了1500萬張照片,而每張照片都經過嚴格的人工去標注該照片屬於的類別,因此,整個資料集總共包含了2.2萬個不同的類別!
ImageNet的公開,使得短短的幾年內,影像辨識領域有發常大的突破以及發展。自從2010年以來,每年都會舉辦ILSVRC(ImageNet Large Scale Visual Recognition Competition)這樣一個影像相關的比賽,所使用的資料就是取自ImageNet,其目的就是想要號召全世界的專家一起來共同解決影像辨識的問題。
現在,我們可以很常見到AI在影像分類、目標檢測等多個領域表現非常出色,甚至很多時候都已經超越人類之水準了!這是一件令人相當振奮的事情,或許在過幾年,AI將帶給人類更多不同的創新以及應用,而公開資料集更能加速這些事情的發生阿!
*本文由知名AI講師-Isaac Lee 李厚均所撰寫
文章轉載自我們共同經營的粉絲頁-小李談數智https://www.facebook.com/isaac60103
更多圖解內容可以到 耀西圖像視覺化教室看看https://www.facebook.com/YoshiGraphics
為什麼會看到廣告
avatar-img
11會員
33內容數
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
Liao Yoshi的沙龍 的其他內容
講到生物辨識,大家第一個可能會想到的是什麼呢?是人臉辨識、指紋辨識、虹膜辨識、聲紋辨識還是其他呢? 今天我想要跟大家分享的是一個近幾年來興起的生物辨識–耳道辨識。
今天我們要來介紹一家非常有趣的美國公司–HireVue。 HireVue創立於2004年,其提供企業召募員工時所需要的線上面試軟體。
2018年以來,中美貿易戰的開打,兩國不只從提高關稅、抵制商品等一系列的措施外,這股戰火也漸漸燒到了高科技產業,包含半導體製程、關鍵材料、5G甚至連AI人工智慧技術也無一倖免。
什麼是時間序列?在許多領域當中,我們常會需要處理按照時間先後順序所形成的序列資料,這類型的資料我們稱之為時間序列(time series),像是金融領域裡預測股價的應用或是醫療領域裡心電圖的分析等,都是常見之時間序列,然而,要有效的分析時間序列一直都不是個簡單的事情。
自創思維:人生是永遠的測試版(The Start-up of You)是由雷德‧霍夫曼(Reid Hoffman)全球最大的專業社群網站 Linkedin 的共同創辦人共同撰寫的書。  本書作者認為,每個人都應該具備有創業精神,將自己當作一人公司,透過創業的方法打造一個成功的職涯生活。
人工智慧限制令 2018年以來,中美貿易戰的開打,兩國不只從提高關稅、抵制商品等一系列的措施外,這股戰火也漸漸燒到了高科技產業,包含半導體製程、關鍵材料、5G甚至連AI人工智慧技術也無一倖免。
講到生物辨識,大家第一個可能會想到的是什麼呢?是人臉辨識、指紋辨識、虹膜辨識、聲紋辨識還是其他呢? 今天我想要跟大家分享的是一個近幾年來興起的生物辨識–耳道辨識。
今天我們要來介紹一家非常有趣的美國公司–HireVue。 HireVue創立於2004年,其提供企業召募員工時所需要的線上面試軟體。
2018年以來,中美貿易戰的開打,兩國不只從提高關稅、抵制商品等一系列的措施外,這股戰火也漸漸燒到了高科技產業,包含半導體製程、關鍵材料、5G甚至連AI人工智慧技術也無一倖免。
什麼是時間序列?在許多領域當中,我們常會需要處理按照時間先後順序所形成的序列資料,這類型的資料我們稱之為時間序列(time series),像是金融領域裡預測股價的應用或是醫療領域裡心電圖的分析等,都是常見之時間序列,然而,要有效的分析時間序列一直都不是個簡單的事情。
自創思維:人生是永遠的測試版(The Start-up of You)是由雷德‧霍夫曼(Reid Hoffman)全球最大的專業社群網站 Linkedin 的共同創辦人共同撰寫的書。  本書作者認為,每個人都應該具備有創業精神,將自己當作一人公司,透過創業的方法打造一個成功的職涯生活。
人工智慧限制令 2018年以來,中美貿易戰的開打,兩國不只從提高關稅、抵制商品等一系列的措施外,這股戰火也漸漸燒到了高科技產業,包含半導體製程、關鍵材料、5G甚至連AI人工智慧技術也無一倖免。
你可能也想看
Google News 追蹤
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
GNN發展背景 傳統的深度學習模型如在計算機視覺(CV)和自然語言處理(NLP)領域中極為成功,主要是處理結構化數據如影像和文本。這些數據類型通常具有固定且規律的結構,例如影像是由有序的像素點組成。然而,在真實世界中,許多數據是非結構化的,如化合物結構(原子和分子)。這些數據雖然具有一定的規則性,
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
有網際網路以後,的確任何的資訊都可以在網路上搜尋到, 但一個很大的問題就是「資訊是破碎的」。 這也就造成有些人的工作, 就是專門收集網路上的訊息,整理出系統,制訂框架, 寫出一篇篇充滿資源連結的文章, 作為導覽讀者遨遊網路的領路人。 而現在AI 出現,這些領路人,可以把工作做得更好!
Thumbnail
本文談及資料科學的領域與分工。首先是建造一個AI的研發流程,資料收集到 AI 模型訓練的過程,AI經歷這一切流程被創造出來並產生價值;再來本文也提及在這個領域中的各種腳色、資料工程師、數據庫工程師、資料科學家和資料分析師的各種介紹。並且強調跨領域合作的重要性。
Thumbnail
U-Net演算法架構解析,首次介紹了U-Net的設計,架構,以及在Stable-diffusion中的應用。詳盡分析了U-Net的收縮路徑、擴展路徑、最終層,以及形變不變性的應用。同時提供了相關論文以及PyTorch實作的參考資料。
機器學習領域的專業人士可以從這篇文章中獲得寶貴的見解。 追求更大的數據集和更強大的模型一直是提升性能的核心策略。 以下是我在機器學習領域工作7年後的三個重大體悟。 ▋體悟1 - 大數據的重要性 自2009年ImageNet問世以來, 數據集的規模和質量對機器學習的影響越
以我的在機器學習領域工作7年的經驗, 追求更大的數據集以及更大的模型以達到更好的表現, 這件事已經持續存在15年以上。 這方面的歷史可以讀讀ImageNet的歷史故事。 你會了解到從2009年開始的 ImageNet , 如何逐步讓許多機器學習的技術民主化, 讓更
Thumbnail
卷積神經網路(CNN)是一種專門用於影像相關應用的神經網路。本文介紹了CNN在影像辨識中的應用,包括圖片的組成、Receptive Field、Parameter Sharing、以及Pooling等技術。通過本文,讀者將瞭解CNN在影像辨識領域的優勢和運作原理。
在網路世界的諸多角落中,Reddit 獨樹一格,成為了人類對話和集體回憶的寶庫。Reddit 的共同創辦人史蒂夫霍夫曼近日揭開了這個平台數據庫的神秘面紗,向外界展示了其對人工智慧訓練和學術研究所持有的無價價值。 霍夫曼指出,Reddit 擁有豐富且多樣的用戶生成內容,從熱烈的討論串到專業知
Thumbnail
AI 創作內容 (AIGC) 技術突飛猛進,人類已經越來越難辨識眼前所見照片、影片的真實度。為了讓使用者可以區別哪些是由 AI 產生的「非真實內容」,進而信任圖片的真實性,如:微軟、Adobe、Google、Midjourney、Nikon…等 AI 技術大廠紛紛建立起 AI 內容識別技術,幫助使用
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
Thumbnail
GNN發展背景 傳統的深度學習模型如在計算機視覺(CV)和自然語言處理(NLP)領域中極為成功,主要是處理結構化數據如影像和文本。這些數據類型通常具有固定且規律的結構,例如影像是由有序的像素點組成。然而,在真實世界中,許多數據是非結構化的,如化合物結構(原子和分子)。這些數據雖然具有一定的規則性,
Thumbnail
本文要探討AI的任務與實戰場景。AI技術已深入生活各層面,從違約預測到都市交通管理。AI任務主要有三類:數值型資料處理、自然語言處理(NLP)和電腦影像辨識。時間序列資料和強化學習方法(如AlphaGo)也引起廣泛關注。AI演算法和方法因應不同學派和技術發展而多樣化,了解這些基礎有助選擇適合研究方向
有網際網路以後,的確任何的資訊都可以在網路上搜尋到, 但一個很大的問題就是「資訊是破碎的」。 這也就造成有些人的工作, 就是專門收集網路上的訊息,整理出系統,制訂框架, 寫出一篇篇充滿資源連結的文章, 作為導覽讀者遨遊網路的領路人。 而現在AI 出現,這些領路人,可以把工作做得更好!
Thumbnail
本文談及資料科學的領域與分工。首先是建造一個AI的研發流程,資料收集到 AI 模型訓練的過程,AI經歷這一切流程被創造出來並產生價值;再來本文也提及在這個領域中的各種腳色、資料工程師、數據庫工程師、資料科學家和資料分析師的各種介紹。並且強調跨領域合作的重要性。
Thumbnail
U-Net演算法架構解析,首次介紹了U-Net的設計,架構,以及在Stable-diffusion中的應用。詳盡分析了U-Net的收縮路徑、擴展路徑、最終層,以及形變不變性的應用。同時提供了相關論文以及PyTorch實作的參考資料。
機器學習領域的專業人士可以從這篇文章中獲得寶貴的見解。 追求更大的數據集和更強大的模型一直是提升性能的核心策略。 以下是我在機器學習領域工作7年後的三個重大體悟。 ▋體悟1 - 大數據的重要性 自2009年ImageNet問世以來, 數據集的規模和質量對機器學習的影響越
以我的在機器學習領域工作7年的經驗, 追求更大的數據集以及更大的模型以達到更好的表現, 這件事已經持續存在15年以上。 這方面的歷史可以讀讀ImageNet的歷史故事。 你會了解到從2009年開始的 ImageNet , 如何逐步讓許多機器學習的技術民主化, 讓更
Thumbnail
卷積神經網路(CNN)是一種專門用於影像相關應用的神經網路。本文介紹了CNN在影像辨識中的應用,包括圖片的組成、Receptive Field、Parameter Sharing、以及Pooling等技術。通過本文,讀者將瞭解CNN在影像辨識領域的優勢和運作原理。
在網路世界的諸多角落中,Reddit 獨樹一格,成為了人類對話和集體回憶的寶庫。Reddit 的共同創辦人史蒂夫霍夫曼近日揭開了這個平台數據庫的神秘面紗,向外界展示了其對人工智慧訓練和學術研究所持有的無價價值。 霍夫曼指出,Reddit 擁有豐富且多樣的用戶生成內容,從熱烈的討論串到專業知
Thumbnail
AI 創作內容 (AIGC) 技術突飛猛進,人類已經越來越難辨識眼前所見照片、影片的真實度。為了讓使用者可以區別哪些是由 AI 產生的「非真實內容」,進而信任圖片的真實性,如:微軟、Adobe、Google、Midjourney、Nikon…等 AI 技術大廠紛紛建立起 AI 內容識別技術,幫助使用