如果將人工智慧的演算法比喻為一台汽車,那麼資料就好像是驅動這台車的驅動力!任何一台車少了它,將無法順利向前行,也就無法達到交通之目的,所以掌握資料是非常重要的一件事!但許多人常會問,那麼在大數據的時代裡,我該如何去拿到這些資料並學習分析呢?今天我們就來針對這個主題談論一下吧!
一般來說,最直覺的方法就是找各領域擁有資料的人合作,由於AI工程師只懂得許許多多的算法,很常見的一個作法就是尋找某一特定領域的專家一起共同解決問題,這些專家不只提供資料,同時也提供他們專業領域的知識,來讓AI工程師可以不斷優化系統。
然而,並不是所有的人都有機會接觸到領域專家並合作,所以在這種情況下,參加比賽來獲取資料或許就是不錯的方法之一!而Kaggle這樣一個平台正好就能符合眾多人的需求!
Kaggle成立於2010年4月,它是一個數據分析以及數據建模的一個比賽平台,許多的企業以及領域專家能將資料發佈在上面,並號召世界上所有的資料科學家一同參與比賽解決問題,這樣一個平台大大的降低了過去拿取資料的困難度,也是推動資料科學的助力之一!
此外,在許多比賽辦完過後,這些資料不只保留再平台上供之後的人做參考,同時上面也有許多資深的專家再分享如何解決每種不同的資料集,藉由多多利用此平台,我們能更加的了解不同的公司、不同的領域該如何拿這些資料做應用,同時也能理解這些問題目前大概能被做到多好!
總之,藉由比賽來增加實戰經驗以及了解每個領域是如何用運資料是非常有用的一件事情!或許我們無法每個人都找到相對應的領域專家合作,但運用Kaggle這類的平台能幫助我們增加實戰經驗,提高我們對於資料的敏銳度!
*本文由知名AI講師-Isaac Lee 李厚均所撰寫