Garbage in, garbage out!
資料科學最被詬病的就是餵了一堆垃圾訊息,最後還是得到垃圾訊息。
因此,能夠把垃圾變黃金,還有知道怎麼選有潛力變黃金的垃圾的人才,就顯得特別重要。
課堂上聽到很多預測miRNA基因序列和模型,其實不是那麼準確,用不同網站模型去預測可能會得到不同結果,這可能是資料科學很接近但又不是那麼精準的地方(趨近),有趣的是,miRNA細胞裡面作用的機轉,造物主也沒有要求精準,大概對到幾個重要序列,他就會作用了,有點像我們考試記重點一樣,小錯沒關係,大方向要對。
看看今年的諾貝爾化學獎,也是應用人工智慧高度準確預測蛋白質模型,人工智慧跟資料科學和我們生活越來越密不可分,ChatGPT逐漸取代google成為學生另一個問問題的老師,唯一不變的是,如何分辨資訊的真偽虛實,一樣是使用者必須克服的功課。
當盒子越來越黑,分辨資訊的難度和門檻,可能就會越來越高,到時候誰來當正確「常識」的把關者呢?