2023 碩士班專題演講感想『資料科學於不同領域之應用』

2023/12/09閱讀時間約 4 分鐘

當我答應這個邀約時,心中想著要不要挑戰新的題目,也順帶讓我可以把堆積以久的「資料科學」相關書籍看完。

因此,在還有好幾個月打底的情況下,我就設定了這個主題「資料科學於不同領域之應用」,既然決定了就要做到,但這也讓我後續苦不堪言。

一、主題設定

目前在授課的時候,因為有講授到一些「機器學習」的內容,再加上本來就比較熟悉的特徵擷取內容,這也算跟「資料科學」沾上一些邊,因此我想從比較高、比較寬廣的視野去談這些事情。

又正好這次演講的目標對象,不僅限於特定的所,有不同理工系所的學生會參加,這又讓我更堅定的想要把題目講大一些,然後再具體限縮或應用到特定領域。

但「理想很豐滿、現實很骨感」,當我開始在準備的時候,竟然有無從下手的感覺;要知道資料科學是個很大的題目,如果用教課的方式來演講,那大概開頭就沒人要聽了。

事實上我也沒有本事去闡述一個這麼大的主題,坦白說就是功夫不到家。

幸好當初的主題有強調「不同領域之應用」,於是我改變了演講內容的順序,讓我比較能夠掌控整體的架構。

二、內容呈現

基於上述的心路歷程,我決定倒過來從應用案例破題,先簡單說明「資料科學」包含以下流程:資料收集、資料處理、資料建模和分析、資料解釋以及決策制定,然後想辦法在「應用案例」中,清楚說明每個步驟到底要做些什麼事。

接著,我參考了一些論文,說明了資料科學在「房價預測」以及「智慧製造」的應用案例,其中我相對熟悉的是「智慧製造」;但我把「房價預測」擺在第一個應用案例,因為它相對比較貼近一般人的生活,當我們可以用一些方法來改善生活中會遭遇到的事時,會格外吸引人的注意力。

而我自己也是在檢索「房價預測」這個主題時,才發現原來有這麼多人以它為論文主題,這是個炙手可熱的研究方向,我也從中理解很多資料科學應用的觀念與技巧。

「智慧製造」這個主題相對熟悉,但我從來沒有用「資料科學」的角度去審視它;因此,當我在重新整理相關的資料時,覺得自己好像領悟了些什麼,但具體說不出來。

說明完兩個應用案例後,針對兩者在資料科學的處理步驟上的異同,做了簡單的討論;基本上跟「應用領域」具有比較大關聯性的是「資料收集」、「資料處理」以及「資料解釋與決策制定」。

所以,接下來就針對與應用領域相關性較低,也就是比較通用的步驟進行討論,那就是「資料建模與分析」。

以前我的演講習慣會從「大範圍講到小細節」,但這次是從不同的應用案例出發,然後再從中擷取它們的共通部份,然後才針對這個部份仔細說明;之所以會改變方式,主要還是我對於這個主題「大範圍」的掌握度不夠。

當然,講到「資料建模與分析」就很難避免討論建立「數學模型」,所以後面的演講內容主要依序分為:

  1. 資料分析與數學模型。
  2. 理解導向建模與應用導向建模。
  3. 數學模型簡介 (基礎與進階)。
  4. 建立數學模型。

說實話,講這些內容真是要了我的老命,我在數學方面的基礎並不好,雖然在研究上或應用中還是會用到一些數學模型的概念,但都是很片面的,並非很有系統的建置在我的腦海中。

不過我確實是透過這次的演講內容,紮實地幫自己好好上了一課,這就是「費曼學習法」中的主動學習;透過教學或演講讓自己有動機去學原本不熟悉的內容,因為要講給別人聽,所以自己在學習時就會想辦法挖掘其中的核心觀念。

我已經嘗試過很多次「費曼學習法」,雖然每次都有達到預期目標,學習的效率也很高,但過程中真是快樂與痛苦並存,再加上有期限的壓力,確實滿煎熬的。

就演講內容本身,算是有把整個脈絡說明清楚、時間上掌握也不錯,缺憾是對很多細節還不夠清楚,難以做到「舉重若輕」的感覺,因此我給自己打 80 分;一方面演講主題有達到設定的目標、另一方面聽演講的同學們至少沒睡著,我目測應該有超過三分之一的人有在認真聽。

三、結論

在這次的演講中,我先以兩個不同的應用案例來說明「資料科學」的流程;接著延伸應用案例中所提及的步驟,剖析如何建構及選擇數學模型;藉由理解常用數學模型的行為與性質,來確認目前使用的數學模型是否合適,以及該如何尋找其他可能的選項。

其實像這種近似概論的演講,某種程度上也是在提升自己的視野,以及知道還有哪些工具可以選擇。

「當你手裡只有錘子,在你看起來,所有東西都像是釘子」 如果唯一的工具是把錘子,就很容易把每件事情都當成釘子來處理。

想要避免單一思考的模式,就得讓自己具備多元思考的知識模型。

四、未來展望

因為我還有在研究所授課,因此接下來會繼續在「機器學習」與「深度學習」等領域下苦功,希望能夠熟悉所有相關的方法,並把它們的來龍去脈說清楚,在不依賴第三方函式庫的情況下,自己寫程式實作一遍。

當然,方法懂了,實作的工具也不可少,近期我正在鑽研如何用 FPGA 開發加速器,透過軟硬體整合的方式,讓高深莫測的理論可以具體應用在實務上,這才是工程研究人員最大的成就感來源之一。

閱讀可以用最低的成本來獲得別人經驗,培養閱讀能力,一生受益。但要記住,別只讓自己的大腦永遠處於「輸入狀態」,要適當地「輸出」自己的想法。透過閱讀輸入,再利用寫作輸出,就像「費曼學習法」說的一樣,教授到別人能夠了解,自己才算是領悟了這門學問。
留言0
查看全部
發表第一個留言支持創作者!
從 Google News 追蹤更多 vocus 的最新精選內容