【碩博士生如何串連抽象、模型與模式:從統計到機器學習的深度思考】

閱讀時間約 4 分鐘


碩博士生,特別是那些研究統計、數學模型與機器學習的學生,經常會面對各種模型與抽象概念。但你是否曾經真正思考過這些「抽象」與「模型」的本質,以及它們如何在現代資料科學與機器學習領域中產生關聯?今天,我透過閱讀日本作者西尾泰和的著作《エンジニアの知的生産術》,從「抽象」到「模型」再到「模式」的串連,讓我有了新的領悟。

raw-image



▌從「抽象」到「模型」的概念轉化

所謂的「抽象」,其實是將具體事物中最重要的部分提取出來,去除不必要的細節。正如 Abstract 的詞源,其中的「tract」意味著「抽出 extract」或「減去 subtract」,而「ab」則代表著遠離具體對象。這種遠離具體、聚焦於核心的過程,正是數學模型與統計模型的基礎。


舉例來說,在統計模型中,我們經常需要將真實世界中的複雜數據簡化為一些變數與參數,這就是一種抽象化的過程。而這些模型的意義,並不僅僅是描述現實世界,而是透過抽象與簡化,使我們更容易掌握數據背後的本質。


▌「模型」作為理解現實的工具

模型(Model)的核心作用在於簡化現實,為了說明某個特定現象或系統的運作。我在研究統計機器學習時,經常要與各種模型打交道。這些模型無論是統計模型、數學模型,還是機器學習中的演算法模型,最終的目的都是為了幫助我們理解或預測現實世界中的行為。


回顧我的學習歷程,在台大數學系學到的數學模型讓我看懂了各種運算背後的邏輯,而在應用數學所的統計模型學習進一步深化了我對數據的理解。博士階段在普渡大學學習統計機器學習,則讓我進一步掌握了演算法模型的運作原理,這些模型是如何自動化決策並解讀數據的。


▌模式(Pattern)的重要性

「模式 Pattern」是指在抽象與模型的基礎上,我們所看到的世界。模式可以是我們從數據中觀察到的趨勢,也可以是設計上的結構。無論是程式設計中的「設計模式 Design Pattern」,還是機器學習中的資料模式,這些模式都為我們提供了一個簡化後的視角,使我們能更快速地辨識與理解複雜系統中的規律。


西尾泰和的書讓我更清楚地理解了「模式」在我研究領域中的作用,尤其是當這些模式與模型結合時,能夠幫助我們更有效地處理現實問題,無論是統計分析還是機器學習模型的建構。


▌從抽象到模式,深化你的研究

對於碩博士生來說,理解這些概念不僅僅是一種理論上的需求,更是實踐中的核心能力。在現代的「數據基礎建設 Data Infrastructure」中,許多「機器學習工程 Machine Learning Engineering」的工作,正是基於我們對抽象、模型與模式的理解。這些工具的運用讓我們的研究更加深入,並且促使人類文明的進步。


總結來說,透過將抽象概念具體化,再將其轉化為模型與模式,我們能夠在研究中進行更加有效的思考與實踐。這種全盤的理解,正是碩博士生在學術生涯中需要掌握的關鍵能力。

avatar-img
531會員
1.8K內容數
Outline as Content
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
王啟樺的沙龍 的其他內容
對於碩博士生來說,閱讀與寫作是日常研究的一部分,但要真正內化所學,僅靠快速讀完一本書是不夠的。經常我們會遇到讀完書後,腦中有一些模糊的概念或想法,但無法具體化。這種情況下,寫作便是一個有效的工具來幫助我們將這些想法具體呈現出來。日本作者山口拓郎的著作《「うまく言葉にできない」がなくなる 言語化大
碩博士生在學習與研究的過程中,常常會遇到一個問題:如何找到自己的研究方向,或是在茫茫的學術資料中,篩選出自己感興趣的內容?日本作家井上新八在《「やりたいこと」も「やるべきこと」も全部できる! 続ける思考》中提到的一個概念,也許能給你一些啟發——紀錄「自己的審美(こだわり)」。這種方法不僅能幫助你
作為研究生,面對沉重的學術壓力與緊湊的生活節奏,許多人都會想,究竟該把有限的經費存起來,還是應該投資在各種體驗上?日本作家山口拓郎在《言語化大全》中提到,「透過體驗所得到的感受與情緒,是獨一無二的」,這讓我思考,體驗能帶來什麼樣的價值? 對我來說,2022-2024這兩年,累積了豐富的美國
「讀書的成果,在“要讀什麼?”就已經決定了8成。」 「讀書只需要想兩個問題:讀什麼好?怎麼讀好?」 「對讀書而有有幫助的輸出是什麼?」 「短期有幫助的輸出,是將原本不會的事情變得會。」 「長期有幫助的輸出,是從沒有懷疑的嘗試中找出新的問題的能力,以及掌握新框架的能力。」
1. 忽視時間管理,導致講座進度失控 許多博士生在準備講座時,未能合理分配各個環節的時間,結果在講座進行中出現時間超支或不足的情況。例如,演講部分可能過於冗長,佔用了原本留給討論的時間,或是整個講座結束得比預期早,讓聽眾感到意猶未盡。這種對時間掌控的失誤,會影響聽眾的體驗和對講座的評價。
許多碩博士生在學期間,心裡的目標是成為某個領域的厲害學者。這樣的想法沒錯,但我想說,其實「成為能堅持到底的學者」或許才是更重要的目標。 研究是一條漫長的路,過程中的挫折與挑戰往往超過想像。因此,比起短期內達成突破,如何保持持續力才是真正的關鍵。就像我在數學、統計、機器學習、資料科學這些領域
對於碩博士生來說,閱讀與寫作是日常研究的一部分,但要真正內化所學,僅靠快速讀完一本書是不夠的。經常我們會遇到讀完書後,腦中有一些模糊的概念或想法,但無法具體化。這種情況下,寫作便是一個有效的工具來幫助我們將這些想法具體呈現出來。日本作者山口拓郎的著作《「うまく言葉にできない」がなくなる 言語化大
碩博士生在學習與研究的過程中,常常會遇到一個問題:如何找到自己的研究方向,或是在茫茫的學術資料中,篩選出自己感興趣的內容?日本作家井上新八在《「やりたいこと」も「やるべきこと」も全部できる! 続ける思考》中提到的一個概念,也許能給你一些啟發——紀錄「自己的審美(こだわり)」。這種方法不僅能幫助你
作為研究生,面對沉重的學術壓力與緊湊的生活節奏,許多人都會想,究竟該把有限的經費存起來,還是應該投資在各種體驗上?日本作家山口拓郎在《言語化大全》中提到,「透過體驗所得到的感受與情緒,是獨一無二的」,這讓我思考,體驗能帶來什麼樣的價值? 對我來說,2022-2024這兩年,累積了豐富的美國
「讀書的成果,在“要讀什麼?”就已經決定了8成。」 「讀書只需要想兩個問題:讀什麼好?怎麼讀好?」 「對讀書而有有幫助的輸出是什麼?」 「短期有幫助的輸出,是將原本不會的事情變得會。」 「長期有幫助的輸出,是從沒有懷疑的嘗試中找出新的問題的能力,以及掌握新框架的能力。」
1. 忽視時間管理,導致講座進度失控 許多博士生在準備講座時,未能合理分配各個環節的時間,結果在講座進行中出現時間超支或不足的情況。例如,演講部分可能過於冗長,佔用了原本留給討論的時間,或是整個講座結束得比預期早,讓聽眾感到意猶未盡。這種對時間掌控的失誤,會影響聽眾的體驗和對講座的評價。
許多碩博士生在學期間,心裡的目標是成為某個領域的厲害學者。這樣的想法沒錯,但我想說,其實「成為能堅持到底的學者」或許才是更重要的目標。 研究是一條漫長的路,過程中的挫折與挑戰往往超過想像。因此,比起短期內達成突破,如何保持持續力才是真正的關鍵。就像我在數學、統計、機器學習、資料科學這些領域
你可能也想看
Google News 追蹤
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
1. 掌握學習的三階段循環: - 學習的過程應包括具體階段、抽象階段和應用階段。具體階段是情報收集和紀錄體驗,學生應該積極收集相關資訊並詳細記錄自己的學習過程。抽象階段是抽象化、模型化和發現模式,這時候要將所學知識進行歸納總結,形成抽象的模型和發現其中的規律。應用階段是實踐和檢證,將所學知識
1. 製造知識的能力: - 在學術研究中,寫學術文章與寫社群文章有很大的不同。學術文章需要設計實驗、製作論據,並與相關的研究比較,展示自己的貢獻。這種製造知識的能力,奠定了研究生能夠研究並學會任何感興趣的東西的基礎,不需要依賴「知識代理人」的二手精華版知識。例如,我在普渡大學和UCLA的研
Thumbnail
暨上篇文章與大家簡單介紹資訊種子的培訓內容後,這篇文章將與大家分享我自己在是如何加入資訊種子的,以及在這一年中的所見所聞與心得。不管是對資訊種子有興趣,或是仍在猶豫要不要加入資訊種子的人,千萬不要錯過了!
2024年7月2日, 我正在指導的復旦大學數學系三年級學生說道: 「有的數學也有應用場景,但應用場景本身好像也不能指導方法的創新, 反而是要依靠數學感覺來進行研究。」 我當時給的建議是:「關於這個點,你可以注意,創新有分「問題的創新」與「解法的創新」。」 一般來說,實務
Thumbnail
在人生的道路上,許多事情因社會的變化需要持續學習與練習新的工具。在過去的世代,或許可以在五年內學習一項技能並持續使用,但現在可能需要搭配不同的知識與背景。筆者與同世代的博士以及有業界經驗的朋友,都會先以國立大學的兼任助理教授做起,對於學校來說,這有助於讓學生了解進入業界的一些經驗。在學術研究上,也會
資工系啊!在這個升學的時間肯定是被搶破頭的科系吧,不論是未來誘人的薪資還是AI的浪潮,這個行業⋯你們肯定充滿了想像與嚮往 資工系與其說是科學或工程、它其實更像邏輯、藝術、和歷史的結合,很多設計、很多程式碼、很多非硬性規定追根究底的話就是「喔⋯⋯當初大家這樣講好了啊」「這樣寫比較好⋯因為如果⋯就會⋯
Thumbnail
這篇文章介紹了Sci-Hub的使用方法,方便研究生免費下載無法在學校資源中找到的學術論文。文中還提到一些研究生新手需要的軟知識,例如如何與教授互動、撰寫碩士論文的方法及研究生常見的焦慮與解決方案。此外,文章推薦了幾個有用的資源網站和文章,幫助研究生更好地完成論文寫作和研究工作。
28歲之前,我也曾認為基礎科學研究與現實脫節。然而,隨著我在美國普渡大學的求學經歷,這一觀點逐漸發生了變化。回顧我在台灣大學數學系、應用數學所,以及中央研究院統計所的七年時光,確實感覺基礎研究似乎與現實相距甚遠。然而,博士時期的經歷讓我有機會追尋許多重要問題的源頭,逐漸理解到有價值的基礎科學研究,最
Thumbnail
在生成研究問題,並且對於先行研究進行過一系列的文獻探討之後,研究者可以提出研究假說。會有假說,主要是研究者在提出研究問題的時候,可能心有定見,問題才能成立。上野千鶴子在《如何做好研究論文》一書中,用一個例子來說明如何提出假說。 例如研究者觀察到學生在高中時期經過激烈的考試競爭後上大學,但在上大學後
Thumbnail
嘿,大家新年快樂~ 新年大家都在做什麼呢? 跨年夜的我趕工製作某個外包設計案,在工作告一段落時趕上倒數。 然後和兩個小孩過了一個忙亂的元旦。在深夜時刻,看到朋友傳來的解籤網站,興致勃勃熬夜體驗了一下,覺得非常好玩,或許有人玩過了,但還是想寫上來分享紀錄一下~
1. 掌握學習的三階段循環: - 學習的過程應包括具體階段、抽象階段和應用階段。具體階段是情報收集和紀錄體驗,學生應該積極收集相關資訊並詳細記錄自己的學習過程。抽象階段是抽象化、模型化和發現模式,這時候要將所學知識進行歸納總結,形成抽象的模型和發現其中的規律。應用階段是實踐和檢證,將所學知識
1. 製造知識的能力: - 在學術研究中,寫學術文章與寫社群文章有很大的不同。學術文章需要設計實驗、製作論據,並與相關的研究比較,展示自己的貢獻。這種製造知識的能力,奠定了研究生能夠研究並學會任何感興趣的東西的基礎,不需要依賴「知識代理人」的二手精華版知識。例如,我在普渡大學和UCLA的研
Thumbnail
暨上篇文章與大家簡單介紹資訊種子的培訓內容後,這篇文章將與大家分享我自己在是如何加入資訊種子的,以及在這一年中的所見所聞與心得。不管是對資訊種子有興趣,或是仍在猶豫要不要加入資訊種子的人,千萬不要錯過了!
2024年7月2日, 我正在指導的復旦大學數學系三年級學生說道: 「有的數學也有應用場景,但應用場景本身好像也不能指導方法的創新, 反而是要依靠數學感覺來進行研究。」 我當時給的建議是:「關於這個點,你可以注意,創新有分「問題的創新」與「解法的創新」。」 一般來說,實務
Thumbnail
在人生的道路上,許多事情因社會的變化需要持續學習與練習新的工具。在過去的世代,或許可以在五年內學習一項技能並持續使用,但現在可能需要搭配不同的知識與背景。筆者與同世代的博士以及有業界經驗的朋友,都會先以國立大學的兼任助理教授做起,對於學校來說,這有助於讓學生了解進入業界的一些經驗。在學術研究上,也會
資工系啊!在這個升學的時間肯定是被搶破頭的科系吧,不論是未來誘人的薪資還是AI的浪潮,這個行業⋯你們肯定充滿了想像與嚮往 資工系與其說是科學或工程、它其實更像邏輯、藝術、和歷史的結合,很多設計、很多程式碼、很多非硬性規定追根究底的話就是「喔⋯⋯當初大家這樣講好了啊」「這樣寫比較好⋯因為如果⋯就會⋯
Thumbnail
這篇文章介紹了Sci-Hub的使用方法,方便研究生免費下載無法在學校資源中找到的學術論文。文中還提到一些研究生新手需要的軟知識,例如如何與教授互動、撰寫碩士論文的方法及研究生常見的焦慮與解決方案。此外,文章推薦了幾個有用的資源網站和文章,幫助研究生更好地完成論文寫作和研究工作。
28歲之前,我也曾認為基礎科學研究與現實脫節。然而,隨著我在美國普渡大學的求學經歷,這一觀點逐漸發生了變化。回顧我在台灣大學數學系、應用數學所,以及中央研究院統計所的七年時光,確實感覺基礎研究似乎與現實相距甚遠。然而,博士時期的經歷讓我有機會追尋許多重要問題的源頭,逐漸理解到有價值的基礎科學研究,最
Thumbnail
在生成研究問題,並且對於先行研究進行過一系列的文獻探討之後,研究者可以提出研究假說。會有假說,主要是研究者在提出研究問題的時候,可能心有定見,問題才能成立。上野千鶴子在《如何做好研究論文》一書中,用一個例子來說明如何提出假說。 例如研究者觀察到學生在高中時期經過激烈的考試競爭後上大學,但在上大學後