D020|機器學習理論如何指導實務?

閱讀時間約 2 分鐘

「直覺和生活常識非常有用,但缺乏知識的直覺會欺騙你。」


「Google對產品經理的要求是,在沒有數據之前不要輕易給出結論。」


「有些事情讓你放棄掉生活中獲得的直覺,是千難萬難。」


「有一點經驗的工程師都知道,任何產品的性能都有一個物理上無法突破的極限,


這個極限並不需要等到工程上接近的那一天才知道,


而是早就可以通過已有的理論直接給出。」


「缺乏工程思維的人才會想,隨著科技的發展,任何人間奇跡都是可能的。」


這段討論,節錄自吳軍老師矽谷來信第二季的內容[1],


引發我對科學與工程的思考。


由於我的背景是台大數學系與台大應用數學所,


在2017年開始在美國普渡大學攻讀統計學博士時,


手上有的研究工具,都是數學工具。


我在臺大時期,一直都是數學分析工具的愛好者:


實分析,泛函分析,測度論,機率論,隨機過程,隨機微積分。


而由於在台大,也受純數學工具的各種薰陶:


抽象代數,代數幾何,微分幾何,李群李代數。


而到了普渡大學,開始研究統計機器學習理論,


很自然就會從數學理論的角度去想怎麼做研究。


然而,在我的經驗上,直接從會的工具出發去做科學研究,


就落入了手上有錘子,看什麼都是釘子的尷尬局面,


容易做出沒人關心,意義不大的成果。


而吳軍老師這一講,給出了理論研究的意義:


要能為工程實務,指導其根本極限。


如此,我也開始理解,為什麼機器學習理論,


要討論什麼樣的機器學習任務是「可學的 Learable」,


而如果可學,那麼學會的「樣本複雜度 Sample Complexity」是多大,


而如果缺失的某些「資訊 Information」的來源,


任務的可學性如何,樣本複雜度又會增加多少。


這的確都是達成「可擴展性 Scalability」前,需要考慮的維度。


很不錯,感覺我看理論題目的品味又提升了一層。


Reference

[1] 吳軍 - 硅谷来信2-谷歌方法论 - 第003封信 | 工程思维:直觉和极限 (https://www.dedao.cn/course/article?id=rykaNlMY5gn3JqZA7X7EAROW0DLjev)


366會員
1.1K內容數
Outline as Content
留言0
查看全部
發表第一個留言支持創作者!
王啟樺的沙龍 的其他內容
1. 誤解Abduction與其他推理方法的區別 - 在台灣,Abduction通常被翻譯為「溯因推理」,是基於事實回溯出背後可能的原因,以找到最佳解釋「事情發生背後機制」的過程。然而,許多學生誤以為Abduction僅僅是「發想法」,未能理解其實質是提出假說並尋找證據驗證。 - 此
有了這個「自學的模型」,我進一步想反芻我目前寫讀書筆記的方式。 目前我寫讀書筆記的方式,正如同你讀到的這篇文章, 基本上有三個成分: 01 節錄文章書籍中有意思的討論內容 02 附註文章書籍的作者以及節錄內容的出處 03 寫300字自己從節錄內容獲得的啟發與思考
1. 被食物、書籍、網路、娛樂與社群媒體佔據整天醒著的時間: - 許多研究生常常在不知不覺中被各種媒介吸引,大量時間花費在非學術活動上,尤其是社群媒體如Facebook、Instagram、Threads等,這些平台以「潛移默化」的方式影響我們的思維和行為。這些分心的活動不僅浪費時間,還可能
我在高中與大學時期,也是 Note Taker。 年輕的時候買了很多書,翻了很多書, 到處看來看去,但總是覺得東西都有點印象, 用聊天的還能說出一些故事自圓其說, 但如果用寫的,每個字都憋得很困難。 但隨著抵達碩士與博士時期, 用寫作表達想法是每天都要做的事, 我開始在寫作上下足功夫。
1. 同時嘗試太多不同的方向: - 這類學生希望在學術研究與實務應用間取得平衡,但通常沒有一項能全力以赴。結果是,他們的時間和精力被分散,導致最終無法在任何一個方向上取得顯著的成果。這樣的學生在經過一段時間後,常會感到困惑,為何自己未能達到預期的目標。 2. 沒有專注於特定的研究方向: -
每天大量的自由寫作, 就像是桿麵團一樣, 而將自由寫作的草稿進一步, 用一些模板寫成短文, 就像是拿餅乾模具做餅乾一樣。 而社區媒體就是你賣餅乾的市場, 餅乾好吃就有很多點讚評論轉發, 餅乾不好吃讀者就吐出來。
1. 誤解Abduction與其他推理方法的區別 - 在台灣,Abduction通常被翻譯為「溯因推理」,是基於事實回溯出背後可能的原因,以找到最佳解釋「事情發生背後機制」的過程。然而,許多學生誤以為Abduction僅僅是「發想法」,未能理解其實質是提出假說並尋找證據驗證。 - 此
有了這個「自學的模型」,我進一步想反芻我目前寫讀書筆記的方式。 目前我寫讀書筆記的方式,正如同你讀到的這篇文章, 基本上有三個成分: 01 節錄文章書籍中有意思的討論內容 02 附註文章書籍的作者以及節錄內容的出處 03 寫300字自己從節錄內容獲得的啟發與思考
1. 被食物、書籍、網路、娛樂與社群媒體佔據整天醒著的時間: - 許多研究生常常在不知不覺中被各種媒介吸引,大量時間花費在非學術活動上,尤其是社群媒體如Facebook、Instagram、Threads等,這些平台以「潛移默化」的方式影響我們的思維和行為。這些分心的活動不僅浪費時間,還可能
我在高中與大學時期,也是 Note Taker。 年輕的時候買了很多書,翻了很多書, 到處看來看去,但總是覺得東西都有點印象, 用聊天的還能說出一些故事自圓其說, 但如果用寫的,每個字都憋得很困難。 但隨著抵達碩士與博士時期, 用寫作表達想法是每天都要做的事, 我開始在寫作上下足功夫。
1. 同時嘗試太多不同的方向: - 這類學生希望在學術研究與實務應用間取得平衡,但通常沒有一項能全力以赴。結果是,他們的時間和精力被分散,導致最終無法在任何一個方向上取得顯著的成果。這樣的學生在經過一段時間後,常會感到困惑,為何自己未能達到預期的目標。 2. 沒有專注於特定的研究方向: -
每天大量的自由寫作, 就像是桿麵團一樣, 而將自由寫作的草稿進一步, 用一些模板寫成短文, 就像是拿餅乾模具做餅乾一樣。 而社區媒體就是你賣餅乾的市場, 餅乾好吃就有很多點讚評論轉發, 餅乾不好吃讀者就吐出來。
你可能也想看
Thumbnail
「設計不僅僅是外觀和感覺。設計是其運作的方式。」 — Steve Jobs 身為一個獨立文案,許多人會以為我們的生活只需要面對電腦,從無到有,用精巧的文字填滿空白的螢幕,呈現心目中獨具風格的作品。 ——有的時候可以如此,但其實這是我們夢寐以求的偶發日常。 更多的時候,白天的工作時間總被各種繁雜
Thumbnail
台股、美股近期明顯回檔,市場敘事發生改變,壞消息一樁接一樁出現,下一步該怎麼走呢?本文將探討近期的宏觀經濟事件,並分享個人的操作思考。
Thumbnail
這是一篇試用Daddario VENN Alto 3.0 合成竹片的感想,與天然竹片相比的音色和吹奏感受,並分享了一些使用心得。
Thumbnail
2024年是全世界大選年,大約有七十多國會有大選,包括台,美,印度,印尼,墨西哥,俄,烏,英和歐盟這幾個關鍵選舉。選舉結果攸關世界陣營的走向: 往左或往右? 首場由台灣總統大選拉開序幕。台灣再度站上國際政治舞台的焦點C位。 近年來選舉的主軸政見都離不了「定義與中國大陸的關係」,
Thumbnail
《D.Va》 照夜白電腦繪圖作品 使用軟體:Photoshop
Thumbnail
2023/11/14 超級失敗的義大利麵 太久沒有下廚囉 非常鹹
Thumbnail
「設計不僅僅是外觀和感覺。設計是其運作的方式。」 — Steve Jobs 身為一個獨立文案,許多人會以為我們的生活只需要面對電腦,從無到有,用精巧的文字填滿空白的螢幕,呈現心目中獨具風格的作品。 ——有的時候可以如此,但其實這是我們夢寐以求的偶發日常。 更多的時候,白天的工作時間總被各種繁雜
Thumbnail
台股、美股近期明顯回檔,市場敘事發生改變,壞消息一樁接一樁出現,下一步該怎麼走呢?本文將探討近期的宏觀經濟事件,並分享個人的操作思考。
Thumbnail
這是一篇試用Daddario VENN Alto 3.0 合成竹片的感想,與天然竹片相比的音色和吹奏感受,並分享了一些使用心得。
Thumbnail
2024年是全世界大選年,大約有七十多國會有大選,包括台,美,印度,印尼,墨西哥,俄,烏,英和歐盟這幾個關鍵選舉。選舉結果攸關世界陣營的走向: 往左或往右? 首場由台灣總統大選拉開序幕。台灣再度站上國際政治舞台的焦點C位。 近年來選舉的主軸政見都離不了「定義與中國大陸的關係」,
Thumbnail
《D.Va》 照夜白電腦繪圖作品 使用軟體:Photoshop
Thumbnail
2023/11/14 超級失敗的義大利麵 太久沒有下廚囉 非常鹹