D020|機器學習理論如何指導實務?

更新於 2024/07/20閱讀時間約 2 分鐘

「直覺和生活常識非常有用,但缺乏知識的直覺會欺騙你。」


「Google對產品經理的要求是,在沒有數據之前不要輕易給出結論。」


「有些事情讓你放棄掉生活中獲得的直覺,是千難萬難。」


「有一點經驗的工程師都知道,任何產品的性能都有一個物理上無法突破的極限,


這個極限並不需要等到工程上接近的那一天才知道,


而是早就可以通過已有的理論直接給出。」


「缺乏工程思維的人才會想,隨著科技的發展,任何人間奇跡都是可能的。」


這段討論,節錄自吳軍老師矽谷來信第二季的內容[1],


引發我對科學與工程的思考。


由於我的背景是台大數學系與台大應用數學所,


在2017年開始在美國普渡大學攻讀統計學博士時,


手上有的研究工具,都是數學工具。


我在臺大時期,一直都是數學分析工具的愛好者:


實分析,泛函分析,測度論,機率論,隨機過程,隨機微積分。


而由於在台大,也受純數學工具的各種薰陶:


抽象代數,代數幾何,微分幾何,李群李代數。


而到了普渡大學,開始研究統計機器學習理論,


很自然就會從數學理論的角度去想怎麼做研究。


然而,在我的經驗上,直接從會的工具出發去做科學研究,


就落入了手上有錘子,看什麼都是釘子的尷尬局面,


容易做出沒人關心,意義不大的成果。


而吳軍老師這一講,給出了理論研究的意義:


要能為工程實務,指導其根本極限。


如此,我也開始理解,為什麼機器學習理論,


要討論什麼樣的機器學習任務是「可學的 Learable」,


而如果可學,那麼學會的「樣本複雜度 Sample Complexity」是多大,


而如果缺失的某些「資訊 Information」的來源,


任務的可學性如何,樣本複雜度又會增加多少。


這的確都是達成「可擴展性 Scalability」前,需要考慮的維度。


很不錯,感覺我看理論題目的品味又提升了一層。


Reference

[1] 吳軍 - 硅谷来信2-谷歌方法论 - 第003封信 | 工程思维:直觉和极限 (https://www.dedao.cn/course/article?id=rykaNlMY5gn3JqZA7X7EAROW0DLjev)


avatar-img
525會員
1.8K內容數
Outline as Content
留言0
查看全部
avatar-img
發表第一個留言支持創作者!
王啟樺的沙龍 的其他內容
1. 誤解Abduction與其他推理方法的區別 - 在台灣,Abduction通常被翻譯為「溯因推理」,是基於事實回溯出背後可能的原因,以找到最佳解釋「事情發生背後機制」的過程。然而,許多學生誤以為Abduction僅僅是「發想法」,未能理解其實質是提出假說並尋找證據驗證。 - 此
有了這個「自學的模型」,我進一步想反芻我目前寫讀書筆記的方式。 目前我寫讀書筆記的方式,正如同你讀到的這篇文章, 基本上有三個成分: 01 節錄文章書籍中有意思的討論內容 02 附註文章書籍的作者以及節錄內容的出處 03 寫300字自己從節錄內容獲得的啟發與思考
1. 被食物、書籍、網路、娛樂與社群媒體佔據整天醒著的時間: - 許多研究生常常在不知不覺中被各種媒介吸引,大量時間花費在非學術活動上,尤其是社群媒體如Facebook、Instagram、Threads等,這些平台以「潛移默化」的方式影響我們的思維和行為。這些分心的活動不僅浪費時間,還可能
我在高中與大學時期,也是 Note Taker。 年輕的時候買了很多書,翻了很多書, 到處看來看去,但總是覺得東西都有點印象, 用聊天的還能說出一些故事自圓其說, 但如果用寫的,每個字都憋得很困難。 但隨著抵達碩士與博士時期, 用寫作表達想法是每天都要做的事, 我開始在寫作上下足功夫。
1. 同時嘗試太多不同的方向: - 這類學生希望在學術研究與實務應用間取得平衡,但通常沒有一項能全力以赴。結果是,他們的時間和精力被分散,導致最終無法在任何一個方向上取得顯著的成果。這樣的學生在經過一段時間後,常會感到困惑,為何自己未能達到預期的目標。 2. 沒有專注於特定的研究方向: -
每天大量的自由寫作, 就像是桿麵團一樣, 而將自由寫作的草稿進一步, 用一些模板寫成短文, 就像是拿餅乾模具做餅乾一樣。 而社區媒體就是你賣餅乾的市場, 餅乾好吃就有很多點讚評論轉發, 餅乾不好吃讀者就吐出來。
1. 誤解Abduction與其他推理方法的區別 - 在台灣,Abduction通常被翻譯為「溯因推理」,是基於事實回溯出背後可能的原因,以找到最佳解釋「事情發生背後機制」的過程。然而,許多學生誤以為Abduction僅僅是「發想法」,未能理解其實質是提出假說並尋找證據驗證。 - 此
有了這個「自學的模型」,我進一步想反芻我目前寫讀書筆記的方式。 目前我寫讀書筆記的方式,正如同你讀到的這篇文章, 基本上有三個成分: 01 節錄文章書籍中有意思的討論內容 02 附註文章書籍的作者以及節錄內容的出處 03 寫300字自己從節錄內容獲得的啟發與思考
1. 被食物、書籍、網路、娛樂與社群媒體佔據整天醒著的時間: - 許多研究生常常在不知不覺中被各種媒介吸引,大量時間花費在非學術活動上,尤其是社群媒體如Facebook、Instagram、Threads等,這些平台以「潛移默化」的方式影響我們的思維和行為。這些分心的活動不僅浪費時間,還可能
我在高中與大學時期,也是 Note Taker。 年輕的時候買了很多書,翻了很多書, 到處看來看去,但總是覺得東西都有點印象, 用聊天的還能說出一些故事自圓其說, 但如果用寫的,每個字都憋得很困難。 但隨著抵達碩士與博士時期, 用寫作表達想法是每天都要做的事, 我開始在寫作上下足功夫。
1. 同時嘗試太多不同的方向: - 這類學生希望在學術研究與實務應用間取得平衡,但通常沒有一項能全力以赴。結果是,他們的時間和精力被分散,導致最終無法在任何一個方向上取得顯著的成果。這樣的學生在經過一段時間後,常會感到困惑,為何自己未能達到預期的目標。 2. 沒有專注於特定的研究方向: -
每天大量的自由寫作, 就像是桿麵團一樣, 而將自由寫作的草稿進一步, 用一些模板寫成短文, 就像是拿餅乾模具做餅乾一樣。 而社區媒體就是你賣餅乾的市場, 餅乾好吃就有很多點讚評論轉發, 餅乾不好吃讀者就吐出來。
你可能也想看
Google News 追蹤
Thumbnail
本文探討了複利效應的重要性,並藉由巴菲特的投資理念,說明如何選擇穩定產生正報酬的資產及長期持有的核心理念。透過定期定額的投資方式,不僅能減少情緒影響,還能持續參與全球股市的發展。此外,文中介紹了使用國泰 Cube App 的便利性及低手續費,幫助投資者簡化投資流程,達成長期穩定增長的財務目標。
Thumbnail
這是一篇試用Daddario VENN Alto 3.0 合成竹片的感想,與天然竹片相比的音色和吹奏感受,並分享了一些使用心得。
Thumbnail
2024年是全世界大選年,大約有七十多國會有大選,包括台,美,印度,印尼,墨西哥,俄,烏,英和歐盟這幾個關鍵選舉。選舉結果攸關世界陣營的走向: 往左或往右? 首場由台灣總統大選拉開序幕。台灣再度站上國際政治舞台的焦點C位。 近年來選舉的主軸政見都離不了「定義與中國大陸的關係」,
Thumbnail
《D.Va》 照夜白電腦繪圖作品 使用軟體:Photoshop
Thumbnail
2023/11/14 超級失敗的義大利麵 太久沒有下廚囉 非常鹹
Thumbnail
本文探討了複利效應的重要性,並藉由巴菲特的投資理念,說明如何選擇穩定產生正報酬的資產及長期持有的核心理念。透過定期定額的投資方式,不僅能減少情緒影響,還能持續參與全球股市的發展。此外,文中介紹了使用國泰 Cube App 的便利性及低手續費,幫助投資者簡化投資流程,達成長期穩定增長的財務目標。
Thumbnail
這是一篇試用Daddario VENN Alto 3.0 合成竹片的感想,與天然竹片相比的音色和吹奏感受,並分享了一些使用心得。
Thumbnail
2024年是全世界大選年,大約有七十多國會有大選,包括台,美,印度,印尼,墨西哥,俄,烏,英和歐盟這幾個關鍵選舉。選舉結果攸關世界陣營的走向: 往左或往右? 首場由台灣總統大選拉開序幕。台灣再度站上國際政治舞台的焦點C位。 近年來選舉的主軸政見都離不了「定義與中國大陸的關係」,
Thumbnail
《D.Va》 照夜白電腦繪圖作品 使用軟體:Photoshop
Thumbnail
2023/11/14 超級失敗的義大利麵 太久沒有下廚囉 非常鹹