在劉瀾的學習力30講的第十五講中讀到,
要產生學習的馬太效應,就需要聚焦一本經典之書。
其實,聚焦一本經典之書來學習,
其道理就如同聚焦一篇經典論文來研究一樣。
我在2023年發表於統計領域頂級期刊Journal of the American Statistical Association (JASA)上的文章Online Regularization toward Always-Valid High-Dimensional Dynamic Pricing,其誕生的過程,也是從聚焦一篇經典論文來的。
最一開始我聚焦的文章,是由Hamsa Bastani教授著作的Online Decision-Making with High-Dimensional Covariates。
這篇文章中提出了LASSO Bandit 算法,
讓我很好的學習了高維度統計的LASSO技術,
如何結合進入強化學習 (Reinforcement Learning)中的強盜演算法(Bandit Algorithms)。
透過聚焦學習LASSO Bandit的論文,
我進一步思考如何將這套技術應用於動態定價的問題之中,
搭配我對鞅理論 (Martingale Theory)的執著,
最後提出了利用鞅理論來控制LASSO估計是在線上估計中的收斂速度的技術。
我也如此建議剛開始做研究的博士生,
你可以讀很多論文,但一定要有一篇你完全讀透的經典。