樂觀原則
含有「樂觀原則」共 1 篇內容
全部內容
發佈日期由新至舊
王啟樺的沙龍
2024/07/18
Bandit 003|如何透過擾動參數來實現最佳探索?
今天聊聊 Marc Abeille[1] 所著作的《Linear Thompson Sampling Revisited》[2]。 這篇文章是分析Linear Thompson Sampling的理論經典文章。 文章裡面示範了如何將 Thompson取樣, 看作是一種對參數的擾動,
#
強盜演算法
#
湯姆森取樣
#
樂觀原則
喜歡
留言