信心集合
含有「信心集合」共 1 篇內容
全部內容
發佈日期由新至舊
王啟樺的沙龍
2024/07/15
Bandit 002|信心集合在強盜算法中有什麼作用?
今天繼續聊聊由Yasin Abbasi-Yadkori [1] 於2011年發表的文章, 《Improved Algorithms for Linear Stochastic Bandits》[2]。 在15頁的順間後悔分析中, 我們在B001講到上界已經替換為 「強盜算法行
#
強盜演算法
#
信心集合
#
信賴區間
7
留言