將「未知的"真實強盜參數"與未知的"最優行動"」 替換成「已知的“估計強盜參數與已知的”強盜算法選擇的行動“」。 於是，在瞬間後悔定義中用到的未知量， 都能轉化為強盜算法設計就能知道的已知量， 那麼分析就能繼續下去。 這個思維在做理論研究的時候相當重要，

國際

職場

以行動支持創作者！付費即可解鎖