強化学習の勉強のために、ITエンジニアのための強化学習理論入門を読みました。 詳細な理論解説あり、コードありとかなり読み応えのある内容でした。 その中の1章、多腕バンディットのコーディングをまとめたいと思います。 なお、バンディットはスロットマ…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。