強化学習
理論
- 強化学習入門
2022-01-18 - 強化学習をバランス調整に活用。『逆転オセロニア』が目指す、ゲーム開発の近未来
- automatik のやりたいことに最も近い: 強化学習によるバランス調整
- Workshop Studio
- DQN(Deep Q Network) の解説
DQN-theory
- DQN(Deep Q Network) の解説
実装
- 【強化学習入門】PolicyGradientでOpenAI GymのCartPoleをクリアする - nosukeru-nauts
- GitHub - openai/gym: A toolkit for developing and comparing reinforcement learning algorithms.
- GitHub - wakame-tech/994G601-ml: assignments of class 994G601
- 1mm理解した
Experience Replay
- 【強化学習】Experience Replayの理論
- 【強化学習】Experience Replay の研究の傾向とその考察
- 【論文】Prioritized Experience Replay (2016) - Qiita
- 【論文調査】Experience Replay関連の論文6本
- 【強化学習】Large Batch Experience Replay (LaBER)
参考文献
- 深層強化学習アルゴリズムまとめ - Qiita
- 潮流
- 強化学習 - 星の本棚
- 基礎から応用まで図を多用しながら綺麗にまとめている. obsidianのmocで真似したい