Quartz 5

❯

❯

強化学習

Properties1

tags

Jun 28, 20262 min read

強化学習

理論

強化学習入門
 2022-01-18
強化学習をバランス調整に活用。『逆転オセロニア』が目指す、ゲーム開発の近未来
- automatik のやりたいことに最も近い: 強化学習によるバランス調整
Workshop Studio
- DQN(Deep Q Network) の解説
  DQN-theory

実装

【強化学習入門】PolicyGradientでOpenAI GymのCartPoleをクリアする - nosukeru-nauts
- GitHub - ryu-ke/gym_tutorial: RL tutorials for OpenAI Gym, using PyTorch
- 最小サンプル
GitHub - openai/gym: A toolkit for developing and comparing reinforcement learning algorithms.
GitHub - wakame-tech/994G601-ml: assignments of class 994G601
- 1mm理解した

Experience Replay

【強化学習】Experience Replayの理論
【強化学習】Experience Replay の研究の傾向とその考察
【論文】Prioritized Experience Replay (2016) - Qiita
【論文調査】Experience Replay関連の論文6本
【強化学習】Large Batch Experience Replay (LaBER)

参考文献

深層強化学習アルゴリズムまとめ - Qiita
- 潮流
強化学習 - 星の本棚
- 基礎から応用まで図を多用しながら綺麗にまとめている. obsidianのmocで真似したい

Graph View

強化学習
理論
実装
Experience Replay
参考文献

Backlinks

MOC: ML/ロボ
強化学習でマリオ
強化学習入門

Created with Quartz v5.0.0 © 2026

GitHub
Discord Community