Quartz 5

Home

❯

notes

❯

強化学習

強化学習

Properties1
tagsml/rl

Jun 28, 20262 min read

強化学習

rl

理論

2022-03-03

  • 強化学習入門
    2022-01-18
  • 強化学習をバランス調整に活用。『逆転オセロニア』が目指す、ゲーム開発の近未来
    • automatik のやりたいことに最も近い: 強化学習によるバランス調整
  • Workshop Studio
    • DQN(Deep Q Network) の解説
      DQN-theory

実装

  • 【強化学習入門】PolicyGradientでOpenAI GymのCartPoleをクリアする - nosukeru-nauts
    • GitHub - ryu-ke/gym_tutorial: RL tutorials for OpenAI Gym, using PyTorch
    • 最小サンプル
  • GitHub - openai/gym: A toolkit for developing and comparing reinforcement learning algorithms.
  • GitHub - wakame-tech/994G601-ml: assignments of class 994G601
    • 1mm理解した

Experience Replay

  • 【強化学習】Experience Replayの理論
  • 【強化学習】Experience Replay の研究の傾向とその考察
  • 【論文】Prioritized Experience Replay (2016) - Qiita
  • 【論文調査】Experience Replay関連の論文6本
  • 【強化学習】Large Batch Experience Replay (LaBER)

参考文献

  • 深層強化学習アルゴリズムまとめ - Qiita
    • 潮流
  • 強化学習 - 星の本棚
    • 基礎から応用まで図を多用しながら綺麗にまとめている. obsidianのmocで真似したい

Graph View

  • 強化学習
  • 理論
  • 実装
  • Experience Replay
  • 参考文献

Backlinks

  • MOC: ML/ロボ
  • 強化学習でマリオ
  • 強化学習入門

Created with Quartz v5.0.0 © 2026

  • GitHub
  • Discord Community