Advanced Actor Critic (A2C)

From

Revision as of 07:12, 6 July 2020 by BPeat (talk | contribs)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Jump to: navigation, search

YouTube search... ...Google search

Reinforcement Learning (RL)
- Monte Carlo (MC) Method - Model Free Reinforcement Learning
- Markov Decision Process (MDP)
- State-Action-Reward-State-Action (SARSA)
- Q Learning
  - Deep Q Network (DQN)
- Deep Reinforcement Learning (DRL) DeepRL
- Distributed Deep Reinforcement Learning (DDRL)
- Evolutionary Computation / Genetic Algorithms
- Actor Critic
  - Advanced Actor Critic (A2C)
  - Asynchronous Advantage Actor Critic (A3C)
  - Lifelong Latent Actor-Critic (LILAC)
- Hierarchical Reinforcement Learning (HRL)
Beyond DQN/A3C: A Survey in Advanced Reinforcement Learning | Joyce Xu - Towards Data Science
Policy Gradient (PG)
Proximal Policy Optimization (PPO)

A2C produces comparable performance to Asynchronous Advantage Actor Critic (A3C) while being more efficient. A2C is like A3C but without the asynchronous part; this means a single-worker variant of the A3C. Understanding Actor Critic Methods and A2C | Chris Yoon - Towards Data Science

Retrieved from "https://primo.ai/index.php?title=Advanced_Actor_Critic_(A2C)&oldid=13250"