Difference between revisions of "Policy Gradient (PG)"

Revision as of 15:59, 1 September 2019

@@ Line 8: / Line 8: @@
 [http://www.google.com/search?q=Deep+Deterministic+Policy+Gradient+DDPG+machine+learning+ML+artificial+intelligence ...Google search]
+* [[Trust Region Policy Optimization (TRPO)]]
+* [[Proximal Policy Optimization (PPO)]]
 * [[Reinforcement Learning (RL)]]
-* [[Deep Reinforcement Learning (DRL)]]
+* [[Gradient Descent Optimization & Challenges]]
 <youtube>PDbXPBwOavc</youtube>