Difference between revisions of "World Models"

Revision as of 16:36, 16 April 2023

@@ Line 17: / Line 17: @@
 * [[Inside Out - Curious Optimistic Reasoning]]
 * [http://worldmodels.github.io/ Recurrent World Models Facilitate Policy Evolution]
+* [[Policy]]   ... [[Policy vs Plan]] ... [[Constitutional AI]] ... [[Trust Region Policy Optimization (TRPO)]] ... [[Policy Gradient (PG)]] ... [[Proximal Policy Optimization (PPO)]]
 <youtube>IZPKohYNri4</youtube>