ppo save expert demo #6

francisduan · 2020-02-05T04:03:47Z

hi, how am i supposed to save expert demo in ppo main?

gitouni · 2021-08-21T01:30:57Z

PPO is a method of reinforcement learning. However app, maxent and gail are all inverse reinforcement learning method. Due to the emergence of policy-based inverse reinforcement learning algorithms, you can use PPO with any inverse reinforcement learning algorithm to complete the training.
References:

Ng A Y, Russell S J. Algorithms for inverse reinforcement learning[C]//Icml. 2000, 1: 2.
Ho J, Gupta J, Ermon S. Model-free imitation learning with policy optimization[C]//International Conference on Machine Learning. PMLR, 2016: 2760-2769.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

ppo save expert demo #6

ppo save expert demo #6

francisduan commented Feb 5, 2020

gitouni commented Aug 21, 2021

ppo save expert demo #6

ppo save expert demo #6

Comments

francisduan commented Feb 5, 2020

gitouni commented Aug 21, 2021