wPC: Weighted Policy Constraints for Offline Reinforcement Learning

Pytorch implementation for " weighted policy constraints for offline reinforcement learning".

This implementation is build on the official TD3+BC code, and only add several new lines to TD3+BC code to get gain a siganificant performance improvements.

Usage

python main.py

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
README.md		README.md
TD3_wBC.py		TD3_wBC.py
main.py		main.py
utils.py		utils.py
viz_results.py		viz_results.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

wPC: Weighted Policy Constraints for Offline Reinforcement Learning

Usage

About

Releases

Packages

Languages

qsa-fox/wPC

Folders and files

Latest commit

History

Repository files navigation

wPC: Weighted Policy Constraints for Offline Reinforcement Learning

Usage

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages