Iterative Bounding Markov Decision Processes

Implementation of IBMDPs. Just copy the gymnasium environment from here ibmdp.

from stable_baselines3 import PPO
from gymnasium import make
from gymnasium.wrappers.time_limit import TimeLimit
from ibmdp import IBMDP

env = make("CartPole-v1")
env = IBMDP(env, zeta=0, info_gathering_actions=[(0,0)])
env = TimeLimit(env, 1000)

model = PPO("MlpPolicy", env, verbose=1)
model.learn(1e5)

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
examples		examples
ibmdp		ibmdp
tests		tests
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Iterative Bounding Markov Decision Processes

About

Releases

Packages

Languages

KohlerHECTOR/ibmdp-py

Folders and files

Latest commit

History

Repository files navigation

Iterative Bounding Markov Decision Processes

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages