tdsimao

Thiago D. Simão tdsimao

Achievements

AlgTUDelft/AlwaysSafe AlgTUDelft/AlwaysSafe Public

Code for the paper "AlwaysSafe: Reinforcement Learning Without Safety Constraint Violations During Training"

Python 18 3
LAVA-LAB/spi_pomdp LAVA-LAB/spi_pomdp Public

Code for the paper "Safe Policy Improvement for POMDPs via Finite-State Controllers"

Python 1
SPIBB SPIBB Public

Forked from RomainLaroche/SPIBB

Safe Policy Improvement with Baseline Bootstrapping

Python
SPIBB-DQN SPIBB-DQN Public

Forked from rems75/SPIBB-DQN

Code for SPIBB-DQN and Soft-SPIBB-DQN

Python
gym-factored gym-factored Public

Python 4