[Final experiments - REINFORCE] experiment #2 with seed 1000 #52

ziritrion · 2021-04-13T08:02:07Z

Final experiment with our REINFORCE algorithm implementation. showing a final reward of 329.5 with a preset seed of value 1000.

The Learning Rate hyperparameter for REINFORCE was 1*10^-5, since this was the value that showed best results for training in our experiments.

The action set chosen for all experiments is the following:
[0.0, 0.3, 0.0], # throttle
[0.0, 0.1, 0.0], # throttle
[0.0, 0.0, 0.0], # throttle
[0.0, 0.0, 0.7], # break
[0.0, 0.0, 0.5], # break
[0.0, 0.0, 0.2], # break
[-1.0, 0.0, 0.05], # left
[-0.5, 0.0, 0.05], # left
[-0.2, 0.0, 0.05], # left
[1.0, 0.0, 0.05], # right
[0.5, 0.0, 0.05], # right
[0.2, 0.0, 0.05], # right

TensorBoard screenshots below:

Generated video below:
https://user-images.githubusercontent.com/1465235/114518058-4043f400-9c3f-11eb-994b-701b443604dd.mp4

…opy collapse..

…king

jaimepedretp and others added 17 commits March 27, 2021 19:54

reinforce experiments with different learning rates

dca5ec5

Adding runs up to 30.8k episodes

5d9bcd6

Runs up to 30.8k - deleted old runs

80d9ea0

video with 810 reward - nice burnout save

993ee5a

runs up to 67.8k episodes / best=~800 final=~300

bcb5363

runs up to 67.8k episodes / best=~800 final=~300

383ad40

reinforcement 71k / different set of actions test

19187d4

75.5k actions with 0.05 brake when turning left/right - best average 889

ab0cfdd

added video using eval mode

1c48480

Run from scratch on reinforce-learningrate-act3 using lr 1e-05 / Entr…

d54ad15

…opy collapse..

Adding seeds

b3875a5

Fresh start

a19624d

Changes for experiment #2 of the final experiments

d9b1ee6

Added some needed additional code to fix some issues due to cherrypic…

2ec8c64

…king

Fixing even more stuff part 2: Electric Boogaloo

3fa67ed

Final experiment, running reward 329.5

58229c0

Added video eval mode 474reward - reinfroce-final-2 model

56670f9

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Final experiments - REINFORCE] experiment #2 with seed 1000 #52

[Final experiments - REINFORCE] experiment #2 with seed 1000 #52

ziritrion commented Apr 13, 2021

[Final experiments - REINFORCE] experiment #2 with seed 1000 #52

Are you sure you want to change the base?

[Final experiments - REINFORCE] experiment #2 with seed 1000 #52

Conversation

ziritrion commented Apr 13, 2021