bc_tutorial/pendulum at main · AssistiveRoboticsUNH/bc_tutorial

Name	Name	Last commit message	Last commit date
parent directory ..
expert_data	expert_data
trained_models	trained_models
bc_pendulum.mp4	bc_pendulum.mp4
bc_pendulum_gaussian.ipynb	bc_pendulum_gaussian.ipynb
bc_pendulum_sklearn.ipynb	bc_pendulum_sklearn.ipynb
bc_pendulum_torch.ipynb	bc_pendulum_torch.ipynb
data_gen_pendulum.ipynb	data_gen_pendulum.ipynb
readme.md	readme.md

Name

Last commit message

Last commit date

expert_data

trained_models

bc_pendulum.mp4

bc_pendulum_gaussian.ipynb

bc_pendulum_sklearn.ipynb

bc_pendulum_torch.ipynb

data_gen_pendulum.ipynb

readme.md

Pendulum

Both state and action space are continuous.

Data Collection

Skip if you want to use the given expert data.

Install stable-baselines3

    pip install stable-baselines3[extra]

Generate data: data_gen_pendulum.ipynb

Train Regression policy

predict action directly from state
MSE loss Using Scikit-learn : bc_pendulum_sklearn.ipynb
Using Pytorch : bc_pendulum_torch.ipynb

run pytorch training on pendulum in colab

Train gaussian policy

predict mean and variance
Negative log likelihood loss

bc_pendulum_torch_gaussian.ipynb

Navigation Menu

Uh oh!

readme.md

Pendulum

Data Collection

Train Regression policy

run pytorch training on pendulum in colab

Train gaussian policy

Uh oh!

FilesExpand file tree

pendulum

Directory actions

More options

Directory actions

More options

Latest commit

History

pendulum

Folders and files

parent directory

readme.md

Pendulum

Data Collection

Train Regression policy

run pytorch training on pendulum in colab

Train gaussian policy