Edit Models filters

Apps

Inference Providers

HF Inference API

Misc

stable-baselines3

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

23,816

Full-text search

Active filters: stable-baselines3

Adilbai/stock-trading-rl-agent

Reinforcement Learning • Updated Jul 5 • 165 • 37

cointeleporting/ppo-LunarLander-v2

Reinforcement Learning • Updated Aug 19 • 2 • 1

ThomasSimonini/demo-hf-CartPole-v1

Reinforcement Learning • Updated May 3, 2023 • 4

ThomasSimonini/ppo-AntBulletEnv-v0

Reinforcement Learning • Updated Apr 7, 2022 • 7 • 1

ThomasSimonini/ppo-BreakoutNoFrameskip-v4

Reinforcement Learning • Updated Apr 7, 2022 • 2 • 3

ThomasSimonini/ppo-LunarLander-v2

Reinforcement Learning • Updated Aug 28, 2023 • 8 • 14

ThomasSimonini/ppo-PongNoFrameskip-v4

Reinforcement Learning • Updated Apr 7, 2022 • 2 • 1

ThomasSimonini/ppo-QbertNoFrameskip-v4

Reinforcement Learning • Updated Apr 7, 2022 • 1

ThomasSimonini/ppo-SeaquestNoFrameskip-v4

Reinforcement Learning • Updated Apr 7, 2022 • 2

ThomasSimonini/ppo-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Apr 7, 2022 • 27 • 3

ThomasSimonini/ppo-Walker2DBulletEnv-v0

Reinforcement Learning • Updated Jul 15, 2022 • 10

carlosaguayo/Simonini-ppo-LunarLander-v2

Reinforcement Learning • Updated Jan 22, 2022 • 1 • 1

mrm8488/a2c-Pong-v0

Reinforcement Learning • Updated Feb 11, 2022 • 1 • 1

mrm8488/a2c-PongNoFrameskip-v0

Reinforcement Learning • Updated Feb 12, 2022 • 1

osanseviero/ppo-LunarLander-v2

Reinforcement Learning • Updated Jul 5, 2022 • 3 • 1

sb3/demo-hf-CartPole-v1

Reinforcement Learning • Updated Mar 11, 2024 • 9 • 1

TrabajoAprendizajeProfundo/Trabajo

Reinforcement Learning • Updated Apr 11, 2022 • 8 • 1

osanseviero/TEST_COLAB_ppo-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Apr 19, 2022

osanseviero/test_sb3

Reinforcement Learning • Updated May 4, 2022 • 2 • 6

sb3/ppo-Pendulum-v1

Reinforcement Learning • Updated Oct 11, 2022 • 14 • 3

osanseviero/TEST2ppo-LunarLander-v3

Reinforcement Learning • Updated May 10, 2022

SuperSecureHuman/Lunar-Landing-PPO

Reinforcement Learning • Updated May 5, 2022 • 1

epsil/ppo-LunarLander-v2

Reinforcement Learning • Updated May 4, 2022 • 13

LidarRL/TEST2ppo-LunarLander-v2

Reinforcement Learning • Updated May 4, 2022 • 1

DBusAI/ppo-LunarLander-v2

Reinforcement Learning • Updated May 4, 2022

Phaneo/ppo-LunarLander-v2

Reinforcement Learning • Updated May 4, 2022

NorbertRop/PPO-MlpPolicy-LunarLander-v2

Reinforcement Learning • Updated May 4, 2022

CWhy/ppo-LunarLander-v2

Reinforcement Learning • Updated May 4, 2022 • 1

DarthVadar/TEST3ppo-LunarLander-v2

Reinforcement Learning • Updated May 4, 2022 • 3 • 1

epsil/dqn-LunarLander-v2

Reinforcement Learning • Updated May 22, 2022 • 1