Edit Models filters

Apps

Inference Providers

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

2,848

Full-text search

Active filters: ppo

granenko/ppo-LunarLander-v3

Reinforcement Learning • Updated 30 days ago

MrOceanMan/ppo-LunarLander-v2

Reinforcement Learning • Updated 28 days ago

haris9873/LunarLander-v2

Reinforcement Learning • Updated 27 days ago

Aubins/CustomPPO-LunarLander-v2

Reinforcement Learning • Updated 26 days ago

daishan986/ppo-CartPole-v1

Reinforcement Learning • Updated 24 days ago

daishan986/ppo-LunarLander-v2

Reinforcement Learning • Updated 24 days ago

Zybg/ppo-Huggy

Updated 23 days ago

PhuQuy23TNT1/ppo_lunarlander_unit8

Reinforcement Learning • Updated 22 days ago

chisboiz111/ppo-lunar-lander-unit8

Reinforcement Learning • Updated 22 days ago

AngelaHoa23/ppo-lunar-lander-unit8

Reinforcement Learning • Updated 22 days ago

duyminh12122005/ppo-lunar-lander-unit8

Reinforcement Learning • Updated 22 days ago

elliemci/ppo-LunarLander-v2-cleanRL

Reinforcement Learning • Updated 8 days ago

Umang-Bansal/ppo-LunarLander-v2

Reinforcement Learning • Updated 20 days ago

changyuwen06/PPO-scratch-LunarLander-v2

Reinforcement Learning • Updated 18 days ago

Tyraex/ppo-CartPole-v1

Reinforcement Learning • Updated 14 days ago

ItsTSV/ppo_swimmer

Reinforcement Learning • Updated 3 days ago

samhitha2601/llama3.2-3b-ppo

Reinforcement Learning • Updated 12 days ago • 16

samhitha2601/llama3.2-3b-ppo-critic

Reinforcement Learning • Updated 12 days ago • 11

debisoft/ppo-CartPole-v1

Reinforcement Learning • Updated 11 days ago

debisoft/ppo-CartPole-v2

Reinforcement Learning • Updated 10 days ago

ARG-NCTU/hrl-ppo-usv

Reinforcement Learning • Updated 6 days ago • 53

romolocaponera/LunarLander-v3-Unit8

Reinforcement Learning • Updated 9 days ago

romolocaponera/LunarLander-v2-Unit8

Reinforcement Learning • Updated 9 days ago

ItsTSV/ppo_hopper

Reinforcement Learning • Updated 7 days ago

MMattaparthy/ppo_model_final

Text Generation • 2B • Updated 6 days ago • 23

Nao233/ppo-CartPole-v1

Reinforcement Learning • Updated 5 days ago

MishkaMushka/ppo-LunarLander-v2_3M-Tuned

Reinforcement Learning • Updated 4 days ago

LucasBlock/ppo-pytorch-LunarLander-v2

Reinforcement Learning • Updated 4 days ago