Edit Models filters

Apps

Docker Model Runner

Inference Providers

HF Inference API

Misc

arxiv: 2503.24290

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

8

Full-text search

Active filters: 2503.24290

Open-Reasoner-Zero/Open-Reasoner-Zero-7B

Reinforcement Learning • 8B • Updated Apr 7 • 1.06k • 30

Open-Reasoner-Zero/Open-Reasoner-Zero-32B

Reinforcement Learning • 33B • Updated Apr 7 • 2.07k • 31

Open-Reasoner-Zero/Open-Reasoner-Zero-0.5B

Reinforcement Learning • 0.5B • Updated Apr 7 • 64

Open-Reasoner-Zero/Open-Reasoner-Zero-1.5B

Reinforcement Learning • 2B • Updated Apr 6 • 226

Open-Reasoner-Zero/Open-Reasoner-Zero-Critic-0.5B

Reinforcement Learning • 0.5B • Updated Apr 7 • 4

Open-Reasoner-Zero/Open-Reasoner-Zero-Critic-1.5B

Reinforcement Learning • 2B • Updated Apr 6 • 5 • 1

Open-Reasoner-Zero/Open-Reasoner-Zero-Critic-7B

Reinforcement Learning • 7B • Updated Apr 7 • 7 • 1

Open-Reasoner-Zero/Open-Reasoner-Zero-Critic-32B

Reinforcement Learning • 32B • Updated Apr 7 • 5 • 5