Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

1,103

Full-text search

Active filters: fp8

XiaomiMiMo/MiMo-V2-Flash

Text Generation • 310B • Updated 7 days ago • 14.2k • • 437

deepseek-ai/DeepSeek-V3.2

Text Generation • 685B • Updated 23 days ago • 93.9k • • 1.01k

mistralai/Devstral-Small-2-24B-Instruct-2512

24B • Updated 2 days ago • 118k • 435

MiniMaxAI/MiniMax-M2

Text Generation • 229B • Updated 1 day ago • 130k • • 1.43k

mistralai/Devstral-2-123B-Instruct-2512

125B • Updated 2 days ago • 12.9k • 247

mistralai/Ministral-3-14B-Instruct-2512

14B • Updated 5 days ago • 351k • 205

deepseek-ai/DeepSeek-R1

Text Generation • 685B • Updated Mar 27 • 726k • • 12.9k

mistralai/Ministral-3-3B-Instruct-2512

4B • Updated 5 days ago • 138k • 150

XiaomiMiMo/MiMo-V2-Flash-Base

Text Generation • 310B • Updated 7 days ago • 487 • 32

deepseek-ai/DeepSeek-V3.2-Speciale

Text Generation • 685B • Updated 23 days ago • 16.1k • 618

unsloth/Devstral-Small-2-24B-Instruct-2512-GGUF

24B • Updated 9 days ago • 122k • 60

moonshotai/Kimi-K2-Instruct

Text Generation • 1T • Updated Nov 7 • 59.7k • • 2.28k

mistralai/Ministral-3-8B-Instruct-2512

9B • Updated 4 days ago • 34.5k • 107

deepseek-ai/DeepSeek-Math-V2

Text Generation • 685B • Updated 27 days ago • 11.5k • 665

moonshotai/Kimi-K2-Instruct-0905

Text Generation • 1T • Updated Nov 7 • 33.4k • • 640

deepseek-ai/DeepSeek-V3.2-Exp

Text Generation • 685B • Updated Nov 18 • 81.3k • • 926

Qwen/Qwen3-235B-A22B-Thinking-2507-FP8

Text Generation • 235B • Updated Jul 30 • 28k • 73

Qwen/Qwen3-30B-A3B-Thinking-2507-FP8

Text Generation • 31B • Updated Jul 30 • 24.2k • 53

nex-agi/DeepSeek-V3.1-Nex-N1

Text Generation • 671B • Updated 15 days ago • 353 • 39

deepseek-ai/DeepSeek-V3

Text Generation • 685B • Updated Mar 27 • 927k • • 4.01k

deepseek-ai/DeepSeek-R1-0528

Text Generation • 685B • Updated May 29 • 457k • • 2.39k

Qwen/Qwen3-30B-A3B-Instruct-2507-FP8

Text Generation • 31B • Updated Sep 17 • 204k • 101

Qwen/Qwen3-Coder-30B-A3B-Instruct-FP8

Text Generation • 31B • Updated 21 days ago • 217k • 126

Qwen/Qwen3-4B-Instruct-2507-FP8

Text Generation • 4B • Updated Sep 17 • 56.3k • 56

Qwen/Qwen3-Next-80B-A3B-Instruct-FP8

Text Generation • 81B • Updated Sep 22 • 639k • 66

deepseek-ai/DeepSeek-R1-Zero

Text Generation • 685B • Updated Mar 27 • 4.19k • 940

Qwen/Qwen3-4B-Thinking-2507-FP8

Text Generation • 4B • Updated Aug 6 • 177k • 44

Qwen/Qwen3-Next-80B-A3B-Thinking-FP8

Text Generation • 81B • Updated Sep 22 • 404k • 43

Qwen/Qwen3-VL-4B-Instruct-FP8

Image-Text-to-Text • 5B • Updated Oct 15 • 58.3k • 41

Qwen/Qwen3-VL-2B-Thinking-FP8

Image-Text-to-Text • 2B • Updated 28 days ago • 1.81k • 22