Models

220

Full-text search

Active filters: vLLM

mistralai/Mistral-Medium-3.5-128B

128B • Updated 14 days ago • 56.1k • 323

QuantTrio/Qwen3.6-35B-A3B-AWQ

Image-Text-to-Text • 36B • Updated Apr 17 • 753k • 22

QuantTrio/Qwen3.6-27B-AWQ-6Bit

Image-Text-to-Text • 28B • Updated 26 days ago • 26.1k • 9

mistralai/Mistral-Medium-3.5-128B-EAGLE

Updated 19 days ago • 550 • 40

QuantTrio/Qwen3.5-9B-AWQ

Image-Text-to-Text • 10B • Updated Mar 4 • 244k • 15

mistralai/Mistral-Small-4-119B-2603-NVFP4

Updated Mar 17 • 890 • 88

unsloth/Mistral-Small-4-119B-2603-GGUF

119B • Updated 29 days ago • 25.6k • 68

QuantTrio/MiniMax-M2-AWQ

Text Generation • 229B • Updated Dec 3, 2025 • 2.58k • 9

mistralai/Mistral-Small-4-119B-2603

119B • Updated 21 days ago • 65.2k • 376

cyankiwi/Mistral-Small-4-119B-2603-AWQ-4bit

21B • Updated Mar 23 • 2.05k • 7

QuantTrio/gemma-4-31B-it-AWQ-6Bit

Image-Text-to-Text • 31B • Updated Apr 17 • 6.7k • 9

QuantTrio/gemma-4-31B-it-AWQ

Image-Text-to-Text • 31B • Updated Apr 17 • 636k • 11

QuantTrio/MiniMax-M2.7-AWQ

Text Generation • 229B • Updated 28 days ago • 32.7k • 8

bartowski/mistralai_Mistral-Medium-3.5-128B-GGUF

Image-Text-to-Text • 125B • Updated 15 days ago • 15.7k • 7

model-scope/glm-4-9b-chat-GPTQ-Int4

Text Generation • 9B • Updated Jul 17, 2024 • 24 • 6

model-scope/glm-4-9b-chat-GPTQ-Int8

Text Generation • 9B • Updated Jul 23, 2024 • 7 • 2

tclf90/qwen2.5-72b-instruct-gptq-int4

Text Generation • 73B • Updated May 12, 2025 • 72 • 2

tclf90/qwen2.5-72b-instruct-gptq-int3

Text Generation • 69B • Updated May 12, 2025 • 70

prithivMLmods/Nu2-Lupi-Qwen-14B

Text Generation • 15B • Updated Mar 27, 2025 • 6 • 2

mradermacher/Nu2-Lupi-Qwen-14B-GGUF

15B • Updated Jul 11, 2025 • 180 • 1

mradermacher/Nu2-Lupi-Qwen-14B-i1-GGUF

15B • Updated Jul 11, 2025 • 425 • 1

JunHowie/Qwen3-0.6B-GPTQ-Int4

Text Generation • 0.6B • Updated Sep 3, 2025 • 339 • 1

JunHowie/Qwen3-0.6B-GPTQ-Int8

Text Generation • 0.6B • Updated Sep 3, 2025 • 19

JunHowie/Qwen3-1.7B-GPTQ-Int4

Text Generation • 2B • Updated Sep 3, 2025 • 2.68k • 1

JunHowie/Qwen3-1.7B-GPTQ-Int8

Text Generation • 2B • Updated Sep 3, 2025 • 22

JunHowie/Qwen3-32B-GPTQ-Int4

Text Generation • 33B • Updated Sep 5, 2025 • 3.93k • 4

JunHowie/Qwen3-32B-GPTQ-Int8

Text Generation • 33B • Updated Sep 5, 2025 • 510 • 4

JunHowie/Qwen3-30B-A3B-GPTQ-Int4

Text Generation • 5B • Updated Sep 6, 2025 • 24 • 1

JunHowie/Qwen3-14B-GPTQ-Int8

Text Generation • 15B • Updated Sep 5, 2025 • 102 • 1

JunHowie/Qwen3-14B-GPTQ-Int4

Text Generation • 15B • Updated Sep 5, 2025 • 121k • 4