Edit Models filters

Apps

Docker Model Runner

Inference Providers

HF Inference API

Misc

compressed-tensors

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

2,244

Full-text search

Active filters: compressed-tensors

krickwix/Llama-3.1-70B-Instruct-W8A8-Dynamic-Per-Token

71B • Updated 16 days ago • 11

cuongpp/gemma-3-12b-it-GPTQ-4bit

Image-Text-to-Text • 3B • Updated 15 days ago • 218

krickwix/Qwen3-30B-A3B-FP8-Dynamic

31B • Updated 15 days ago • 110

Ba2han/Gemma3-TR-DatasetCreator-w8a8

Image-Text-to-Text • 5B • Updated 15 days ago • 20

nm-testing/Qwen3-0.6B-FP8-BLOCK

0.6B • Updated 15 days ago • 30

weiweiz1/DeepSeek-V2-Lite-NVFP4-autoround

9B • Updated 9 days ago • 13

yanolja/EEVE-Rosetta-4B-FP8-2507

Text Generation • 4B • Updated 15 days ago • 8

Ba2han/Gemma3-TR-DatasetCreatorv3-test2

Image-Text-to-Text • 4B • Updated 15 days ago • 95

wangqia0309/Cydonia-24B-v2-FP8-KV

24B • Updated 14 days ago • 819

VAmblardPEReN/mistralai_Mistral-Small-3.2-24B-Instruct-2506-GPTQ

4B • Updated 14 days ago • 39

joedonino/unsloth_qwen25vl7b_product_descriptionv2_fp8

Image-to-Text • 8B • Updated 14 days ago • 37

chengjiyao/Qwen2-1.5B-Instruct-FP8

2B • Updated 14 days ago • 6

chengjiyao/Qwen3-1.7B-FP8-KV

2B • Updated 14 days ago • 4

warshanks/Dolphin-Mistral-24B-Venice-Edition-AWQ

4B • Updated 14 days ago • 24

nm-testing/Meta-Llama-3-8B-Instruct-transformed-w4a16

2B • Updated 14 days ago • 3

t-tech/T-pro-it-2.0-AWQ

6B • Updated 13 days ago • 1.42k • 5

ludis/L3.3-70B-Magnum-Diamond-W8A8

71B • Updated 14 days ago • 2

weiweiz1/DeepSeek-R1-NVFP4-RTN

Updated about 9 hours ago • 9

warshanks/Lucy-128k-AWQ

Text Generation • 0.8B • Updated 13 days ago • 81

Ba2han/gemma3-turkv4-w8a8

Image-Text-to-Text • Updated 13 days ago • 57

warshanks/Lucy-AWQ

Text Generation • 0.8B • Updated 13 days ago • 18

jiangchengchengNLP/L3.3-MS-Nevoria-70B-NVFP4

Text Generation • 41B • Updated 12 days ago • 9

JimmyFoxx/Qwen2.5-VL-32B-Instruct-FP8-Dynamic

33B • Updated 13 days ago • 6

GusPuffy/BlackSheep-24B-GPTQ

Text Generation • 4B • Updated 12 days ago • 17

cpatonn/OpenReasoning-Nemotron-32B-W8A8-INT8-Dynamic

33B • Updated 13 days ago • 51

cpatonn/OpenReasoning-Nemotron-14B-AWQ

3B • Updated 12 days ago • 14

cpatonn/OpenReasoning-Nemotron-7B-AWQ

2B • Updated 12 days ago • 11

jiangchengchengNLP/L3.3-MS-Nevoria-70b-NVFP4A16

Text Generation • 41B • Updated 12 days ago • 8

jiangchengchengNLP/Mistral-Small-3.2-24B-Instruct-W8A8

24B • Updated 12 days ago • 28

abhishekchohan/OpenReasoning-Nemotron-32B-W4A16

6B • Updated 12 days ago • 7