mahihossain666
/

llama-2-70b-hf-quantized-4bits-GPTQ

Text Generation

text-generation-inference

4-bit precision

Model card Files Files and versions

Quantized to 4bit precision using AutoGPTQ

Downloads last month: 1

Safetensors

Model size

69B params

Tensor type

I32

·

F16

·

Dataset used to train mahihossain666/llama-2-70b-hf-quantized-4bits-GPTQ