Rainnighttram
/

GLM-4.1V-9B-Thinking-bnb-4bit

4-bit precision

Model card Files Files and versions

Rainnighttram commited on Jul 8

Commit

5ff3e81

·

verified ·

1 Parent(s): 0ca0ca2

Update README.md

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -11,7 +11,7 @@ import torch
 from transformers import BitsAndBytesConfig
 MODEL_PATH = "THUDM/GLM-4.1V-9B-Thinking"
-SAVE_PATH = "./Q4"
 quant_config = BitsAndBytesConfig(
     load_in_4bit=True,
@@ -47,7 +47,7 @@ import io
 app = FastAPI()
 model = Glm4vForConditionalGeneration.from_pretrained(
-    "/path/to/the/model/safe/sensors",
     device_map="auto",
     quantization_config={"load_in_4bit": True, "bnb_4bit_quant_type": "nf4", "bnb_4bit_compute_dtype": torch.bfloat16}
 )

 from transformers import BitsAndBytesConfig
 MODEL_PATH = "THUDM/GLM-4.1V-9B-Thinking"
+SAVE_PATH = "/define/the/path/to/save/model"
 quant_config = BitsAndBytesConfig(
     load_in_4bit=True,
 app = FastAPI()
 model = Glm4vForConditionalGeneration.from_pretrained(
+    "/path/to/the/model/safesensors",
     device_map="auto",
     quantization_config={"load_in_4bit": True, "bnb_4bit_quant_type": "nf4", "bnb_4bit_compute_dtype": torch.bfloat16}
 )