MISHANM
/

ibm-granite-vision-3.2-2b-fp16

Model card Files Files and versions

MISHANM commited on Mar 1

Commit

6f50949

·

verified ·

1 Parent(s): 52d7491

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -4,7 +4,7 @@ base_model:
 ---
-# MISHANM/deepseek-ai_janus-Pro-7B-fp16
 The MISHANM/ibm-granite-granite-vision-3.2-2b-fp16 model is a sophisticated vision-language model designed for image-to-text generation. It leverages advanced neural architectures to transform visual inputs into coherent textual descriptions.
@@ -41,7 +41,7 @@ from PIL import Image
 device = "cuda" if torch.cuda.is_available() else "cpu"
-model_path = "MISHANM/ibm-granite-granite-vision-3.2-2b-fp16"
 processor = AutoProcessor.from_pretrained(model_path)
 model = AutoModelForVision2Seq.from_pretrained(model_path, ignore_mismatched_sizes=True).to(device)
@@ -113,7 +113,7 @@ Users are encouraged to critically evaluate the model's outputs, especially in s
 ## Citation Information
 ```
-@misc{MISHANM/ibm-granite-granite-vision-3.2-2b-fp16,
   author = {Mishan Maurya},
   title = {Introducing Image to Text Generation model},
   year = {2025},

 ---
+# MISHANM/ibm-granite-vision-3.2-2b-fp16
 The MISHANM/ibm-granite-granite-vision-3.2-2b-fp16 model is a sophisticated vision-language model designed for image-to-text generation. It leverages advanced neural architectures to transform visual inputs into coherent textual descriptions.
 device = "cuda" if torch.cuda.is_available() else "cpu"
+model_path = "MISHANM/ibm-granite-vision-3.2-2b-fp16"
 processor = AutoProcessor.from_pretrained(model_path)
 model = AutoModelForVision2Seq.from_pretrained(model_path, ignore_mismatched_sizes=True).to(device)
 ## Citation Information
 ```
+@misc{MISHANM/ibm-granite-vision-3.2-2b-fp16,
   author = {Mishan Maurya},
   title = {Introducing Image to Text Generation model},
   year = {2025},