alibakirx
/

pix2test1

computer-vision

Model card Files Files and versions

Pix2Text Model

Bu model görüntülerden metin çıkarma (OCR) işlemi için geliştirilmiştir.

Kullanım

from transformers import AutoModel, AutoConfig
from PIL import Image

# Model yükle
config = AutoConfig.from_pretrained("your-username/pix2text", trust_remote_code=True)
model = AutoModel.from_pretrained("your-username/pix2text", trust_remote_code=True)

# Görüntü yükle ve tahmin yap
image = Image.open("your_image.jpg")
result = model.predict(image)
print(result)

Özellikler

PyTorch tabanlı
Transformers kütüphanesi ile uyumlu
Gradio arayüzü ile test edilebilir
Türkçe ve İngilizce metin desteği

Model Mimarisi

CNN tabanlı görüntü kodlayıcısı
Fully connected text decoder
768 boyutlu gizli katman
30.000 kelime dağarcığı

Performans

Model hala geliştirme aşamasındadır ve örnek amaçlıdır.

Downloads last month: -