Pix2Text Model

Bu model görüntülerden metin çıkarma (OCR) işlemi için geliştirilmiştir.

Kullanım

from transformers import AutoModel, AutoConfig
from PIL import Image

# Model yükle
config = AutoConfig.from_pretrained("your-username/pix2text", trust_remote_code=True)
model = AutoModel.from_pretrained("your-username/pix2text", trust_remote_code=True)

# Görüntü yükle ve tahmin yap
image = Image.open("your_image.jpg")
result = model.predict(image)
print(result)

Özellikler

  • PyTorch tabanlı
  • Transformers kütüphanesi ile uyumlu
  • Gradio arayüzü ile test edilebilir
  • Türkçe ve İngilizce metin desteği

Model Mimarisi

  • CNN tabanlı görüntü kodlayıcısı
  • Fully connected text decoder
  • 768 boyutlu gizli katman
  • 30.000 kelime dağarcığı

Performans

Model hala geliştirme aşamasındadır ve örnek amaçlıdır.

Downloads last month
7
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support