--- title: Pix2Text emoji: 🔤 colorFrom: blue colorTo: green sdk: gradio sdk_version: 3.50.0 app_file: app.py pinned: false license: mit language: - en - tr tags: - ocr - image-to-text - computer-vision - transformers --- # Pix2Text Model Bu model görüntülerden metin çıkarma (OCR) işlemi için geliştirilmiştir. ## Kullanım ```python from transformers import AutoModel, AutoConfig from PIL import Image # Model yükle config = AutoConfig.from_pretrained("your-username/pix2text", trust_remote_code=True) model = AutoModel.from_pretrained("your-username/pix2text", trust_remote_code=True) # Görüntü yükle ve tahmin yap image = Image.open("your_image.jpg") result = model.predict(image) print(result) ``` ## Özellikler - PyTorch tabanlı - Transformers kütüphanesi ile uyumlu - Gradio arayüzü ile test edilebilir - Türkçe ve İngilizce metin desteği ## Model Mimarisi - CNN tabanlı görüntü kodlayıcısı - Fully connected text decoder - 768 boyutlu gizli katman - 30.000 kelime dağarcığı ## Performans Model hala geliştirme aşamasındadır ve örnek amaçlıdır.