---
title: Pix2Text
emoji: 🔤
colorFrom: blue
colorTo: green
sdk: gradio
sdk_version: 3.50.0
app_file: app.py
pinned: false
license: mit
language:
- en
- tr
tags:
- ocr
- image-to-text
- computer-vision
- transformers
---

# Pix2Text Model

Bu model görüntülerden metin çıkarma (OCR) işlemi için geliştirilmiştir.

## Kullanım

```python
from transformers import AutoModel, AutoConfig
from PIL import Image

# Model yükle
config = AutoConfig.from_pretrained("your-username/pix2text", trust_remote_code=True)
model = AutoModel.from_pretrained("your-username/pix2text", trust_remote_code=True)

# Görüntü yükle ve tahmin yap
image = Image.open("your_image.jpg")
result = model.predict(image)
print(result)
```

## Özellikler

- PyTorch tabanlı
- Transformers kütüphanesi ile uyumlu
- Gradio arayüzü ile test edilebilir
- Türkçe ve İngilizce metin desteği

## Model Mimarisi

- CNN tabanlı görüntü kodlayıcısı
- Fully connected text decoder
- 768 boyutlu gizli katman
- 30.000 kelime dağarcığı

## Performans

Model hala geliştirme aşamasındadır ve örnek amaçlıdır.