pix2test1 / README.md

alibakirx

Upload README.md with huggingface_hub

1a9df35 verified 3 months ago

preview code

raw

history blame

1.17 kB

metadata

title: Pix2Text
emoji: 🔤
colorFrom: blue
colorTo: green
sdk: gradio
sdk_version: 3.50.0
app_file: app.py
pinned: false
license: mit
language:
  - en
  - tr
tags:
  - ocr
  - image-to-text
  - computer-vision
  - transformers

Pix2Text Model

Bu model görüntülerden metin çıkarma (OCR) işlemi için geliştirilmiştir.

Kullanım

from transformers import AutoModel, AutoConfig
from PIL import Image

# Model yükle
config = AutoConfig.from_pretrained("your-username/pix2text", trust_remote_code=True)
model = AutoModel.from_pretrained("your-username/pix2text", trust_remote_code=True)

# Görüntü yükle ve tahmin yap
image = Image.open("your_image.jpg")
result = model.predict(image)
print(result)

Özellikler

PyTorch tabanlı
Transformers kütüphanesi ile uyumlu
Gradio arayüzü ile test edilebilir
Türkçe ve İngilizce metin desteği

Model Mimarisi

CNN tabanlı görüntü kodlayıcısı
Fully connected text decoder
768 boyutlu gizli katman
30.000 kelime dağarcığı

Performans

Model hala geliştirme aşamasındadır ve örnek amaçlıdır.