v / README.md
RaiSantos's picture
Update README.md
d70f87b verified

A newer version of the Gradio SDK is available: 5.44.1

Upgrade
metadata
license: mit
title: VSL AUDIO
sdk: gradio
emoji: 🐨
colorFrom: purple
colorTo: purple

🎤 Transcritor VSL Pro - WhisperX

Transcritor profissional otimizado para VSL com 4 modelos WhisperX e máxima precisão temporal

🚀 Modelos Disponíveis

Modelo Precisão Velocidade Recomendado Para
🚀 Large-v3 Máxima (98%+) 2-3x tempo real VSL profissional
⚡ Large-v2 Alta (95%+) 3-4x tempo real VSL geral
🏃 Medium Boa (90%+) 4-5x tempo real Testes rápidos
⚡ Turbo Básica (85%+) 6-8x tempo real Rascunhos

✨ Otimizado Especialmente Para

  • 🎯 VSL de até 15 minutos - Configurações específicas para conteúdo de marketing
  • 📺 Conteúdo publicitário - Detecção perfeita de termos técnicos
  • ⏱️ Timestamps ultra-precisos - ±100ms de precisão palavra por palavra
  • 🔧 Correções automáticas - CETOX, VSL, termos de marketing digital

🛠️ Tecnologias de Ponta

  • WhisperX Large-v3 - O modelo mais avançado da OpenAI com alinhamento temporal
  • 4 Modelos Disponíveis - Escolha entre velocidade e precisão
  • PTT5 Brasileira - Correção gramatical específica para português BR
  • Gradio Pro - Interface otimizada para profissionais
  • GPU Accelerated - Processamento até 8x mais rápido que tempo real

📊 Formato de Saída Profissional

{
  "metadata": {
    "tipo_conteudo": "VSL",
    "duracao_audio": 780.5,
    "tempo_processamento": 95.2,
    "velocidade_processamento": 8.2,
    "modelo_whisper": "WhisperX 🚀 Large-v3 (Máxima Precisão)",
    "otimizado_para": "VSL de até 15 minutos",
    "sistema": "NVIDIA A10G (24GB)"
  },
  "words": [
    {
      "word": "CETOX",
      "original": "setox",
      "start": 0.120,
      "end": 0.360,
      "score": 0.982,
      "confidence": "high"
    }
  ],
  "estatisticas": {
    "palavras_detectadas": 1247,
    "palavras_alta_confianca": 1180,
    "densidade_palavras": 96.2,
    "score_medio": 0.891,
    "correções_aplicadas": 23