v / README.md
RaiSantos's picture
Update README.md
d70f87b verified
---
license: mit
title: VSL AUDIO
sdk: gradio
emoji: 🐨
colorFrom: purple
colorTo: purple
---
# 🎤 Transcritor VSL Pro - WhisperX
**Transcritor profissional otimizado para VSL com 4 modelos WhisperX e máxima precisão temporal**
## 🚀 Modelos Disponíveis
| Modelo | Precisão | Velocidade | Recomendado Para |
|--------|----------|------------|------------------|
| **🚀 Large-v3** ⭐ | Máxima (98%+) | 2-3x tempo real | **VSL profissional** |
| **⚡ Large-v2** | Alta (95%+) | 3-4x tempo real | VSL geral |
| **🏃 Medium** | Boa (90%+) | 4-5x tempo real | Testes rápidos |
| **⚡ Turbo** | Básica (85%+) | 6-8x tempo real | Rascunhos |
## ✨ Otimizado Especialmente Para
- 🎯 **VSL de até 15 minutos** - Configurações específicas para conteúdo de marketing
- 📺 **Conteúdo publicitário** - Detecção perfeita de termos técnicos
- ⏱️ **Timestamps ultra-precisos** - ±100ms de precisão palavra por palavra
- 🔧 **Correções automáticas** - CETOX, VSL, termos de marketing digital
## 🛠️ Tecnologias de Ponta
- **WhisperX Large-v3** - O modelo mais avançado da OpenAI com alinhamento temporal
- **4 Modelos Disponíveis** - Escolha entre velocidade e precisão
- **PTT5 Brasileira** - Correção gramatical específica para português BR
- **Gradio Pro** - Interface otimizada para profissionais
- **GPU Accelerated** - Processamento até 8x mais rápido que tempo real
## 📊 Formato de Saída Profissional
```json
{
"metadata": {
"tipo_conteudo": "VSL",
"duracao_audio": 780.5,
"tempo_processamento": 95.2,
"velocidade_processamento": 8.2,
"modelo_whisper": "WhisperX 🚀 Large-v3 (Máxima Precisão)",
"otimizado_para": "VSL de até 15 minutos",
"sistema": "NVIDIA A10G (24GB)"
},
"words": [
{
"word": "CETOX",
"original": "setox",
"start": 0.120,
"end": 0.360,
"score": 0.982,
"confidence": "high"
}
],
"estatisticas": {
"palavras_detectadas": 1247,
"palavras_alta_confianca": 1180,
"densidade_palavras": 96.2,
"score_medio": 0.891,
"correções_aplicadas": 23