|
--- |
|
license: mit |
|
title: VSL AUDIO |
|
sdk: gradio |
|
emoji: 🐨 |
|
colorFrom: purple |
|
colorTo: purple |
|
--- |
|
# 🎤 Transcritor VSL Pro - WhisperX |
|
|
|
**Transcritor profissional otimizado para VSL com 4 modelos WhisperX e máxima precisão temporal** |
|
|
|
## 🚀 Modelos Disponíveis |
|
|
|
| Modelo | Precisão | Velocidade | Recomendado Para | |
|
|--------|----------|------------|------------------| |
|
| **🚀 Large-v3** ⭐ | Máxima (98%+) | 2-3x tempo real | **VSL profissional** | |
|
| **⚡ Large-v2** | Alta (95%+) | 3-4x tempo real | VSL geral | |
|
| **🏃 Medium** | Boa (90%+) | 4-5x tempo real | Testes rápidos | |
|
| **⚡ Turbo** | Básica (85%+) | 6-8x tempo real | Rascunhos | |
|
|
|
## ✨ Otimizado Especialmente Para |
|
|
|
- 🎯 **VSL de até 15 minutos** - Configurações específicas para conteúdo de marketing |
|
- 📺 **Conteúdo publicitário** - Detecção perfeita de termos técnicos |
|
- ⏱️ **Timestamps ultra-precisos** - ±100ms de precisão palavra por palavra |
|
- 🔧 **Correções automáticas** - CETOX, VSL, termos de marketing digital |
|
|
|
## 🛠️ Tecnologias de Ponta |
|
|
|
- **WhisperX Large-v3** - O modelo mais avançado da OpenAI com alinhamento temporal |
|
- **4 Modelos Disponíveis** - Escolha entre velocidade e precisão |
|
- **PTT5 Brasileira** - Correção gramatical específica para português BR |
|
- **Gradio Pro** - Interface otimizada para profissionais |
|
- **GPU Accelerated** - Processamento até 8x mais rápido que tempo real |
|
|
|
## 📊 Formato de Saída Profissional |
|
|
|
```json |
|
{ |
|
"metadata": { |
|
"tipo_conteudo": "VSL", |
|
"duracao_audio": 780.5, |
|
"tempo_processamento": 95.2, |
|
"velocidade_processamento": 8.2, |
|
"modelo_whisper": "WhisperX 🚀 Large-v3 (Máxima Precisão)", |
|
"otimizado_para": "VSL de até 15 minutos", |
|
"sistema": "NVIDIA A10G (24GB)" |
|
}, |
|
"words": [ |
|
{ |
|
"word": "CETOX", |
|
"original": "setox", |
|
"start": 0.120, |
|
"end": 0.360, |
|
"score": 0.982, |
|
"confidence": "high" |
|
} |
|
], |
|
"estatisticas": { |
|
"palavras_detectadas": 1247, |
|
"palavras_alta_confianca": 1180, |
|
"densidade_palavras": 96.2, |
|
"score_medio": 0.891, |
|
"correções_aplicadas": 23 |