v
File size: 2,122 Bytes
d70f87b
 
 
 
 
 
 
 
b96791f
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
---
license: mit
title: VSL AUDIO
sdk: gradio
emoji: 🐨
colorFrom: purple
colorTo: purple
---
# 🎤 Transcritor VSL Pro - WhisperX

**Transcritor profissional otimizado para VSL com 4 modelos WhisperX e máxima precisão temporal**

## 🚀 Modelos Disponíveis

| Modelo | Precisão | Velocidade | Recomendado Para |
|--------|----------|------------|------------------|
| **🚀 Large-v3** ⭐ | Máxima (98%+) | 2-3x tempo real | **VSL profissional** |
| **⚡ Large-v2** | Alta (95%+) | 3-4x tempo real | VSL geral |
| **🏃 Medium** | Boa (90%+) | 4-5x tempo real | Testes rápidos |
| **⚡ Turbo** | Básica (85%+) | 6-8x tempo real | Rascunhos |

## ✨ Otimizado Especialmente Para

- 🎯 **VSL de até 15 minutos** - Configurações específicas para conteúdo de marketing
- 📺 **Conteúdo publicitário** - Detecção perfeita de termos técnicos
- ⏱️ **Timestamps ultra-precisos** - ±100ms de precisão palavra por palavra
- 🔧 **Correções automáticas** - CETOX, VSL, termos de marketing digital

## 🛠️ Tecnologias de Ponta

- **WhisperX Large-v3** - O modelo mais avançado da OpenAI com alinhamento temporal
- **4 Modelos Disponíveis** - Escolha entre velocidade e precisão
- **PTT5 Brasileira** - Correção gramatical específica para português BR
- **Gradio Pro** - Interface otimizada para profissionais
- **GPU Accelerated** - Processamento até 8x mais rápido que tempo real

## 📊 Formato de Saída Profissional

```json
{
  "metadata": {
    "tipo_conteudo": "VSL",
    "duracao_audio": 780.5,
    "tempo_processamento": 95.2,
    "velocidade_processamento": 8.2,
    "modelo_whisper": "WhisperX 🚀 Large-v3 (Máxima Precisão)",
    "otimizado_para": "VSL de até 15 minutos",
    "sistema": "NVIDIA A10G (24GB)"
  },
  "words": [
    {
      "word": "CETOX",
      "original": "setox",
      "start": 0.120,
      "end": 0.360,
      "score": 0.982,
      "confidence": "high"
    }
  ],
  "estatisticas": {
    "palavras_detectadas": 1247,
    "palavras_alta_confianca": 1180,
    "densidade_palavras": 96.2,
    "score_medio": 0.891,
    "correções_aplicadas": 23