A newer version of the Gradio SDK is available:
5.44.1
metadata
license: mit
title: VSL AUDIO
sdk: gradio
emoji: 🐨
colorFrom: purple
colorTo: purple
🎤 Transcritor VSL Pro - WhisperX
Transcritor profissional otimizado para VSL com 4 modelos WhisperX e máxima precisão temporal
🚀 Modelos Disponíveis
Modelo | Precisão | Velocidade | Recomendado Para |
---|---|---|---|
🚀 Large-v3 ⭐ | Máxima (98%+) | 2-3x tempo real | VSL profissional |
⚡ Large-v2 | Alta (95%+) | 3-4x tempo real | VSL geral |
🏃 Medium | Boa (90%+) | 4-5x tempo real | Testes rápidos |
⚡ Turbo | Básica (85%+) | 6-8x tempo real | Rascunhos |
✨ Otimizado Especialmente Para
- 🎯 VSL de até 15 minutos - Configurações específicas para conteúdo de marketing
- 📺 Conteúdo publicitário - Detecção perfeita de termos técnicos
- ⏱️ Timestamps ultra-precisos - ±100ms de precisão palavra por palavra
- 🔧 Correções automáticas - CETOX, VSL, termos de marketing digital
🛠️ Tecnologias de Ponta
- WhisperX Large-v3 - O modelo mais avançado da OpenAI com alinhamento temporal
- 4 Modelos Disponíveis - Escolha entre velocidade e precisão
- PTT5 Brasileira - Correção gramatical específica para português BR
- Gradio Pro - Interface otimizada para profissionais
- GPU Accelerated - Processamento até 8x mais rápido que tempo real
📊 Formato de Saída Profissional
{
"metadata": {
"tipo_conteudo": "VSL",
"duracao_audio": 780.5,
"tempo_processamento": 95.2,
"velocidade_processamento": 8.2,
"modelo_whisper": "WhisperX 🚀 Large-v3 (Máxima Precisão)",
"otimizado_para": "VSL de até 15 minutos",
"sistema": "NVIDIA A10G (24GB)"
},
"words": [
{
"word": "CETOX",
"original": "setox",
"start": 0.120,
"end": 0.360,
"score": 0.982,
"confidence": "high"
}
],
"estatisticas": {
"palavras_detectadas": 1247,
"palavras_alta_confianca": 1180,
"densidade_palavras": 96.2,
"score_medio": 0.891,
"correções_aplicadas": 23