Spaces:

RaiSantos
/

v

Sleeping

App Files Files Community

v / README.md

RaiSantos

Update README.md

d70f87b verified about 1 month ago

preview code

raw

history blame contribute delete

2.12 kB

	---
	license: mit
	title: VSL AUDIO
	sdk: gradio
	emoji: 🐨
	colorFrom: purple
	colorTo: purple
	---
	# 🎤 Transcritor VSL Pro - WhisperX

	Transcritor profissional otimizado para VSL com 4 modelos WhisperX e máxima precisão temporal

	## 🚀 Modelos Disponíveis

	\| Modelo \| Precisão \| Velocidade \| Recomendado Para \|
	\|--------\|----------\|------------\|------------------\|
	\| 🚀 Large-v3 ⭐ \| Máxima (98%+) \| 2-3x tempo real \| VSL profissional \|
	\| ⚡ Large-v2 \| Alta (95%+) \| 3-4x tempo real \| VSL geral \|
	\| 🏃 Medium \| Boa (90%+) \| 4-5x tempo real \| Testes rápidos \|
	\| ⚡ Turbo \| Básica (85%+) \| 6-8x tempo real \| Rascunhos \|

	## ✨ Otimizado Especialmente Para

	- 🎯 VSL de até 15 minutos - Configurações específicas para conteúdo de marketing
	- 📺 Conteúdo publicitário - Detecção perfeita de termos técnicos
	- ⏱️ Timestamps ultra-precisos - ±100ms de precisão palavra por palavra
	- 🔧 Correções automáticas - CETOX, VSL, termos de marketing digital

	## 🛠️ Tecnologias de Ponta

	- WhisperX Large-v3 - O modelo mais avançado da OpenAI com alinhamento temporal
	- 4 Modelos Disponíveis - Escolha entre velocidade e precisão
	- PTT5 Brasileira - Correção gramatical específica para português BR
	- Gradio Pro - Interface otimizada para profissionais
	- GPU Accelerated - Processamento até 8x mais rápido que tempo real

	## 📊 Formato de Saída Profissional

	```json
	{
	"metadata": {
	"tipo_conteudo": "VSL",
	"duracao_audio": 780.5,
	"tempo_processamento": 95.2,
	"velocidade_processamento": 8.2,
	"modelo_whisper": "WhisperX 🚀 Large-v3 (Máxima Precisão)",
	"otimizado_para": "VSL de até 15 minutos",
	"sistema": "NVIDIA A10G (24GB)"
	},
	"words": [
	{
	"word": "CETOX",
	"original": "setox",
	"start": 0.120,
	"end": 0.360,
	"score": 0.982,
	"confidence": "high"
	}
	],
	"estatisticas": {
	"palavras_detectadas": 1247,
	"palavras_alta_confianca": 1180,
	"densidade_palavras": 96.2,
	"score_medio": 0.891,
	"correções_aplicadas": 23