Spaces:
Running
A newer version of the Streamlit SDK is available:
1.51.0
title: Listen Lynx - Transcrição Avançada
emoji: 🎵
colorFrom: blue
colorTo: purple
sdk: streamlit
sdk_version: 1.28.0
app_file: app.py
pinned: false
license: mit
✨ Características 🤖 GPT-4o Mini Transcribe
Modelo rápido e econômico da OpenAI Máxima precisão na transcrição Otimizado para performance
🌍 Detecção Automática de Idioma
Suporta 15+ idiomas automaticamente Português 🇧🇷, Inglês 🇺🇸, Espanhol 🇪🇸, Francês 🇫🇷, Alemão 🇩🇪 Italiano 🇮🇹, Japonês 🇯🇵, Coreano 🇰🇷, Chinês 🇨🇳, Russo 🇷🇺 Árabe 🇸🇦, Hindi 🇮🇳, Holandês 🇳🇱, Polonês 🇵🇱, Turco 🇹🇷 e mais!
✨ Correção Automática com GPT-4 Mini
Correção automática de erros ortográficos Melhoria de pontuação e gramática Texto mais legível e profissional Impacto: +20-40% na qualidade final
📦 Processamento de Arquivos Grandes
Arquivos até 25MB: processamento direto Arquivos maiores: divisão automática em chunks de 20MB Sem limite de tamanho ou duração total Progress bar em tempo real
🎧 Todos os Formatos de Áudio Suportados
Comprimidos: MP3, M4A, AAC, OPUS, OGG Não comprimidos: WAV, FLAC Vídeo: MP4, MPEG, MPGA, WEBM Conversão automática para formato otimizado
🎯 Como Usar
Upload: Faça upload do seu arquivo de áudio (qualquer formato, qualquer tamanho) Clique: Pressione o botão "Transcrever Áudio" Aguarde: O sistema irá:
Converter para MP3 (se necessário) Dividir em partes (arquivos grandes) Transcrever com GPT-4o Mini Aplicar correções automáticas
Download: Baixe o resultado em TXT
💰 Custos Estimados (OpenAI API) Transcrição Base $0.006 por minuto de áudio Exemplo: 1 hora = $0.36 Pós-processamento (Automático) ~$0.0001-0.0005 por transcrição Custo adicional mínimo Exemplos Práticos Podcast 45 minutos:
Transcrição: $0.27 Com pós-proc.: $0.27 + $0.0003 = $0.2703
Reunião 2 horas:
Transcrição: $0.72 Com pós-proc.: $0.72 + $0.0005 = $0.7205
Aula 1h30:
Transcrição: $0.54 Com pós-proc.: $0.54 + $0.0004 = $0.5404
📊 Casos de Uso 🎙️ Podcasts e Conteúdo → Transcrição profissional pronta para publicação → Correção automática de erros → Formatação limpa e legível 📞 Reuniões e Chamadas → Transcrição completa de reuniões → Texto corrigido e formatado → Pronto para compartilhamento 🎥 Vídeos para Texto → Extração de áudio de vídeos → Transcrição automática → Pode ser usado para criar legendas 🎓 Aulas e Palestras → Transcrição acadêmica de alta qualidade → Correção de termos técnicos → Formatação profissional 💼 Entrevistas e Jornalismo → Transcrição rápida e precisa → Texto corrigido automaticamente → Economia de tempo na edição
⚙️ Configuração
API Key da OpenAI Configure a variável de ambiente OPENAI_API_KEY nas secrets do Space com sua chave da API da OpenAI.
Dependências Python bashpip install -r requirements.txt requirements.txt: streamlit>=1.28.0 openai>=1.50.0 httpx>=0.27.0 pydub==0.25.1 python-dotenv==1.0.0
Dependências do Sistema bashapt-get install ffmpeg packages.txt: ffmpeg
🛠️ Tecnologias Utilizadas
Streamlit: Interface web moderna e responsiva
- OpenAI GPT-4o Mini: Transcrição e correção de texto
- Pydub: Processamento e manipulação de áudio
- Python 3.10+: Backend robusto e confiável
🚀 Deploy Hugging Face Spaces
- Clone este repositório
- Configure OPENAI_API_KEY nas secrets
- Push para o Hugging Face
- Aguarde build (3-5 minutos)
Local
bashgit clone [repo]
cd listen-lynx
pip install -r requirements.txt
export OPENAI_API_KEY="sk-..."
streamlit run app.py
🔒 Privacidade e Segurança ✅ Arquivos processados via API OpenAI ✅ Nenhum arquivo armazenado permanentemente ✅ Limpeza automática de arquivos temporários ✅ Processamento seguro com HTTPS
📝 Limitações Requer chave de API da OpenAI válida Custos baseados no uso da API Arquivos muito grandes podem levar alguns minutos Qualidade da transcrição depende da qualidade do áudio
🎓 Créditos Desenvolvido usando:
- OpenAI GPT-4o Mini API
- Streamlit Framework
- Python & Pydub
❤️ Autor: guifav.github.io www.guilhermefavaron.com.br
Versão: 2.0 Completa Última Atualização: Outubro 2025 Status: ✅ Produção