Spaces:
Sleeping
Sleeping
File size: 1,324 Bytes
d106da6 18def1d d106da6 beacf7a e4067a1 beacf7a e4067a1 0a6a56c e4067a1 0a6a56c e4067a1 0a6a56c e4067a1 0a6a56c e4067a1 0a6a56c e4067a1 0a6a56c |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 |
---
title: Voxsense
emoji: 💻
colorFrom: blue
colorTo: green
sdk: gradio
sdk_version: 4.44.0
app_file: app.py
pinned: false
license: mit
short_description: Um app que transcreve e analisa sentimentos de áudios
---
# Voxsense
É uma aplicação que permite a transcrição de áudios de até 1 hora e realiza a análise de sentimentos da transcrição resultante.
## Como Usar
1. **Faça upload** de um arquivo de áudio (formatos suportados: WAV, MP3, etc.).
2. **Aguarde** enquanto o áudio é transcrito e as emoções são analisadas.
3. **Veja** a transcrição e as emoções detectadas exibidas na tela.
## Tecnologias Utilizadas
- **Gradio** para a interface web.
- **Transformers** da Hugging Face para modelos de NLP.
- **PyTorch** como backend.
## Modelos
- **Transcrição de Áudio:** `openai/whisper-small`
- **Análise de Emoções:** `joeddav/xlm-roberta-large-xnli` utilizando classificação zero-shot.
## Observações
- A precisão depende da qualidade do áudio e da clareza da fala.
- Para melhores resultados, utilize áudios com pouco ruído de fundo.
- O processamento pode levar algum tempo para áudios longos.
## Dependências
Veja o arquivo `requirements.txt` para as dependências necessárias.
## Contato
**LinkedIn:** [`marioluciofjr`](https://linkedin.com/in/marioluciofjr)
|