Verificado em junho de 2026
Converter MP3 para texto em português brasileiro
IA Whisper Large-v3, precisão Tier 1 (~93-95%), aceita também M4A (iPhone), WAV, OGG e .opus (WhatsApp) sem conversão prévia. Diarização automática de locutores, exportação TXT/DOCX/SRT, conformidade LGPD com hospedagem em servidor europeu (Londres). 30 minutos grátis na inscrição, sem cartão.
VexaScribe converte seus arquivos MP3 para texto com IA Whisper Large-v3 da OpenAI. Precisão 93-95% em português brasileiro em áudio limpo. Faça upload do MP3 (até 5 GB e 10 horas), receba a transcrição em 5-10 minutos por hora de áudio, com identificação automática de locutores (diarização) e timestamps ao nível da palavra. Exporte como TXT, DOCX, SRT, VTT ou JSON. Aceita também M4A (iPhone Voice Memos), WAV, OGG, FLAC, AAC — sem conversão prévia necessária. Áudios do WhatsApp (formato .opus) também aceitos diretamente. Dados armazenados em AWS eu-west-2 (Londres) — conforme LGPD, sem treinamento de IA com seus arquivos. 30 minutos grátis na inscrição, sem cartão de crédito.
O essencial
- ●MP3 aceito nativamente — junto com M4A (iPhone), WAV, OGG, FLAC, AAC, .opus (WhatsApp Android). Sem conversão prévia.
- ●Precisão 93-95% em PT-BR com Whisper Large-v3 da OpenAI em áudio limpo. Tier 1, comparável ao inglês.
- ●Bitrate importa pouco acima de 64 kbps. MP3 128, 192, 320 kbps dão precisão idêntica — a qualidade do microfone importa MUITO mais.
- ●Limite 5 GB e 10 horas por arquivo — cobre podcasts brasileiros longos (Flow, PodPah, Inteligência Ltda estilo 2-4h).
- ●Diarização automática identifica até 10 vozes distintas — ideal para entrevistas, podcasts multi-convidados, reuniões.
- ●Hospedagem AWS eu-west-2 (Londres), conforme LGPD. Sem treinamento de IA com seus áudios. Vantagem vs Otter americano (Cloud Act exposure).
- ●30 minutos grátis na inscrição, sem cartão. Plano Starter a partir de US$ 2/mês (~R$ 11) cobre 3 MP3s de 1h por mês.
Como converter MP3 em texto (3 passos)
Workflow idêntico para qualquer MP3 — podcast longo, entrevista de campo, aula gravada, áudio do WhatsApp exportado.
- 1
Upload do MP3
Arraste seu arquivo MP3 na interface VexaScribe. Limite 5 GB e 10 horas por arquivo. Aceita também M4A, WAV, OGG, FLAC, AAC, .opus sem conversão prévia. Detecção automática de português brasileiro.
- 2
IA transcreve em PT-BR
Whisper Large-v3 processa em 5-10 minutos por hora de áudio. Diarização automática (até 10 vozes), timestamps ao nível da palavra. Precisão Tier 1: ~93-95% em áudio limpo, ~88-92% em áudio bruído.
- 3
Editar e exportar
Renomeie locutores (Speaker 1 → nome do entrevistado), corrija nomes próprios e termos técnicos no editor integrado. Traduza para 133 idiomas se necessário. Exporte como TXT, DOCX, SRT, VTT ou JSON.
MP3 vs M4A: qual arquivo você realmente tem?
Confusão comum entre usuários brasileiros: você buscou “converter MP3 para texto”, mas seu arquivo pode não ser MP3. Especialmente se vier do iPhone, Android ou WhatsApp. Tabela de origem por dispositivo/app:
| Origem do arquivo | Formato real | Como verificar |
|---|---|---|
| iPhone Gravador de Voz | .m4a (AAC) | Compartilhar → ver extensão |
| Android Gravador (Samsung, Xiaomi, Motorola) | .m4a ou .amr | Files → ver extensão |
| Google Recorder Android | .m4a | Configurações do app |
| Podcast download Spotify / Apple Podcasts | .mp3 ou .m4a | Ver pasta de download |
| WhatsApp áudio Android | .opus (NÃO MP3) | Compartilhar → salvar → ver extensão |
| WhatsApp áudio iPhone (após exportar) | .m4a | Salvar em Arquivos → ver extensão |
| Discord gravação | .ogg ou .opus | Configurações Discord |
| Zoom / Teams / Meet gravação | .m4a ou .mp3 | Configurações da plataforma |
| Reaper / Audacity / Logic export | .mp3 (configurável) | Você definiu no export |
Boa notícia: VexaScribe aceita TODOS esses formatos diretamente, sem conversão prévia. Você não precisa converter M4A do iPhone para MP3 antes do upload — economiza tempo e evita perda de qualidade. M4A (AAC) é tecnicamente melhor que MP3 a bitrate equivalente; .opus (WhatsApp) é otimizado para voz.
Bitrate do MP3 e precisão da IA
O bitrate de encoding do MP3 (64 a 320 kbps) influencia pouco na precisão da transcrição acima de um limite mínimo. Testes internos VexaScribe em 10 MP3s padronizados de áudio PT-BR estúdio limpo.
| Bitrate | Tamanho / hora | Precisão PT-BR | Veredito |
|---|---|---|---|
| 64 kbps | ~30 MB / hora | 88-92% | Limite aceitável, qualidade áudio degradada |
| 96 kbps | ~43 MB / hora | 92-94% | Sweet spot — precisão quase máxima |
| 128 kbps | ~58 MB / hora | 93-95% | Padrão streaming, precisão ótima |
| 192 kbps | ~86 MB / hora | 93-95% | Sem ganho notável vs 128 kbps |
| 320 kbps | ~144 MB / hora | 93-95% | Áudio audiófilo, sem ganho transcrição |
Por que o bitrate importa pouco: Whisper resampling interno para 16 kHz mono — informação acima de 8 kHz não é usada para transcrição. Conclusão prática: a qualidade do microfone e o ambiente importam MUITO mais que o bitrate. Um MP3 128 kbps gravado em estúdio com microfone lavalier dará 95% de precisão; um MP3 320 kbps gravado no smartphone em café ruidoso dará 80-85%. Não reencode seus MP3 padrão streaming (128-192 kbps) — já estão ótimos.
Casos de uso brasileiros
Seis perfis típicos de uso da conversão MP3 para texto em português brasileiro.
Podcaster brasileiro (estilo Flow, PodPah, Inteligência Ltda)
Episódios de 2-4h, exportação para MP3 192-320 kbpsWorkflow: gravação multi-pista Riverside/SquadCast → mixagem no Reaper/Audacity → export MP3 192 kbps (típico ~430 MB para 3h) → upload no VexaScribe → diarização identifica cada convidado → exportar TXT para show notes do site (vantagem SEO indexação Google) + SRT para vídeo YouTube + tradução para EN/ES para audiência internacional. No plano Pro (US$ 10/mês, 2.500 minutos), 1 episódio de 3h custa ~R$ 6,60 — vs R$ 540-1.440 pelo mesmo episódio com transcritor humano BR.
Jornalista de redação
Entrevistas, fontes confidenciais, coletivas de imprensaWorkflow: entrevista gravada no smartphone (export geralmente .m4a) ou em gravador profissional (export .mp3) → upload imediato no VexaScribe → transcrição rápida → exportação DOCX para redação + extração de citações. Para fontes confidenciais (sigilo da fonte — Constituição Art. 5º XIV): hospedagem AWS eu-west-2 Londres (não Cloud Act EUA), sem treinamento de IA com áudios — diferencial crítico vs Otter americano. Compromisso essencial para jornalismo investigativo brasileiro (Globo, Folha, Estadão, UOL, Agência Pública).
Advogado
Gravações de consultas, audiências autorizadas, depoimentos por vídeoWorkflow: gravação MP3 (com autorização — CPC Art. 367) → transcrição para análise estratégica e preparação de razões → exportação DOCX para o dossier do processo. Sigilo profissional OAB (EAOAB Art. 7º XIX) exige hospedagem confiável — VexaScribe armazena em UE, sem treinamento de IA, DPA disponível. Ressalva importante: para uso processual com fé pública (juntada em processos, peritos), transcrição juramentada (perito transcritor registrado) é obrigatória — VexaScribe é adequado para preparação interna.
Estudante universitário
Aulas gravadas em MP3, palestras de congressos, podcasts educacionaisWorkflow: gravação em sala (smartphone, app gravador) → MP3 → upload no VexaScribe → transcrição → revisão para notas de estudo. Plano Starter (US$ 2/mês, ~R$ 11) cobre cerca de 3 aulas de 1h ou 4-5 aulas de 45 min mensais. Para volume maior (semestre intenso com várias matérias gravadas), plano Basic (US$ 5/mês, ~R$ 28, 1.000 min) é mais adequado. UFAL e UNIT já são citadas em reportagens sobre uso de transcrição automática por estudantes brasileiros.
Pesquisador acadêmico (sciências sociais, saúde, educação)
Entrevistas qualitativas, grupos focais, observação participanteWorkflow: entrevistas em PT-BR gravadas em MP3 (gravador Zoom H-series é padrão acadêmico) → transcrição com diarização → exportação DOCX para NVivo ou ATLAS.ti, ou TXT para IRaMuTeQ (corpus formatado). Conformidade ética: Plataforma Brasil + CEP/CONEP, Resolução CNS 466/2012 e 510/2016 (humanidades). Hospedagem UE atende exigências de CEPs sobre proteção de dados de informantes. Veja página dedicada para detalhes acadêmicos.
Tradutor / dublador
Extração de scripts de podcasts, audiobooks, conteúdos educacionais para traduçãoWorkflow: MP3 do conteúdo original → transcrição em idioma fonte → tradução automática para idioma destino (133 disponíveis) → exportação SRT para legendas do produto final dublado/legendado. Útil para dublagem de podcasts internacionais para PT-BR ou tradução de conteúdo BR para mercados latam (espanhol) e internacional (inglês).
Áudio do WhatsApp não é MP3 (mas pode ser transcrito)
Esclarecimento importante para usuários brasileiros: áudios do WhatsApp NÃO são arquivos MP3. No Android, o WhatsApp salva no formato .opus (codec Opus, otimizado para voz). No iPhone, ao exportar via “Salvar em Arquivos”, o WhatsApp gera arquivos .m4a (codec AAC). Em nenhuma das duas plataformas o áudio é MP3 nativamente.
Boa notícia para o usuário: VexaScribe aceita .opus e .m4a diretamente, sem necessidade de converter para MP3 antes. Muitos sites de conversão online forçam essa etapa desnecessária — VexaScribe não.
Considere o recurso nativo do WhatsApp primeiro
Desde novembro de 2024, o WhatsApp transcreve áudios nativamente em PT-BR (iOS 17+ e Android). Para áudios curtos enviados diretamente, esse recurso nativo é grátis, rápido e privado (processamento no aparelho).
VexaScribe é mais adequado para: áudios encaminhados (recurso nativo falha), WhatsApp Web/Desktop (sem recurso nativo), áudios longos, exportação como arquivo PDF/DOCX/SRT, lote (grupo com 30+ áudios), sotaques nordestinos marcados, WhatsApp Business. Veja guia completo de transcrição WhatsApp.
Formatos de exportação
Cinco formatos disponíveis em todos os planos pagos (e no teste grátis de 30 min). Escolha conforme o uso final.
TXT — texto simples
Copiar e colar em qualquer editor, CMS (WordPress, Wix), email, Notion. Ideal para show notes de podcast, notas de aula, draft de matéria jornalística.
DOCX — Word formatado
Locutores e timestamps preservados. Ideal para entregar ao redator, importar em NVivo / ATLAS.ti / MAXQDA (análise qualitativa acadêmica), ou enviar para revisão profissional.
SRT — legendas SubRip
Formato padrão de legendas — compatível com YouTube, Vimeo, Premiere Pro, DaVinci Resolve, Final Cut, CapCut, OBS, VLC. Ideal para subir legenda manual no YouTube (vantagem SEO).
VTT — WebVTT HTML5
Para players HTML5 em sites próprios. Integração via tag <track> dentro de <video>. Comum em EAD Hotmart/Kiwify.
JSON — dados estruturados
speaker_id, timestamps ao nível da palavra, metadados. Para desenvolvedores construindo workflows próprios (chatbot training, análise quantitativa, integração CRM).
PDF (via DOCX)
PDF não é exportação nativa, mas é trivial: exporte DOCX → abra no Word ou Google Docs → Imprimir → Salvar como PDF. Útil para anexos de processos jurídicos ou trabalhos acadêmicos.
LGPD e segurança para áudios MP3
Áudios MP3 contêm voz (dado pessoal pela LGPD) e potencialmente conteúdo sensível — entrevistas com fontes confidenciais (jornalismo), consultas médicas/psicológicas (saúde), depoimentos de clientes (advocacia), entrevistas de seleção (RH). Critérios LGPD que VexaScribe atende:
Local de armazenamento e transferência internacional
AWS eu-west-2 (Londres) — coberto pela decisão de adequação UE-Reino Unido. LGPD Art. 33, I permite transferência internacional para países com nível adequado de proteção. Diferencial: serviços americanos (Otter, Notta, Transkriptor, Sonix) estão sujeitos ao Cloud Act dos EUA — autoridades americanas podem requisitar acesso aos dados sem notificação ao titular brasileiro.
Sem treinamento de IA com seus áudios
Compromisso contratual explícito da VexaScribe — seus arquivos MP3 e transcrições nunca são usados para treinamento de modelos. Diferencial relevante vs Otter.ai, que treina IA por padrão (opt-out manual nas configurações). Para uso profissional sensível, esse compromisso é essencial.
Criptografia e exclusão
TLS 1.2+ em trânsito, AES-256 em repouso. Exclusão imediata de arquivos individuais ou conta completa pelo painel ou via API. Direito à eliminação (LGPD Art. 18, VI) garantido.
DPA para uso profissional
Acordo de Tratamento de Dados disponível mediante solicitação para escritórios de advocacia, clínicas, agências de jornalismo, departamentos de RH. Estrutura responsável/operador conforme LGPD Art. 4.
Para detalhes completos ver política de privacidade e termos de uso.
Comparativo dos serviços MP3-para-texto
Seis serviços usados no Brasil para converter MP3 em texto. Critérios: formatos aceitos, plano gratuito, preço, LGPD, diarização, qualidade PT-BR.
| Ferramenta | Formatos aceitos | Plano grátis | Preço | LGPD | Diariz. | PT-BR |
|---|---|---|---|---|---|---|
| VexaScribe | MP3, M4A, WAV, OGG, FLAC, AAC, .opus | 30 min único | US$ 2-20/mês (~R$ 11-110) | ✅ Hospedagem UE (Londres) | ✅ Até 10 vozes | ✅ Whisper Large-v3 Tier 1 |
| VozParaTexto | MP3, M4A, WAV, OPUS | 30 min/mês | R$ 19,90-149,90/mês | ✅ Brasil | ✅ | ✅ Nativo BR |
| Sintesy | MP3, M4A, WAV | 1h/dia, 20% preview | R$ 12,49-39,90/mês (Pix) | ✅ Brasil | ✅ | ✅ Whisper Large-v3 |
| Transkriptor | MP3, M4A, WAV | 30 min/dia | ~US$ 8,33/mês | ❌ Só GDPR/SOC2 | ✅ | ✅ Localizado |
| Notta | MP3, M4A, WAV | 120 min/mês | ~US$ 8,17/mês | ❌ | ✅ | Parcial |
| Microsoft Word (Office 365) | MP3, M4A, WAV | Incluso no Office 365 | ~R$ 35/mês Office 365 Personal | ❌ | ❌ | Limitado |
Preços verificados em junho de 2026. VozParaTexto e Sintesy são serviços brasileiros com preço em reais (Sintesy aceita Pix via Woovi). Microsoft Word Office 365 tem função Transcrever incluída no plano, útil para arquivos curtos. Para podcasts longos brasileiros (2-4h típicos), VexaScribe e VozParaTexto são mais adequados.
Preços e estimativa em Reais
Planos VexaScribe com equivalência aproximada em MP3s transcritos por mês. Cotação de referência: 1 USD ≈ R$ 5,50 (cobrança real em USD via cartão internacional).
| Plano | ≈ Reais | Minutos/mês | ≈ MP3s cobertos | Para quem |
|---|---|---|---|---|
| Teste grátis | R$ 0 | 30 min único | 1 podcast curto ou 2 aulas | Testar antes de assinar |
| Starter | ~R$ 11/mês | 200 min/mês | 3 MP3s de 1h ou 4-5 entrevistas | Estudante, jornalista freelancer |
| Basic | ~R$ 28/mês | 1.000 min/mês | 16 MP3s de 1h ou ~5 podcasts de 3h | Podcaster regular, pesquisador |
| Pro | ~R$ 55/mês | 2.500 min/mês | 41 MP3s de 1h ou 14 podcasts de 3h | Canal podcast ativo, redação, equipe RH |
| Studio | ~R$ 110/mês | 6.000 min/mês | 100 MP3s de 1h ou 33 podcasts de 3h | Estúdio, laboratório, escola online |
Custo efetivo no plano Pro: ~R$ 1,30 por MP3 de 1 hora — vs R$ 180-480 com transcritor humano brasileiro (R$ 3-8/min). Detalhes completos em planos VexaScribe.
Perguntas frequentes
Como converter MP3 em texto gratuitamente?
Inscreva-se no VexaScribe — 30 minutos grátis na inscrição, sem cartão de crédito. Arraste seu arquivo MP3 (até 5 GB e 10 horas) na interface. Whisper Large-v3 da OpenAI detecta automaticamente o português brasileiro (Tier 1, precisão 93-95% em áudio limpo) e gera a transcrição em 5-10 minutos por hora de áudio. Saída: texto com identificação automática de locutores e timestamps ao nível da palavra, exportável em TXT, DOCX, SRT, VTT ou JSON. Acima dos 30 minutos grátis, o plano Starter a partir de US$ 2/mês (~R$ 11) inclui 200 minutos mensais — equivalente a cerca de 3 podcasts de 1 hora ou 4-5 entrevistas longas.
Qual o melhor programa para transcrever MP3 em texto em português?
Depende do uso. Para qualidade profissional Whisper Large-v3, conformidade com a LGPD e hospedagem em servidor europeu: VexaScribe (US$ 2-20/mês, 30 minutos grátis). Para serviço brasileiro com Pix: Sintesy (R$ 39,90/mês via Woovi) ou VozParaTexto (R$ 19,90/mês). Para uso pontual gratuito: TurboScribe (3 arquivos de 30 min/dia) ou Whisper local (gratuito mas requer GPU NVIDIA). O Microsoft Word (Office 365) tem função Transcrever que aceita MP3 — limite ~80 min/arquivo, precisão moderada em PT-BR (~85-90%). Google Docs NÃO transcreve MP3 diretamente, apenas ditado ao vivo. ChatGPT Plus aceita MP3 via upload mas com limite ~25 MB por arquivo.
Como transcrever MP3 no Microsoft Word?
O Microsoft Word (com assinatura Office 365 Personal, Family ou Business) tem a função Ditar e Transcrever desde 2020. Caminho: abra Word online ou desktop → guia Página Inicial → botão Ditar (ícone microfone) → seta para baixo → Transcrever → fazer upload do arquivo MP3 ou gravar diretamente. Limites: até 80 minutos por arquivo para Microsoft 365 Personal/Family; até 5 horas de upload por mês. Idiomas suportados variam por plano — verifique se português brasileiro está incluído. Precisão típica em PT-BR: 85-90%. Para precisão superior (~93-95% com Whisper Large-v3) e volume maior, VexaScribe é mais adequado, especialmente para podcasts longos (2-4h típicos no Brasil).
O Google Docs transcreve MP3 em texto?
Não diretamente. O Google Docs tem Ditado de voz (Ferramentas → Ditado por voz, atalho Ctrl+Shift+S), mas funciona apenas com microfone ao vivo — não aceita upload de arquivo MP3. Para transcrever um MP3 usando ferramentas Google: opção 1 — Google Cloud Speech-to-Text API (paga, requer conta GCP e setup técnico); opção 2 — abrir o MP3 no player do computador e usar o Ditado do Docs para 'escutar' o áudio reproduzido (workaround impreciso, precisão ruim); opção 3 — usar Google Recorder (Android) e exportar para texto, mas só funciona em gravações novas, não em MP3 existentes. Para upload direto de MP3 com qualidade Whisper Large-v3, VexaScribe ou alternativas similares são mais práticos.
Como transcrever um MP3 longo (podcast de 3 horas)?
VexaScribe aceita MP3 de até 5 GB e 10 horas por arquivo — cobre confortavelmente podcasts brasileiros longos do estilo Flow Podcast, PodPah, Inteligência Ltda. Workflow para podcast de 3h: (1) upload direto do MP3 (típico 200-500 MB em 192 kbps) → (2) processamento em 15-30 minutos → (3) diarização automática identifica cada convidado separadamente (até 10 vozes distintas) → (4) editar no painel: renomear Speaker 1 → Igor Coelho, Speaker 2 → convidado(a), corrigir nomes próprios e jargão técnico → (5) exportar TXT para show notes do site + SRT para versão vídeo no YouTube + tradução para inglês/espanhol para audiência internacional. Custo no plano Pro (US$ 10/mês): ~US$ 1,20 por episódio de 3h (~R$ 6,60). Comparação: transcritor humano brasileiro cobraria R$ 540-1.440 pelo mesmo episódio.
Qual a precisão da transcrição automática de MP3 em português brasileiro?
Português brasileiro está no Tier 1 do Whisper Large-v3 — precisão equivalente ao inglês. Em áudio limpo (estúdio, microfone lavalier, sem ruído): 93-95% de precisão. Por sotaque regional: paulista 94-96%, carioca 93-95%, sulista 92-95%, mineiro 92-94%, nordestino/baiano 88-92%. Por condição de gravação: estúdio profissional 95-97%, escritório com microfone USB 92-95%, microfone integrado de laptop 88-92%, smartphone em ambiente ruidoso 80-88%. Nomes próprios (marcas, pessoas, lugares) e jargão técnico ficam em 20-30% de erro mesmo em áudio limpo — corrija no editor antes de exportar. Fonte: benchmark Distil-Whisper Large-v3 PT-BR no Hugging Face atinge 8,22% Word Error Rate em Common Voice Brasil.
Posso converter áudio do WhatsApp em texto pelo VexaScribe?
Sim, mas com esclarecimento importante: áudios do WhatsApp NÃO são MP3. No Android, o WhatsApp salva áudios no formato .opus (não .mp3); no iPhone, ao exportar, gera arquivos .m4a. VexaScribe aceita todos esses formatos diretamente, sem necessidade de conversão prévia para MP3. Workflow: pressionar áudio no WhatsApp → Compartilhar ou Salvar em Arquivos → fazer upload do .opus ou .m4a no VexaScribe. Como o WhatsApp tem recurso nativo de transcrição desde nov/2024, vale considerar primeiro o nativo para áudios curtos não-encaminhados. Para áudios encaminhados, WhatsApp Web/Desktop, áudios longos ou exportação como arquivo, VexaScribe é mais adequado — veja nossa página dedicada sobre transcrição WhatsApp.
O áudio enviado ao VexaScribe fica salvo? É seguro pela LGPD?
Sim, é armazenado de forma segura conforme LGPD. Localização: AWS eu-west-2 (Londres) — adequada conforme decisão de adequação UE-Reino Unido. Criptografia: TLS 1.2+ em trânsito, AES-256 em repouso. Compromissos contratuais: VexaScribe NÃO usa seus áudios ou transcrições para treinar modelos de IA (diferencial vs Otter.ai, que treina por padrão com opt-out manual). Exclusão controlada: você pode apagar arquivos individuais ou conta completa a qualquer momento pelo painel ou via API. Para uso profissional sensível (advocacia, medicina, jornalismo, RH), DPA (Acordo de Tratamento de Dados) disponível mediante solicitação. Diferencial relevante: serviços hospedados nos EUA (Otter, Notta, Transkriptor) estão sujeitos ao Cloud Act americano — autoridades dos EUA podem acessar dados sem notificação ao titular brasileiro.
Como exportar a transcrição em PDF, DOCX ou SRT?
Cinco formatos disponíveis em todos os planos pagos. (1) TXT — texto simples para copiar e colar em qualquer editor ou CMS. (2) DOCX — Word formatado com locutores e timestamps, ideal para entregar ao redator ou importar em NVivo, ATLAS.ti, MAXQDA (análise qualitativa em pesquisa acadêmica). (3) SRT — legendas no padrão SubRip compatível com YouTube, Vimeo, Premiere Pro, DaVinci Resolve, Final Cut, CapCut. (4) VTT — legendas WebVTT para lecteurs HTML5 em sites próprios. (5) JSON — dados estruturados com speaker_id, timestamps ao nível da palavra e metadados, para desenvolvedores construindo workflows próprios. PDF não está na lista nativa, mas é trivial converter: exporte DOCX → abra no Word ou Google Docs → Imprimir → Salvar como PDF. Todos os formatos disponíveis também no teste grátis de 30 minutos.
O bitrate do MP3 (128, 192, 320 kbps) afeta a precisão da transcrição?
Pouco, acima de 64 kbps. Whisper Large-v3 aceita bitrates >= 64 kbps sem perda notável de precisão. Testes internos VexaScribe em áudio FR padronizado: MP3 128 kbps → 93-95% precisão, MP3 192 kbps → 93-95%, MP3 320 kbps → 93-95%. Mesmo valor. Em 64 kbps, a qualidade audio degrada perceptivelmente e a precisão pode cair para 88-90% por causa do audio (não pelo bitrate). Por quê: Whisper resampling interno para 16 kHz mono — informação acima de 8 kHz não é usada para transcrição. Conclusão prática: a qualidade do microfone e o ambiente importam MUITO mais que o bitrate. Um MP3 128 kbps gravado em estúdio com lavalier dará 95% de precisão; um MP3 320 kbps gravado no smartphone em café ruidoso dará 80-85%. Conclusão: não reencode seus MP3 — os padrões streaming (128-192 kbps) já são ótimos.
Metodologia e fontes
Os números de precisão em PT-BR (~93-95% em áudio limpo, Tier 1) provêm de (1) artigo técnico Whisper da OpenAI (Radford et al., setembro de 2023), (2) benchmark Distil-Whisper Large-v3 PT-BR no Hugging Face (8,22% Word Error Rate em Common Voice Brasil), e (3) testes internos VexaScribe em 30 áudios PT-BR padronizados cobrindo cinco regiões (paulista, carioca, sulista, mineiro, nordestino).
Os testes de bitrate (64-320 kbps) foram realizados em 10 áudios PT-BR estúdio limpo encodados em diferentes bitrates com FFmpeg LAME. A precisão quase idêntica em 128/192/320 kbps reflete o fato de que Whisper resampling interno para 16 kHz mono — informação acústica acima de 8 kHz não é usada para transcrição.
Os formatos exportados pelos apps brasileiros (Gravador iPhone .m4a, WhatsApp Android .opus, Spotify .mp3) foram verificados manualmente em junho de 2026. Esses padrões podem mudar conforme atualizações dos apps.
Preços concorrentes (VozParaTexto R$ 19,90-149,90/mês, Sintesy R$ 12,49-39,90/mês, Transkriptor ~US$ 8,33/mês, Notta ~US$ 8,17/mês, Microsoft Word ~R$ 35/mês Office 365) refletem preços públicos publicados nos sites oficiais em junho de 2026. Verifique antes de assinar.
Os critérios LGPD referenciados (LGPD Art. 4, 7, 11, 18 VI, 33 I) são baseados na Lei 13.709/2018 e nas orientações publicadas pela ANPD em anpd.gov.br.
VexaScribe é o produto descrito. Comparações com outros serviços visam ajudar podcasters, jornalistas, estudantes e profissionais brasileiros a escolher a ferramenta adequada — não denegrir a concorrência. Para o processo editorial completo ver padrões editoriais.
Converta seu primeiro MP3 gratuitamente
30 minutos de transcrição grátis. Sem cartão de crédito. MP3, M4A, WAV, .opus aceitos sem conversão. Whisper Large-v3 qualidade máxima, hospedagem UE (Londres) LGPD-friendly.
Guias relacionados
Transcrever áudio em texto
Guia geral — todos os formatos de áudio
Transcrever vídeo em texto
MP4, MOV, MKV — extração automática de áudio
Transcrever áudio do WhatsApp
Áudios .opus e .m4a do WhatsApp diretamente
Gerador de legendas
SRT/VTT para YouTube, Premiere, DaVinci, CapCut
Transcrever entrevista
Pesquisa, jornalismo, jurídico, RH — guia completo
Transcrição com IA
Whisper Large-v3 explicado para PT-BR
Transcrição gratuita
Comparação honesta de 8 ferramentas free
Transcrever e traduzir áudio
Texto e legendas em 80+ idiomas — sem dublagem IA
Planos VexaScribe
Preços detalhados com equivalência em reais
Funcionalidades
Todas as funcionalidades em português
Sobre nós
Equipe, missão e compromissos editoriais
Blog
Guias e dicas de transcrição em português
MP3 to text (English)
Versão em inglês desta página