Atualizado em junho de 2026
Transcrever vídeo do YouTube — grátis, em segundos
Cole a URL do YouTube e baixe a transcrição em TXT, SRT, VTT, JSON ou CSV. Funciona com legenda existente do YouTube (1 a 3 segundos) ou gera nova transcrição com IA via upload do arquivo. Grátis para vídeos curtos, sem cadastro.
Resumo rápido
- →Dois caminhos. Extrair a legenda que o YouTube já tem (3 segundos, grátis) ou transcrever com IA do zero via upload do arquivo (1-5 minutos, qualidade maior).
- →5 formatos. TXT para ler, SRT para editores de vídeo, VTT para web, JSON para devs, CSV para análise em planilha.
- →99 idiomas via Whisper. Inclui português brasileiro nativo. A detecção automática cobre canais multilíngues.
- →Grátis com limites honestos. Vídeos curtos: transcrição completa sem cadastro. Vídeos longos: prévia de 200 palavras grátis, transcrição completa após cadastro gratuito.
- →Não substitui a legenda manual do criador. Quando o criador subiu uma legenda manual de alta qualidade, ela é o que você baixa. Quando há só a automática, esperar erros é honesto — e o Whisper via upload é a alternativa.
Dois modos — baixar legenda vs transcrever com IA
A confusão mais comum sobre transcrição do YouTube. As duas operações são diferentes, com tradeoffs diferentes.
Baixar legenda existente
- ● Velocidade: 1 a 3 segundos
- ● Custo: Grátis, sem cadastro para vídeos curtos
- ● Funciona quando: O vídeo tem legenda manual (do criador) ou automática (do YouTube)
- ● Qualidade: Depende do que o YouTube já tem — legenda manual costuma ser excelente, automática varia de 85% (inglês limpo) a menos de 70% (PT-BR com sotaque ou áudio ruim)
- ● Bom para: Vídeos públicos com legenda já disponível, leitura rápida, citação informal
Transcrever com IA (upload)
- ● Velocidade: 1 a 5 minutos para vídeo de 30 minutos
- ● Custo: Plano pago (a partir de US$ 2/mês equivalente) ou 30 minutos grátis no teste
- ● Funciona quando: Você tem o arquivo de vídeo (download autorizado ou conteúdo próprio)
- ● Qualidade: Whisper Large-v3, ~95% em áudio limpo, com diarização de falantes
- ● Bom para: Vídeos sem legenda, legendas com erros graves, transcrição profissional para republicação ou pesquisa
Quando começar pelo primeiro caminho: sempre. Cole a URL, veja o resultado. Se a legenda existente está boa, use. Se está faltando ou ruim, parta para o upload com Whisper. Tentar a extração primeiro economiza tempo e custo na maioria dos casos.
Como funciona
- Cole a URL do vídeo do YouTube. Funciona com youtube.com/watch?v=…, youtu.be/…, youtube.com/shorts/… e variantes. Não funciona com playlist nem canal.
- Escolha o idioma (opcional). O padrão é \"detectar automaticamente\". Para canais multilíngues ou quando a detecção falha, escolha manualmente.
- Clique em "Obter transcrição". Em 1 a 3 segundos a transcrição aparece com os segmentos e timestamps.
- Escolha o formato e baixe. TXT, SRT, VTT, JSON ou CSV. Ou clique em \"Copiar texto\" para colar nas suas anotações sem download.
Se a busca retorna \"sem legenda disponível\", crie uma conta gratuita e faça upload do arquivo de vídeo — a transcrição com Whisper Large-v3 gera o texto direto do áudio.
Formatos de exportação — qual escolher
Cada formato resolve um problema diferente. Resumo prático:
| Formato | Melhor para | Por quê |
|---|---|---|
| TXT | Leitura, citação em artigos, copiar e colar no Notion ou Google Docs | Texto puro, arquivo menor, sem timestamps. Mais rápido para ler. |
| SRT | Editores de vídeo (Premiere, DaVinci, Final Cut, CapCut) e reupload de legenda em outras plataformas | Padrão universal de legenda com timestamps. Aceito por todos os editores grandes. |
| VTT | Players HTML5, legendas estilizadas para web, streaming HLS | Padrão W3C. Suporta posicionamento, estilo e efeitos karaokê. |
| JSON | Pipelines de desenvolvimento, workflows customizados, precisão de timestamp por palavra | Dados estruturados com timestamps por segmento, metadados de idioma, machine-readable. |
| CSV | Análise de conteúdo em planilha, pesquisa qualitativa, anotações por timestamp | Ordenável por timestamp, importável para Excel e ferramentas de pesquisa (NVivo, ATLAS.ti). |
Em dúvida: TXT para ler, SRT para editar vídeo, JSON para construir algo customizado. Para detalhes sobre como SRT e VTT lidam com timing, veja nosso gerador de legendas SRT.
Casos de uso comuns no Brasil
O que pessoas no Brasil fazem com transcrição do YouTube em 2026:
1. Repurposing de podcast no YouTube
Você grava o episódio, sobe no YouTube, baixa a transcrição em TXT, edita em um post de blog ou newsletter. 1 hora de podcast vira 1 post de blog em ~45 minutos de edição em vez de 4 horas escrevendo do zero.
2. Aula ou palestra para estudo
Aulas no YouTube (Khan Academy, Me Salva, ProEnem, Curso em Vídeo, palestras TEDx em PT) ficam pesquisáveis. Baixe em TXT, busque por termos específicos, ou peça à IA para gerar um resumo da aula.
3. Entrevistas publicadas no YouTube
Jornalistas e pesquisadores fazem citação direta com timestamp. Baixe em SRT para ter o timestamp ao lado de cada fala, facilita verificação e citação verbatim.
4. Extração de legenda para tradução ou dublagem
Baixe a legenda em SRT, edite no Subtitle Edit ou Aegisub, traduza para outro idioma, reupload em um canal localizado.
5. Acessibilidade — legenda para outras plataformas
O criador tem legenda no YouTube mas quer disponibilizar a mesma legenda no Vimeo, Instagram ou no próprio site. Baixe SRT/VTT e suba na nova plataforma.
6. Pesquisa acadêmica e jornalismo investigativo
Análise de discurso de canais públicos, monitoramento de conteúdo, citações em matérias. TXT para análise textual; CSV para análise quantitativa em planilha.
Idiomas suportados — 99 idiomas via Whisper
A ferramenta funciona com qualquer idioma de legenda que o YouTube oferece. Para extração de legenda existente, o resultado depende do que o criador subiu — vídeos com legenda manual em vários idiomas permitem escolher; vídeos com só a automática trazem o idioma detectado pelo YouTube.
Para transcrição com IA via upload, o Whisper Large-v3 suporta 99 idiomas incluindo português brasileiro, português europeu, inglês, espanhol, mandarim, japonês, coreano, francês, alemão, italiano, árabe, russo, hindi, indonésio, vietnamita, tailandês, hebraico, persa, holandês, polonês e dezenas de outros. A precisão em português brasileiro é comparável à de inglês — Whisper foi treinado em um corpus multilíngue grande.
Para canais internacionais cujo conteúdo você quer transcrever em PT, considere combinar com nossa ferramenta de transcrição e tradução — transcreve no idioma original e traduz para PT em uma única operação.
Limites e o que esperar do plano gratuito
Honestidade sobre o que é grátis e o que não é, para evitar a frustração comum com sites que prometem "100% grátis" e depois pedem cadastro.
- ● Vídeos curtos (menos de ~200 palavras de transcrição): Transcrição completa grátis, sem cadastro. Funciona em vídeos curtos de 1-3 minutos.
- ● Vídeos longos: Prévia gratuita das primeiras 200 palavras sem cadastro. Para a transcrição completa em vídeos de 30+ minutos, crie uma conta gratuita.
- ● Conta gratuita (cadastro sem cartão): 30 minutos de upload de áudio/vídeo grátis para transcrição com Whisper. Transcrições ilimitadas via paste de URL.
- ● Vídeos sem legenda: Requer upload do arquivo e plano pago para vídeos longos. O Whisper consome minutos do plano.
- ● Vídeos privados, com restrição etária ou regional: Não funcionam pelo paste de URL. Use upload direto do arquivo.
- ● Planos pagos: A partir de US$ 2/mês equivalente (~R$ 10-12/mês) para uso esporádico, até US$ 20/mês para uso intensivo profissional.
Veja a comparação completa de preços em nossos planos.
Problemas comuns e soluções
"URL inválida"
Verifique se a URL é de um vídeo público, não de uma playlist ou canal. Formatos aceitos: youtube.com/watch?v=…, youtu.be/…, youtube.com/shorts/….
"Sem legenda disponível"
O vídeo não tem legenda manual nem automática do YouTube. Crie uma conta gratuita e use a transcrição com IA via upload do arquivo.
Vídeo muito longo (3+ horas)
A extração de legenda funciona normalmente, mas a versão gratuita mostra apenas as primeiras 200 palavras. Crie uma conta gratuita para a transcrição completa.
Idioma errado detectado
Escolha o idioma manualmente no dropdown em vez de deixar em "Detectar automaticamente". Útil para canais multilíngues ou vídeos com mistura de idiomas.
Legenda automática com muitos erros
A legenda automática do YouTube tem qualidade variável (~85-92% em inglês, menor em PT-BR e outros idiomas). Use a transcrição com IA via upload — Whisper Large-v3 entrega ~95% em áudio limpo.
Vídeo privado ou restrito
Vídeos privados, com restrição etária ou "apenas com link" geralmente não funcionam pelo paste de URL. Faça upload direto do arquivo.
Sobre legalidade — nota honesta
Esta não é uma orientação jurídica — consulte um advogado para o seu caso específico. Em geral, no Brasil:
- ● Uso pessoal (leitura, estudo, anotações para você mesmo): geralmente permitido como uso justo sob a Lei de Direitos Autorais (Lei 9.610/98, art. 46).
- ● Citação curta com atribuição (jornalismo, crítica, pesquisa acadêmica): tradicionalmente protegido pela mesma lei, especialmente para fins educativos ou informativos.
- ● Acessibilidade (gerar legenda para você assistir ou para deficientes auditivos): geralmente permitido.
- ● Republicação completa da transcrição como conteúdo próprio, sem permissão: não é permitido. O texto falado é obra protegida do criador.
- ● Uso comercial (monetização do conteúdo derivado): obtenha permissão do criador.
Os Termos de Serviço do YouTube também restringem reuso de conteúdo da plataforma. Para uso profissional ou comercial, a regra simples é: peça permissão ao criador, ou limite-se a citações curtas com atribuição clara.
Perguntas frequentes
Como transcrever um vídeo do YouTube?
Três caminhos. (1) Cole a URL na ferramenta no topo desta página. Em 1 a 3 segundos você recebe a transcrição em TXT, SRT, VTT, JSON ou CSV. Funciona quando o vídeo tem legenda (manual ou automática do YouTube). Prévia gratuita de 200 palavras em vídeos longos, transcrição completa em vídeos curtos. (2) Use o painel nativo do YouTube — clique nos três pontinhos abaixo do vídeo e escolha "Mostrar transcrição", depois copie e cole. Sem download de arquivo, mas funciona para leitura rápida. (3) Crie uma conta gratuita e faça upload do vídeo. Rodamos o Whisper Large-v3 no áudio para transcrição de alta precisão (95%+ em áudio limpo), com diarização de falantes e suporte a 99 idiomas. Use esse caminho quando o vídeo não tem legenda ou a legenda automática está errada.
Dá para baixar a legenda automática do YouTube em TXT?
Sim. Cole a URL na ferramenta no topo desta página e clique em "Baixar .txt" (ou .srt, .vtt). A ferramenta extrai a legenda existente do YouTube — automática ou manual — e converte para o formato escolhido. Para uma legenda que já existe no vídeo, o processo leva 1 a 3 segundos. O resultado em TXT vem sem timestamps por padrão; SRT e VTT incluem os timestamps por cue, prontos para usar em editores de vídeo ou players HTML5.
Qual a diferença entre baixar a legenda e transcrever com IA?
Operações diferentes. Baixar a legenda extrai o texto que o YouTube já tem (legenda enviada pelo criador ou gerada automaticamente pelo próprio YouTube). É rápida, gratuita e funciona em qualquer vídeo público com legenda — mas a qualidade depende do que o YouTube já tem. Transcrever com IA usa o Whisper Large-v3 para gerar uma transcrição nova diretamente do áudio do vídeo, com precisão maior (95%+ em áudio limpo vs ~85-92% das legendas automáticas do YouTube). Transcrever com IA é o caminho certo quando o vídeo não tem legenda, quando a legenda automática está cheia de erros, ou quando você precisa de output profissional para republicação.
Funciona com vídeos longos (mais de 1 hora)?
Para extração de legenda existente: sim, sem limite prático de duração — vídeos de 3+ horas funcionam normalmente. Em vídeos longos, a versão gratuita mostra uma prévia das primeiras 200 palavras; crie uma conta gratuita para baixar a transcrição inteira. Para transcrição com IA via upload (Whisper): vídeos longos consomem mais minutos do plano, então recomendamos pelo menos o plano Pro para podcasts e aulas longas. Para uso esporádico, o plano Starter (200 minutos/mês) cobre alguns vídeos longos sem problema.
É realmente grátis?
Sim, com limites honestos. A extração de legenda do YouTube é gratuita e sem cadastro para vídeos curtos (transcrição completa) e para a prévia de 200 palavras de vídeos longos. Para baixar a transcrição completa de vídeos longos, é preciso criar uma conta gratuita — 30 minutos de upload de áudio/vídeo grátis no plano de teste, sem cartão de crédito. Para uso intensivo (várias horas por mês ou transcrição IA do zero em vídeos sem legenda), os planos pagos começam em US$ 2/mês equivalente (cerca de R$ 10-12/mês). Não há cobranças escondidas nem cobrança por uso individual da ferramenta de URL.
Funciona com vídeos em outros idiomas?
Sim, em 99 idiomas. O YouTube oferece legenda em vários idiomas para vídeos com áudio em inglês, espanhol, português, mandarim, japonês, coreano, francês, alemão, italiano, árabe, russo, hindi e dezenas de outros. A ferramenta detecta o idioma automaticamente (auto-detect) ou você pode escolher o idioma manualmente no dropdown. Para vídeos em português brasileiro especificamente, a ferramenta funciona normalmente — vídeos de canais brasileiros geralmente têm legenda automática em PT-BR disponível. Quando o vídeo não tem legenda no idioma que você quer, faça upload do arquivo e use a transcrição IA — o Whisper Large-v3 transcreve no idioma do áudio original.
Posso transcrever vídeos privados ou não listados?
Vídeos privados (configurados como Private no YouTube): não. A ferramenta acessa apenas o que o YouTube disponibiliza publicamente. Vídeos não listados (Unlisted): geralmente sim, desde que você tenha a URL — vídeos não listados são acessíveis por link mesmo sem aparecer em buscas. Vídeos com restrição etária (Age-restricted): podem não funcionar dependendo da política de acesso do YouTube. Vídeos com restrição regional: dependem da localização. Para qualquer vídeo que você tem permissão para acessar mas não consegue extrair a legenda via URL, baixe o vídeo (com permissão) e faça upload na conta para transcrição via Whisper.
É legal usar a transcrição em um trabalho acadêmico ou matéria jornalística?
Não é aconselhamento jurídico — consulte um advogado para o seu caso específico. Em geral, para uso pessoal (leitura, estudo, anotações pessoais), citação curta com atribuição (jornalismo, pesquisa acadêmica, crítica) e acessibilidade (legendar para você mesmo assistir), o uso é considerado fair use ou uso justo na maioria das jurisdições, incluindo o Brasil sob a Lei de Direitos Autorais (Lei 9.610/98). Para republicação completa de uma transcrição como conteúdo seu, sem permissão do criador, é diferente: o texto falado é obra protegida do criador, e os Termos de Serviço do YouTube restringem reuso. Para uso comercial, sempre obtenha permissão do criador. Citações curtas para crítica, pesquisa e jornalismo são tradicionalmente protegidas.
Como esta ferramenta se compara a DownSub, NoteGPT e outras?
Para extração de legenda existente do YouTube, a maioria das ferramentas converge em qualidade similar — todas estamos buscando a mesma legenda que o YouTube já tem. A diferença está na UX, na seleção de formatos e na qualidade do seletor de idioma. Onde nos diferenciamos é no caminho secundário: transcrição IA real sobre o arquivo de vídeo quando a legenda está faltando ou errada. A VexaScribe usa Whisper Large-v3 via upload na conta. DownSub, NoteGPT, NoteLM e Tubetranscript são ferramentas honestas para o caminho de extração. Se você prefere a UX delas para essa parte, use. Nosso objetivo é ser honesto sobre os limites da extração e oferecer uma alternativa real via Whisper quando a legenda não basta.
Guias relacionados
Transcrever vídeo em texto
Guia completo para qualquer formato de vídeo, não só YouTube
Transcrever áudio em texto
Para arquivos de áudio puro — MP3, WAV, M4A
Gerador de legendas SRT
Para gerar SRT/VTT direto do upload, sem passar por YouTube
Transcrever e traduzir
Transcrição + tradução em uma operação — útil para canais internacionais
Converter MP3 para texto
Foco em arquivos de áudio MP3 — guia de bitrate e qualidade
Transcrição gratuita
O que é grátis de verdade no mercado de transcrição em 2026