Como traduzir um PDF para português mantendo o layout original
Recebeu um manual técnico em inglês, um contrato em espanhol ou uma ficha de produto em alemão — tudo em PDF. Precisa do conteúdo em português, e precisa agora. A tentação é abrir o Google Translate, carregar o ficheiro e esperar pelo melhor.
O resultado costuma ser decepcionante: parágrafos fora de ordem, tabelas partidas, imagens deslocadas, e texto que claramente foi extraído sem perceber a estrutura do documento. O PDF chegou com um aspecto profissional; o que sai parece um rascunho de segundo grau.
Perceber porquê ajuda a escolher a abordagem certa.
Por que os PDFs são difíceis de traduzir
Um PDF não é um documento editável no sentido tradicional. Ao contrário de um ficheiro Word, não tem uma estrutura de texto com estilos, parágrafos e tabelas definidas. Um PDF é essencialmente uma representação visual — coordenadas na página onde determinado texto aparece, com determinado tamanho e cor.
Quando uma ferramenta genérica "traduz um PDF", está a fazer duas coisas separadas: extrair o texto (perdendo parte da estrutura no processo) e depois traduzir esse texto. O que não está a fazer é reconstituir o layout original com a tradução no lugar certo.
O resultado é texto plano traduzido. Não um documento.
As três opções disponíveis
Opção 1 — Ferramentas genéricas gratuitas Google Translate e serviços similares aceitam PDFs, mas entregam texto corrido ou, na melhor das hipóteses, uma aproximação pobre do layout original. Adequado para perceber o conteúdo de um documento informal. Inadequado para qualquer documento que precise de sair da empresa.
Opção 2 — Converter para Word primeiro, depois traduzir Adobe Acrobat e ferramentas como Smallpdf ou ILovePDF conseguem converter PDFs em ficheiros .docx com razoável fidelidade, especialmente se o PDF foi criado digitalmente (não escaneado). Depois de converter, pode traduzir o Word com uma plataforma que preserve formatação. Este processo em dois passos funciona bem para PDFs com texto predominantemente corrido.
Opção 3 — Plataforma de tradução que processa PDFs directamente Algumas plataformas de tradução de documentos processam PDFs directamente, extraindo texto e estrutura em simultâneo, traduzindo dentro dessa estrutura e entregando um ficheiro com o layout preservado. É a opção mais rápida e que produz os resultados mais consistentes.
O que deve exigir do resultado
Independentemente da ferramenta, o documento final deve:
- Manter os títulos e subtítulos na posição correcta
- Preservar tabelas com as células no lugar certo
- Manter imagens e gráficos no contexto original
- Ter numeração de páginas e rodapés funcionais
- Ser editável, para que possa fazer ajustes pontuais se necessário
Se algum destes pontos não estiver satisfeito, o documento não está pronto a usar — está a meio caminho.
PDFs escaneados: um caso especial
PDFs produzidos por scanner (por oposição a PDFs criados digitalmente) não têm texto seleccionável — são imagens. Para traduzir estes documentos é necessário OCR (reconhecimento óptico de caracteres) antes de qualquer processo de tradução. A qualidade do OCR afecta directamente a qualidade da tradução: se o texto não for extraído correctamente, a tradução parte de uma base errada.
Para PDFs escaneados com conteúdo importante, a abordagem mais segura é a conversão manual assistida por um profissional, não ferramentas automáticas.
Quando a qualidade é suficiente e quando não é
Para uso interno — perceber o conteúdo de um relatório, entender as especificações de um fornecedor, analisar uma proposta — qualidade imperfeita é aceitável. O objectivo é compreender, não publicar.
Para uso externo — documentação de produto, comunicações com clientes, materiais de marketing, propostas comerciais — a qualidade tem de ser apresentável. Um documento mal traduzido ou mal formatado reflecte directamente na imagem da empresa.
O Vertio suporta PDFs e entrega o documento traduzido com a estrutura preservada. Para documentos que representam a empresa, a diferença entre um PDF "traduzido" e um documento realmente pronto é imediatamente visível.