Tabelas e fórmulas

Extrair tabelas de PDF para Markdown

Obtenha tabelas Markdown reais e alinhadas de um PDF, não uma captura nem uma confusão de linhas. Tabelas de várias colunas e páginas, fórmulas e tabelas digitalizadas incluídas.

Resposta curta

Sim: tabelas Markdown reais, não imagens

Copiar uma tabela de um PDF costuma transformá-la em linhas desalinhadas, porque um PDF guarda os caracteres por posição, não como uma tabela. O PDF to Markdown reconstrói as linhas e colunas e as escreve como uma tabela Markdown autêntica (barras, uma linha de cabeçalho e células alinhadas), para que os números continuem editáveis, comparáveis e pesquisáveis. Ele lida com páginas de várias colunas, tabelas que se estendem por várias páginas, fórmulas e tabelas em páginas digitalizadas, sem nada para configurar.

Como fazer

Converta uma tabela de PDF em 4 passos

Sem conta. O documento inteiro é convertido, tabelas incluídas.

1

Abra o conversor

Instale a extensão do Chrome ou abra o app web. As duas funcionam de forma anônima.

2

Adicione o PDF

Arraste o arquivo, escolha-o do disco ou cole uma URL direta de PDF.

3

Aguarde o trabalho

O status passa por na fila, processando, pronto. As colunas são reconstruídas em tabelas Markdown alinhadas.

4

Copie ou baixe

Veja a prévia do Markdown renderizado e o código-fonte, depois copie a tabela ou baixe um arquivo .md.

Dica: precisa só das tabelas de muitos arquivos? Execute a mesma conversão pela API REST ou pelo MCP hospedado e processe as tabelas Markdown no seu próprio código.

O que é mantido

Estrutura mantida, não capturas

O conversor reconstrói a tabela que um PDF apenas desenha visualmente, então o resultado são dados que você pode usar.

Linhas e cabeçalhos alinhados

As colunas viram células Markdown reais com uma linha de cabeçalho, em vez de texto desalinhado.

Ordem de várias colunas

Os layouts de duas e três colunas são lidos na ordem de leitura correta, então as células ficam no lugar certo.

Tabelas de várias páginas

Uma tabela que continua por várias páginas é unida em uma única tabela Markdown em vez de ser dividida.

Fórmulas nas células

A notação matemática dentro ou ao lado de uma tabela é preservada em vez de virar caracteres ilegíveis.

Tabelas digitalizadas

As tabelas só de imagem e digitalizadas passam por OCR e viram tabelas Markdown selecionáveis.

Escolha do motor

O MinerU é robusto com tabelas densas e complexas; o Docling é rápido com as limpas e simples.

Uma tabela de uma página volta como Markdown puro que você pode colar em um documento, em um importador de planilhas ou em um prompt de LLM:

| Region | Units | Revenue |
| ------ | ----- | ------- |
| North  | 1,240 | $312K   |
| South  |   980 | $244K   |
| EMEA   | 1,610 | $402K   |

Como é texto puro, a tabela vai para qualquer lugar: cole no Google Sheets ou no Excel, coloque em um documento Markdown, compare no Git ou entregue a um LLM como contexto limpo. Sem realinhamento manual, e os números continuam editáveis em vez de presos em uma imagem.

Tabelas complexas: tabelas densas com células mescladas ou cabeçalhos aninhados, ou tabelas giradas de lado na página, também se convertem, mas podem exigir uma verificação visual rápida. Grades simples ficam prontas para usar do jeito que estão.

Matemática e fórmulas

As fórmulas sobrevivem à conversão

A maioria dos extratores de PDF transforma as equações em algo ininteligível. Aqui a notação matemática é mantida, então documentos técnicos e científicos continuam úteis.

Por que isso importa

Uma fórmula degradada é pior que inútil em um prompt de LLM ou em uma base de conhecimento: os símbolos se embaralham e o sentido se perde. Manter a notação significa que as equações ao lado das suas tabelas, e os valores que elas produzem, continuam legíveis tanto para pessoas quanto para modelos.

Bom saber

Matemática em linha e em bloco dentro e ao redor das tabelas é preservada durante a conversão.
Equações digitalizadas passam por OCR como o resto da página.
Matemática muito densa pode exigir uma verificação visual rápida, como em qualquer conversor.

Extraindo tabelas em escala?

O mesmo conversor é uma API REST e um endpoint MCP hospedado. Converta um PDF e processe as tabelas Markdown no seu próprio código ou a partir de um agente; veja o tutorial em Python no hub para desenvolvedores.

Perguntas frequentes

Perguntas comuns

Dá para converter tabelas de PDF para Markdown?

Sim. As colunas são reconstruídas em tabelas Markdown reais e alinhadas (barras e linhas) em vez de uma captura ou uma confusão de linhas, então os dados continuam editáveis e pesquisáveis.

As tabelas de várias páginas e colunas ficam intactas?

Sim. Os layouts de várias colunas são lidos na ordem certa e uma tabela que continua entre páginas é unida em uma única tabela Markdown. Tabelas muito complexas com células mescladas podem exigir uma limpeza leve.

As fórmulas são mantidas?

Sim. A notação matemática é preservada em vez de virar caracteres ilegíveis, então as fórmulas dentro e ao redor das tabelas sobrevivem à conversão.

E as tabelas em PDF digitalizados?

As tabelas digitalizadas e só de imagem passam por OCR e viram tabelas Markdown selecionáveis. Veja converter PDF digitalizados para o passo a passo completo de OCR.

Posso obter as tabelas por uma API?

Sim. A API REST e o MCP hospedado devolvem todo o Markdown, tabelas incluídas, então você pode extrair tabelas de forma programática ou a partir de um agente.

Posso abrir as tabelas extraídas no Excel ou no Google Sheets?

Sim. Uma tabela Markdown cola perfeitamente em uma planilha, ou você pode transformar as barras em CSV em poucas linhas. Como as células são texto real, não uma imagem, os dados ficam editáveis na hora.

Por que as colunas quebram quando copio e colo uma tabela de um PDF?

Um PDF guarda os caracteres por posição, não como uma tabela, então copiar e colar perde a estrutura de colunas e tudo desmorona em linhas desalinhadas. Converter para Markdown reconstrói as linhas e colunas.

É grátis?

Sim. Converta de forma anônima no navegador sem conta no plano gratuito (3 espaços, arquivos de 10 MB, orçamento de tempo de 15 minutos, retenção de 1 hora). Os planos pagos ampliam todos os limites.