Imagens e figuras

Extrair imagens de PDF para Markdown

Diagramas, capturas de tela e figuras fazem parte do documento. Quando você converte um PDF para Markdown aqui, as imagens vêm junto: embutidas em linha para aparecerem em qualquer lugar, ou como marcadores leves quando você só precisa do texto.

Resposta curta

As figuras viajam com o texto

Um PDF mistura texto e imagens em cada página. O conversor extrai os dois: a prosa vira Markdown limpo e cada figura é levada como imagem. Você escolhe como, com um modo de imagem. Embutir escreve as imagens em linha (por exemplo, como base64), assim um único arquivo Markdown é renderizado completo em qualquer visualizador. Marcador mantém o arquivo pequeno e só indica onde cada imagem fica, ideal quando o que você precisa é o texto. Qualquer palavra dentro de uma imagem, como um diagrama rotulado, é captada pelo OCR.

Como fazer

Converta um PDF cheio de imagens

Sem conta. Escolha o modo de imagem conforme o destino do Markdown.

1

Abra o conversor

Instale a extensão do Chrome ou abra o app web.

2

Escolha embutir ou marcador

Nas configurações, decida se as imagens são embutidas em linha ou mantidas como marcadores. Embutir para um arquivo autônomo, marcador para o texto mais leve.

3

Adicione o PDF e aguarde

Arraste o arquivo ou cole uma URL. O status passa por na fila, processando, pronto. As figuras são preservadas e o texto da página passa por OCR.

4

Copie ou baixe

Veja a prévia do Markdown renderizado com imagens, depois copie ou baixe um arquivo .md.

Qual modo

Embutir ou marcador

A escolha certa depende de você querer um documento completo ou só as palavras.

Embutir em linha

Markdown autônomo que é renderizado completo em qualquer visualizador, com as figuras no lugar.
Bom para notas, documentos e tudo o que você lê como Markdown, como uma importação para Obsidian ou Notion.

Marcadores

Saída leve que mantém o arquivo pequeno e o texto fácil de comparar.
Bom para alimentar texto a um LLM ou a um pipeline RAG, onde as imagens não são o ponto.
No Markdown

O que cada modo produz

Os dois modos usam a mesma estrutura do documento; só mudam como cada figura é escrita.

Com embutir, uma figura é escrita em linha como uma imagem Markdown padrão, assim um único arquivo .md é totalmente autônomo e mostra a imagem em qualquer lugar:

## Figura 2. Arquitetura do sistema

![Figura 2. Arquitetura do sistema](data:image/png;base64,iVBORw0KGgo...)

A solicitação flui do cliente para a API facade e para o worker.

Com marcador, o mesmo ponto recebe uma marca leve em vez dos bytes da imagem, mantendo o arquivo pequeno e fácil de comparar enquanto ainda registra onde a figura fica:

## Figura 2. Arquitetura do sistema

[imagem: Figura 2. Arquitetura do sistema]

A solicitação flui do cliente para a API facade e para o worker.

Sobre o tamanho: embutir uma imagem em linha (como base64) pode multiplicar o tamanho do arquivo Markdown em um PDF cheio de imagens, o que é ótimo para um documento portátil, mas pesado para um prompt de LLM. Se você vai alimentar o texto a um modelo ou a um índice de busca, os marcadores reduzem a contagem de tokens enquanto preservam as legendas e os títulos que carregam o significado.

Perguntas frequentes

Perguntas comuns

Ele mantém as imagens e figuras de um PDF?

Sim. As figuras e imagens são levadas para o Markdown, seja embutidas em linha (por exemplo, como base64) ou como uma referência de marcador, conforme o modo de imagem que você escolher.

Como as imagens são embutidas no Markdown?

As imagens em linha usam a sintaxe padrão de imagem do Markdown, então elas aparecem em qualquer visualizador de Markdown. Um marcador, por outro lado, deixa o arquivo mais leve e indica onde a imagem fica.

Posso desativar a inserção de imagens?

Sim. Uma configuração de modo de imagem permite embutir as imagens ou usar marcadores, então você pode manter o Markdown pequeno quando só precisa do texto.

E uma página totalmente digitalizada, só de imagem?

O texto da página passa por OCR para Markdown. Quando uma página é essencialmente uma imagem sem texto recuperável, ela pode ser mantida como imagem de página para que nada se perca. Veja PDF digitalizado para Markdown.

Diagramas e gráficos são convertidos em dados?

As imagens continuam sendo imagens; as legendas, rótulos e qualquer texto legível ao redor são convertidos em Markdown. Um gráfico não é transformado de volta em seus números subjacentes.

É grátis?

Sim. Converta de forma anônima no navegador no plano gratuito (3 espaços, arquivos de 10 MB, orçamento de tempo de 15 minutos, retenção de 1 hora). Os planos pagos ampliam todos os limites.