Imágenes y figuras

Extraer imágenes de PDF a Markdown

Diagramas, capturas y figuras forman parte del documento. Cuando conviertes un PDF a Markdown aquí, las imágenes vienen con él: incrustadas en línea para que se muestren en cualquier sitio, o como marcadores ligeros cuando solo necesitas el texto.

Respuesta breve

Las figuras viajan con el texto

Un PDF mezcla texto e imágenes en cada página. El conversor saca ambos: la prosa se convierte en Markdown limpio y cada figura se lleva como imagen. Tú eliges cómo, con un modo de imagen. Incrustar escribe las imágenes en línea (por ejemplo como base64), así un solo archivo Markdown se renderiza completo en cualquier visor. Marcador mantiene el archivo pequeño y solo señala dónde va cada imagen, ideal cuando lo que necesitas es el texto. Cualquier palabra dentro de una imagen, como un diagrama etiquetado, la detecta el OCR.

Cómo

Convierte un PDF con muchas imágenes

Sin cuenta. Elige el modo de imagen según dónde vaya el Markdown.

1

Abre el conversor

Instala la extensión de Chrome o abre la app web.

2

Elige incrustar o marcador

En los ajustes, decide si las imágenes se incrustan en línea o se conservan como marcadores. Incrustar para un archivo autónomo, marcador para el texto más ligero.

3

Añade el PDF y espera

Arrastra el archivo o pega una URL. El estado pasa por en cola, procesando, listo. Las figuras se conservan y el texto de la página pasa por OCR.

4

Copia o descarga

Previsualiza el Markdown renderizado con imágenes, luego cópialo o descarga un archivo .md.

Qué modo

Incrustar o marcador

La elección correcta depende de si quieres un documento completo o solo las palabras.

Incrustar en línea

Markdown autónomo que se renderiza completo en cualquier visor, con las figuras en su sitio.
Bueno para notas, documentos y todo lo que leas como Markdown, como una importación a Obsidian o Notion.

Marcadores

Salida ligera que mantiene el archivo pequeño y el texto fácil de comparar.
Bueno para alimentar texto a un LLM o un pipeline RAG, donde las imágenes no son lo importante.
En el Markdown

Qué produce cada modo

Ambos modos usan la misma estructura del documento; solo cambian cómo se escribe cada figura.

Con incrustar, una figura se escribe en línea como una imagen Markdown estándar, así un solo archivo .md es totalmente autónomo y muestra la imagen en cualquier sitio:

## Figura 2. Arquitectura del sistema

![Figura 2. Arquitectura del sistema](data:image/png;base64,iVBORw0KGgo...)

La solicitud fluye del cliente a la API facade y al worker.

Con marcador, el mismo punto recibe una marca ligera en vez de los bytes de la imagen, manteniendo el archivo pequeño y fácil de comparar mientras sigue registrando dónde va la figura:

## Figura 2. Arquitectura del sistema

[imagen: Figura 2. Arquitectura del sistema]

La solicitud fluye del cliente a la API facade y al worker.

Sobre el tamaño: incrustar una imagen en línea (como base64) puede multiplicar el tamaño del archivo Markdown en un PDF con muchas imágenes, lo cual es estupendo para un documento portable pero pesado para un prompt de un LLM. Si vas a alimentar el texto a un modelo o a un índice de búsqueda, los marcadores reducen el conteo de tokens mientras conservan las leyendas y los encabezados que aportan el significado.

Preguntas frecuentes

Preguntas habituales

¿Conserva las imágenes y figuras de un PDF?

Sí. Las figuras e imágenes se llevan al Markdown, ya sea incrustadas en línea (por ejemplo como base64) o como un marcador de referencia, según el modo de imagen que elijas.

¿Cómo se incrustan las imágenes en el Markdown?

Las imágenes en línea usan la sintaxis estándar de imagen de Markdown, así se muestran en cualquier visor de Markdown. Un marcador, en cambio, mantiene el archivo más ligero y marca dónde va la imagen.

¿Puedo desactivar la incrustación de imágenes?

Sí. Un ajuste de modo de imagen te permite incrustar las imágenes o usar marcadores, así puedes mantener el Markdown pequeño cuando solo necesitas el texto.

¿Y una página totalmente escaneada, de solo imagen?

El texto de la página pasa por OCR a Markdown. Cuando una página es esencialmente una imagen sin texto recuperable, puede conservarse como imagen de página para que no se pierda nada. Consulta PDF escaneado a Markdown.

¿Los diagramas y gráficos se convierten en datos?

Las imágenes siguen siendo imágenes; las leyendas, etiquetas y cualquier texto legible alrededor se convierten en Markdown. Un gráfico no se transforma de nuevo en sus números subyacentes.

¿Es gratis?

Sí. Convierte de forma anónima en el navegador sin cuenta en el plan gratuito (3 espacios, archivos de 10 MB, presupuesto de tiempo de 15 minutos, retención de 1 hora). Los planes de pago amplían cada límite.