Tablas y fórmulas

Extraer tablas de PDF a Markdown

Obtén tablas Markdown reales y alineadas de un PDF, no una captura ni un amasijo de líneas. Tablas multicolumna y multipágina, fórmulas y tablas escaneadas incluidas.

Respuesta breve

Sí: tablas Markdown reales, no imágenes

Copiar una tabla de un PDF suele convertirla en líneas desalineadas, porque un PDF guarda los caracteres por posición, no como una tabla. PDF to Markdown reconstruye las filas y columnas y las escribe como una tabla Markdown auténtica (barras, una fila de encabezado y celdas alineadas), para que los números sigan siendo editables, comparables y buscables. Maneja páginas multicolumna, tablas que abarcan varias páginas, fórmulas y tablas en páginas escaneadas, sin nada que configurar.

Cómo

Convierte una tabla de PDF en 4 pasos

Sin cuenta. Se convierte todo el documento, tablas incluidas.

1

Abre el conversor

Instala la extensión de Chrome o abre la app web. Ambas funcionan de forma anónima.

2

Añade el PDF

Arrastra el archivo, elígelo del disco o pega una URL directa de PDF.

3

Espera el trabajo

El estado pasa por en cola, procesando, listo. Las columnas se reconstruyen en tablas Markdown alineadas.

4

Copia o descarga

Previsualiza el Markdown renderizado y el código fuente, luego copia la tabla o descarga un archivo .md.

Consejo: ¿solo necesitas las tablas de muchos archivos? Ejecuta la misma conversión desde la API REST o el MCP alojado y procesa las tablas Markdown en tu propio código.

Qué se conserva

Estructura conservada, no capturas

El conversor reconstruye la tabla que un PDF solo dibuja visualmente, así el resultado son datos que puedes usar.

Filas y encabezados alineados

Las columnas se convierten en celdas Markdown reales con una fila de encabezado, en vez de texto desalineado.

Orden multicolumna

Los diseños de dos y tres columnas se leen en el orden de lectura correcto, así las celdas quedan en su sitio.

Tablas multipágina

Una tabla que continúa en varias páginas se une en una sola tabla Markdown en lugar de partirse.

Fórmulas en las celdas

La notación matemática dentro o junto a una tabla se conserva en vez de degradarse a caracteres ilegibles.

Tablas escaneadas

Las tablas escaneadas y de solo imagen se procesan con OCR y se convierten en tablas Markdown seleccionables.

Elección de motor

MinerU es robusto con tablas densas y complejas; Docling es rápido con las limpias y sencillas.

Una tabla de una página vuelve como Markdown plano que puedes pegar en un documento, en un importador de hojas de cálculo o en un prompt para un LLM:

| Región | Unidades | Ingresos |
| ------ | -------- | -------- |
| Norte  |    1.240 | 312 K $  |
| Sur    |      980 | 244 K $  |
| EMEA   |    1.610 | 402 K $  |

Como es texto plano, la tabla va a cualquier sitio: pégala en Google Sheets o Excel, ponla en un documento Markdown, compárala en Git o pásala a un LLM como contexto limpio. Sin realineación manual, y los números siguen siendo editables en vez de quedar atrapados en una imagen.

Tablas complejas: las tablas densas con celdas combinadas o encabezados anidados, o las tablas giradas en la página, también se convierten pero pueden requerir una revisión visual rápida. Las cuadrículas sencillas quedan listas para usar.

Matemáticas y fórmulas

Las fórmulas sobreviven a la conversión

La mayoría de extractores de PDF convierten las ecuaciones en algo ininteligible. Aquí la notación matemática se conserva, así los documentos técnicos y científicos siguen siendo útiles.

Por qué importa

Una fórmula degradada es peor que inútil en un prompt o una base de conocimiento: los símbolos se mezclan y el significado se pierde. Conservar la notación significa que las ecuaciones junto a tus tablas, y los valores que producen, siguen siendo legibles para personas y modelos.

Bueno saberlo

Matemáticas en línea y en bloque dentro y alrededor de las tablas se conservan durante la conversión.
Las ecuaciones escaneadas pasan por OCR como el resto de la página.
Las matemáticas muy densas pueden requerir una revisión visual rápida, como con cualquier conversor.

¿Extraes tablas a escala?

El mismo conversor es una API REST y un endpoint MCP alojado. Convierte un PDF y procesa las tablas Markdown en tu propio código o desde un agente; consulta el tutorial de Python en el hub para desarrolladores.

Preguntas frecuentes

Preguntas habituales

¿Puede convertir tablas de PDF a Markdown?

Sí. Las columnas se reconstruyen en tablas Markdown reales y alineadas (barras y filas) en lugar de una captura o un amasijo de líneas, así los datos siguen siendo editables y buscables.

¿Las tablas multipágina y multicolumna se conservan intactas?

Sí. Los diseños multicolumna se leen en el orden correcto y una tabla que continúa entre páginas se une en una sola tabla Markdown. Las tablas muy complejas con celdas combinadas pueden requerir una limpieza ligera.

¿Se conservan las fórmulas?

Sí. La notación matemática se conserva en vez de degradarse a caracteres ilegibles, así las fórmulas dentro y alrededor de las tablas sobreviven a la conversión.

¿Y las tablas en PDF escaneados?

Las tablas escaneadas y de solo imagen se procesan con OCR y se convierten en tablas Markdown seleccionables. Consulta convertir PDF escaneados para el recorrido completo de OCR.

¿Puedo obtener las tablas mediante una API?

Sí. La API REST y el MCP alojado devuelven todo el Markdown, tablas incluidas, así puedes extraer tablas de forma programática o desde un agente.

¿Puedo abrir las tablas extraídas en Excel o Google Sheets?

Sí. Una tabla Markdown se pega limpiamente en una hoja de cálculo, o puedes convertir las barras en CSV en un par de líneas. Como las celdas son texto real, no una imagen, los datos son editables de inmediato.

¿Por qué se rompen las columnas al copiar y pegar una tabla de un PDF?

Un PDF guarda los caracteres por posición, no como una tabla, así que copiar y pegar pierde la estructura de columnas y todo colapsa en líneas desalineadas. Convertir a Markdown reconstruye las filas y columnas.

¿Es gratis?

Sí. Convierte de forma anónima en el navegador sin cuenta en el plan gratuito (3 espacios, archivos de 10 MB, presupuesto de tiempo de 15 minutos, retención de 1 hora). Los planes de pago amplían cada límite.