Convertir factura PDF a Markdown
Las facturas son sobre todo una tabla de líneas más unos pocos campos de cabecera. Conviértelas a Markdown limpio, con la tabla de líneas reconstruida y los recibos escaneados o fotografiados con OCR, listos para procesar o pasar a un LLM.
Una tabla limpia que de verdad puedes usar
Copiar una factura de un PDF suele revolver las líneas en texto desalineado, y un recibo escaneado es solo una imagen. Convertir a Markdown arregla ambas cosas: la cuadrícula de líneas se reconstruye en una tabla Markdown real y alineada, y el OCR convierte un escaneo o una foto de móvil en texto seleccionable. Los campos de cabecera (proveedor, número de factura, fechas y totales) también se conservan como texto. El resultado no es una exportación rígida campo por campo; es Markdown limpio que es trivial de procesar, o de pasar a un LLM que extraiga exactamente los campos que necesitas.
Convierte una factura en 4 pasos
Sin cuenta. Funciona con facturas digitales y recibos escaneados o fotografiados.
Abre el conversor
Instala la extensión de Chrome o abre la app web.
Añade la factura
Arrastra el PDF, elígelo del disco o pega una URL. También funcionan los recibos escaneados y fotografiados.
Espera el trabajo
El estado pasa por en cola, procesando, listo. Las líneas se convierten en una tabla Markdown y el texto de imagen pasa por OCR.
Copia, descarga o procesa
Copia el Markdown, descarga un archivo .md, o pásalo a un LLM para extraer el proveedor, los totales y las líneas.
De una factura PDF a texto procesable
Líneas alineadas
Descripción, cantidad, precio unitario e importe se reconstruyen en una tabla Markdown real, no texto desalineado.
Recibos escaneados
Una foto de móvil o un recibo escaneado pasa por OCR a Markdown editable.
Fácil de procesar
El Markdown limpio es sencillo de leer con un script, o de pasar a un LLM para extraer campos.
Muchas a la vez
Convierte una carpeta de facturas con el flujo por lotes para contabilidad o un pipeline.
¿Necesitas campos concretos como JSON? Esta herramienta te da Markdown limpio, que es el primer paso fiable. Pasa ese Markdown a un LLM con un prompt corto, y extraer el total, la fecha de vencimiento o el impuesto se vuelve simple y consistente.
De factura a campos, en dos pasos
Primero el PDF se convierte en Markdown estructurado; luego un prompt corto lo convierte en exactamente los campos que necesitas.
Paso 1. El conversor reconstruye la cabecera y la cuadrícula de líneas como Markdown limpio:
# Factura INV-2048 Acme Supplies Ltd · Emitida 2026-05-12 · Vence 2026-06-11 | Descripción | Cant. | Precio unit. | Importe | | ------------------ | ----- | ------------ | ------- | | Papel A4 Standis | 12 | 4,50 $ | 54,00 $ | | Tóner XL | 2 | 89,00 $ | 178,00 $| | Envío | 1 | 15,00 $ | 15,00 $ | Subtotal 247,00 $ · Impuesto (10%) 24,70 $ · **Total 271,70 $**
Paso 2. Como los datos ya son texto limpio, un LLM extrae los campos de forma fiable con un prompt de una línea:
Extrae invoice_number, vendor, issue_date, due_date, total y las line_items (description, qty, unit_price, amount) como JSON del Markdown de factura de abajo.
Hacerlo en dos pasos es lo que hace fiable el resultado. Pedirle a un modelo que lea un PDF en bruto a menudo pierde o malinterpreta celdas; darle una tabla Markdown alineada elimina las conjeturas de maquetación, así los totales y las cantidades salen bien. El mismo patrón funciona con recibos, órdenes de compra y extractos.
Preguntas habituales
¿Puedo convertir una factura o recibo PDF a Markdown?
Sí. Las líneas se convierten en una tabla Markdown real y el texto de cabecera (proveedor, fechas, totales) se conserva como texto, incluido para recibos escaneados o fotografiados mediante OCR.
¿Extrae los campos de la factura como datos estructurados?
Produce Markdown limpio, no un JSON fijo de campos. Ese Markdown es fácil de procesar, o puedes pasarlo a un LLM para extraer de forma fiable el proveedor, el total y las líneas.
¿Y un recibo escaneado o fotografiado?
El OCR convierte la imagen en Markdown seleccionable, así una foto de móvil o un escaneo de un recibo se vuelve texto y tabla editables en vez de una imagen. Consulta PDF escaneado a Markdown.
¿Las líneas quedan alineadas?
Sí. Columnas como descripción, cantidad, precio unitario e importe se reconstruyen en una tabla Markdown alineada en vez de colapsar en un amasijo de texto.
¿Puedo procesar muchas facturas a la vez?
Sí. Usa el flujo por lotes sobre la API para convertir una carpeta entera de facturas a Markdown para tu contabilidad o un pipeline de LLM.
¿Es gratis?
Sí. Convierte de forma anónima en el navegador sin cuenta en el plan gratuito (3 espacios, archivos de 10 MB, presupuesto de tiempo de 15 minutos, retención de 1 hora). Los planes de pago amplían cada límite.