Benchmark

Benchmark de PDF a Markdown: velocidad y fiabilidad

La mayoría de los "benchmarks" son sintéticos. Este es real: cada cifra de abajo proviene de tráfico de producción durante una ventana de dos semanas, unas 2.940 conversiones reales. Sin muestra escogida a dedo, sin condiciones de laboratorio.

De un vistazo

Las cifras

Tráfico de producción, del 2026-06-10 al 2026-06-24. El tiempo de procesamiento se mide del lado del servidor; excluye cualquier tiempo de espera en la cola.

99,8%

tasa de éxito de conversión (5 fallos en ~2.945 intentos)

~2.940

documentos reales convertidos en la ventana de 15 días

~14 s

tiempo mediano de un PDF corto (1 a 5 páginas)

~4,8 s

por página, en el motor predeterminado, en todos los tamaños

Velocidad por tamaño de documento

Cuánto tarda una conversión

El tiempo escala con el número de páginas, como cabría esperar. Estas son las cifras del motor predeterminado (la muestra mayor, 2.899 conversiones). La mediana es el caso típico; el percentil 90 muestra la cola lenta.

Tamaño del documento Conversiones Tiempo mediano Percentil 90
1 a 5 páginas97514 s42 s
6 a 20 páginas95956 s3,1 min
21 a 50 páginas5082,4 min7,2 min
51+ páginas4488,2 min16,3 min

Una mezcla real de documentos: casi 1.000 archivos cortos, ~960 medianos, y ~950 largos (21+ páginas). Las cifras no están sesgadas por convertir solo documentos fáciles.

Fiabilidad

Qué pasa a escala

Durante la ventana, la conversión tuvo éxito el 99,8% de las veces. Vale la pena ser honestos sobre el puñado de fallos y resultados parciales.

5 fallos en total

De ~2.945 intentos: cuatro fueron timeouts en documentos muy grandes, uno fue un caso límite de salida vacía.

~4% de resultados parciales

Los documentos más largos pueden alcanzar un presupuesto de tiempo flexible y devolver un parcial marcado en vez de nada. El resto se convierte por completo.

Reintentos casi nulos

El motor predeterminado promedió 0,005 reintentos por trabajo: las conversiones casi nunca necesitaron un segundo intento.

Dos motores

MinerU y Docling

El servicio ejecuta dos motores de código abierto. Muestran un compromiso claro y esperable en estos datos.

MinerU – el caballo de batalla

El motor predeterminado y la mayor parte de la muestra (2.899 conversiones, 99,8% de éxito). Maneja documentos densos, multicolumna y grandes de forma robusta, a unos 4,8 segundos por página. Todos los tramos de tamaño de arriba son MinerU.

Docling – más ligero y rápido

En documentos limpios y más pequeños, Docling es más veloz, unos 2,6 segundos por página (mediana de 8,9 s para 1 a 5 páginas frente a 14 s). Su muestra aquí es pequeña (41 conversiones), así que lo reportamos como una señal de velocidad en archivos limpios, no un veredicto frente a frente.

Metodología

Cómo se midió, y qué no cubre

Qué medimos

Ventana: del 2026-06-10 al 2026-06-24, todas las conversiones de producción.
Tiempo: procesamiento del lado del servidor (ready menos inicio), excluyendo la espera en cola.
Éxito: un trabajo que alcanzó el estado ready; los fallos son errores explícitos.

Qué no cubre

La precisión (fidelidad de tablas, fórmulas y OCR) necesita un conjunto de evaluación etiquetado; es un seguimiento aparte, no estimado aquí.
El coste por página no se mide: los motores funcionan sobre infraestructura compartida en vez de medición por página.

Estas son cifras del mundo real sobre infraestructura compartida, así que los tiempos absolutos dependen de la carga. Son más útiles como guía de cómo escala el tiempo de conversión con el tamaño del documento, y como evidencia de que la conversión es fiable a escala.

Pruébalo con tu propio PDF

Las cifras son una cosa; tu documento es otra. Convierte uno gratis en el navegador, o maneja la misma conversión desde la API.

Preguntas frecuentes

Preguntas habituales

¿Cómo se midió este benchmark?

Sobre tráfico real de producción entre 2026-06-10 y 2026-06-24: unas 2.940 conversiones, cronometradas del lado del servidor como ready menos inicio. Éxito significa que el trabajo alcanzó el estado ready. Es medido, no una prueba sintética.

¿Cuál es la tasa de éxito?

99,8%. Hubo 5 fallos de unos 2.945 intentos en la ventana, siendo los fallos timeouts en documentos muy grandes y un caso límite de salida vacía.

¿Cuánto tarda una conversión?

Escala con el tamaño del documento. El tiempo de procesamiento mediano es de unos 14 segundos para 1 a 5 páginas, 56 segundos para 6 a 20 páginas, 2,4 minutos para 21 a 50 páginas, y 8,2 minutos para documentos de más de 50 páginas.

¿El benchmark mide la precisión?

No. Este benchmark cubre velocidad y fiabilidad. La precisión, es decir la fidelidad de tablas, fórmulas y OCR, necesita una evaluación etiquetada aparte y es un seguimiento posterior.

¿Qué motor es más rápido?

Docling es más ligero y rápido en documentos limpios y pequeños, a unos 2,6 segundos por página; MinerU es el predeterminado y maneja documentos densos, complejos y grandes de forma robusta, a unos 4,8 segundos por página. La muestra de MinerU es mucho mayor, así que la velocidad de Docling se reporta con esa salvedad. Consulta el resumen de conversores.

¿Qué significa un resultado parcial?

Los documentos muy largos pueden alcanzar un presupuesto de tiempo flexible y devolver un resultado parcial marcado; aproximadamente el 4% de los trabajos en esta ventana lo hizo. El resto se convirtió por completo.