PDF a Markdown vs Marker
Marker es una excelente librería de código abierto que alojas tú. pdf2md.dev es un servicio alojado que convierte un PDF en segundos sin instalar nada y sin GPU: en el navegador, por API REST o desde un MCP alojado. Aquí tienes una comparación honesta lado a lado para que elijas la adecuada.
Aloja Marker tú, o deja que pdf2md.dev lo aloje por ti
Elige Marker cuando quieras ejecutar la conversión en tus propias máquinas: es de código abierto, alcanza una precisión casi perfecta en documentos desordenados con su opción --use_llm, y lee muchos formatos de entrada (PDF, DOCX, PPTX, XLSX, EPUB). Está pensado para GPU y tú operas el stack. Elige pdf2md.dev cuando quieras el resultado ahora sin nada que configurar: conversión anónima y gratis en el navegador, OCR integrado, tablas Markdown reales y fórmulas, y una API REST más un MCP alojado para agentes, sin Python, sin GPU, sin cuenta.
pdf2md.dev vs Marker, característica por característica
Ambos producen Markdown limpio con tablas, fórmulas y OCR. La diferencia real es alojado-por-ti frente a self-hosted.
| pdf2md.dev | Marker | |
|---|---|---|
| Configuración | Nada que instalar – navegador, API REST o MCP alojado | pip install marker-pdf + un entorno de Python |
| Hardware | Ninguno – lo alojamos nosotros; sin GPU | Corre en CPU/MPS, pero pensado para GPU (rápido por lotes en una H100) |
| Coste | Plan gratuito anónimo; los de pago amplían límites | Gratis de self-host bajo la licencia; pagas GPU + operaciones. La API de Datalab es de pago |
| Cuenta | Ninguna para convertir | Ninguna para self-host; una clave de API para la API alojada de Datalab |
| OCR de PDF escaneados | Integrado, muchos idiomas, sin opciones | Sí, vía Surya OCR cuando lo alojas tú |
| Tablas y fórmulas | Sí – tablas Markdown reales, matemáticas conservadas | Sí – tablas, ecuaciones y matemáticas en línea |
| Formatos de entrada | PDF e imágenes, por subida o URL | PDF, imagen, DOCX, PPTX, XLSX, HTML, EPUB |
| Modo de máxima precisión | Elige el motor – MinerU (denso) o Docling (limpio, rápido) | --use_llm opcional para salida casi perfecta en páginas desordenadas |
| Automatización | API REST + MCP alojado para agentes | Librería de Python; API de Datalab de pago opcional |
| Licencia | SaaS alojado; tus archivos no se usan para entrenar modelos | Código GPL; pesos Open Rail-M (gratis con <2M$ ingresos/financiación, no compete) |
Detalles de Marker de su documentación pública del proyecto; los límites de pdf2md.dev son los valores actuales del plan gratuito. Ambos proyectos evolucionan – consulta cada fuente para lo más reciente.
¿Más opciones? Consulta el resumen completo de los mejores conversores de PDF a Markdown para ver todo el panorama de un vistazo.
Cuándo Marker es la mejor opción
Marker es una herramienta genuinamente fuerte. Recúrrela cuando encajen estas cosas.
Totalmente self-hosted
Necesitas que la conversión corra enteramente en tus propias máquinas, offline o on-premise, sin ningún servicio externo en el camino.
Muchos formatos de entrada
Conviertes DOCX, PPTX, XLSX, HTML o EPUB además de PDF, y quieres una sola herramienta para todos.
Precisión potenciada por LLM
Quieres salida casi perfecta en maquetaciones desordenadas con la opción --use_llm y tienes la GPU y el MLOps para ejecutarlo.
Cuándo encaja mejor pdf2md.dev
La vía alojada elimina la configuración, la GPU y la cuenta.
Resultado en segundos
Suelta un PDF y obtén Markdown limpio sin nada que instalar: ni Python, ni GPU, ni cuenta.
API + MCP alojado
Llama a la misma conversión desde tu código o un pipeline de agente sin gestionar ninguna infraestructura.
OCR y tablas integrados
Los PDF escaneados, las tablas y las fórmulas se manejan de serie, sin opciones que ajustar.
Uso ocasional o gratis
Convierte de forma anónima en el navegador en el plan gratuito en vez de montar una máquina con GPU para unos pocos archivos.
Elección de motor
Cambia entre MinerU y Docling por documento en vez de ajustar un solo pipeline tú mismo.
Sin entrenar con tus archivos
Los archivos se convierten y se descartan en una ventana de retención corta; no se usan para entrenar modelos.
¿Conviertes a escala o desde un agente?
pdf2md.dev es una API REST y un endpoint MCP alojado además de una app web. Convierte un PDF y procesa Markdown limpio desde tu propio código o un agente de IA, sin una máquina con GPU que ejecutar. Consulta el tutorial de Python en el hub para desarrolladores.
Preguntas habituales
¿pdf2md.dev es un reemplazo directo de Marker?
Son formas distintas. Marker es una librería de Python self-hosted que ejecutas tú mismo; pdf2md.dev es un servicio alojado al que llegas desde el navegador, una API REST o un MCP alojado sin nada que instalar. Elige según si quieres alojar la conversión tú o que te la alojen.
¿Marker es gratis?
El código de Marker es de código abierto bajo GPL y los pesos de su modelo usan una licencia Open Rail-M modificada que es gratuita para investigación, uso personal y organizaciones con menos de 2M$ de financiación o ingresos que no compiten con la API de Datalab. Aun así pagas la GPU, el cómputo y las operaciones para ejecutarlo. Datalab también ofrece una API alojada de pago.
¿pdf2md.dev necesita GPU?
No. Nosotros alojamos la conversión, así no necesitas nada en local: ni GPU, ni Python, ni instalación. Marker corre en CPU pero está pensado para GPU y es mucho más rápido en una.
¿Cuál es más preciso?
Ambos son fuertes. Marker puede acercarse a una salida casi perfecta en maquetaciones desordenadas con su opción --use_llm. pdf2md.dev te deja elegir el motor (MinerU para páginas densas y complejas; Docling para limpias y rápidas) y maneja OCR, tablas y fórmulas sin opciones que ajustar.
¿Puedo llamar a cualquiera desde código o un agente?
pdf2md.dev expone una API REST y un endpoint MCP alojado, así un agente puede convertir un PDF sin ninguna configuración. Marker es una librería de Python que importas en tu propio código, con una API de Datalab de pago opcional.
¿Y los PDF escaneados?
Ambos hacen OCR de PDF escaneados y de solo imagen. Marker usa Surya OCR cuando lo alojas tú. En pdf2md.dev el OCR está integrado en muchos idiomas sin opciones que poner – consulta convertir PDF escaneados.
¿pdf2md.dev es de verdad gratis y sin registro?
Sí. Convierte de forma anónima en el navegador en el plan gratuito (3 espacios, archivos de 10 MB, un presupuesto de tiempo de 15 minutos, retención de 1 hora). Los planes de pago amplían cada límite.