Benchmark PDF vers Markdown : vitesse et fiabilité
La plupart des « benchmarks » sont synthétiques. Celui-ci est réel : chaque chiffre ci-dessous provient de trafic de production sur une fenêtre de deux semaines, soit environ 2 940 conversions réelles. Aucun échantillon trié sur le volet, aucune condition de laboratoire.
Les chiffres
Trafic de production, du 2026-06-10 au 2026-06-24. Le temps de traitement est mesuré côté serveur ; il exclut tout temps passé en file d'attente.
99,8 %
taux de réussite de la conversion (5 échecs sur ~2 945 tentatives)
~2 940
documents réels convertis dans la fenêtre de 15 jours
~14 s
temps médian pour un PDF court (1 à 5 pages)
~4,8 s
par page, sur le moteur par défaut, toutes tailles confondues
Combien de temps prend une conversion
Le temps varie avec le nombre de pages, comme on peut s'y attendre. Voici les chiffres du moteur par défaut (le plus grand échantillon, 2 899 conversions). La médiane est le cas typique ; le 90e centile montre la traîne lente.
| Taille du document | Conversions | Temps médian | 90e centile |
|---|---|---|---|
| 1 à 5 pages | 975 | 14 s | 42 s |
| 6 à 20 pages | 959 | 56 s | 3,1 min |
| 21 à 50 pages | 508 | 2,4 min | 7,2 min |
| 51+ pages | 448 | 8,2 min | 16,3 min |
Un vrai éventail de documents : près de 1 000 fichiers courts, ~960 moyens et ~950 longs (21+ pages). Les chiffres ne sont pas biaisés par la conversion de documents faciles uniquement.
Ce qui se passe à grande échelle
Sur la fenêtre, la conversion a réussi 99,8 % du temps. La poignée d'échecs et de résultats partiels mérite d'être abordée en toute honnêteté.
5 échecs au total
Sur ~2 945 tentatives : quatre étaient des timeouts sur des documents très volumineux, un était un cas limite de sortie vide.
~4 % de résultats partiels
Les documents les plus longs peuvent atteindre un budget de temps flexible et renvoyer un partiel marqué plutôt que rien. Le reste est converti intégralement.
Quasiment aucune nouvelle tentative
Le moteur par défaut a affiché une moyenne de 0,005 nouvelle tentative par job : les conversions n'ont presque jamais eu besoin d'un second essai.
MinerU et Docling
Le service exécute deux moteurs open source. Ils montrent un compromis clair et attendu dans ces données.
MinerU – le cheval de trait
Le moteur par défaut et l'essentiel de l'échantillon (2 899 conversions, 99,8 % de réussite). Il traite les documents denses, multicolonnes et volumineux de façon robuste, à environ 4,8 secondes par page. Toutes les tranches de taille ci-dessus sont du MinerU.
Docling – plus léger et plus rapide
Sur les documents propres et plus petits, Docling est plus rapide, environ 2,6 secondes par page (médiane de 8,9 s pour 1 à 5 pages contre 14 s). Son échantillon ici est petit (41 conversions), nous le rapportons donc comme un signal de vitesse sur des fichiers propres, pas comme un verdict en tête-à-tête.
Comment cela a été mesuré, et ce que cela ne couvre pas
Ce que nous avons mesuré
Ce que cela ne couvre pas
Ce sont des chiffres du monde réel sur une infrastructure partagée, donc les temps absolus dépendent de la charge. Ils sont surtout utiles comme guide de la façon dont le temps de conversion varie avec la taille du document, et comme preuve que la conversion est fiable à grande échelle.
Essayez-le avec votre propre PDF
Les chiffres sont une chose ; votre document en est une autre. Convertissez-en un gratuitement dans le navigateur, ou pilotez la même conversion depuis l'API.
Questions fréquentes
Comment ce benchmark a-t-il été mesuré ?
Sur du trafic de production réel entre 2026-06-10 et 2026-06-24 : environ 2 940 conversions, chronométrées côté serveur comme ready moins début. La réussite signifie que le job a atteint l'état ready. C'est mesuré, pas un test synthétique.
Quel est le taux de réussite ?
99,8 %. Il y a eu 5 échecs sur environ 2 945 tentatives dans la fenêtre, les échecs étant des timeouts sur des documents très volumineux et un cas limite de sortie vide.
Combien de temps prend une conversion ?
Cela varie selon la taille du document. Le temps de traitement médian est d'environ 14 secondes pour 1 à 5 pages, 56 secondes pour 6 à 20 pages, 2,4 minutes pour 21 à 50 pages, et 8,2 minutes pour les documents de plus de 50 pages.
Le benchmark mesure-t-il la précision ?
Non. Ce benchmark couvre la vitesse et la fiabilité. La précision, c'est-à-dire la fidélité des tableaux, des formules et de l'OCR, nécessite une évaluation étiquetée distincte et fait l'objet d'un suivi ultérieur.
Quel moteur est le plus rapide ?
Docling est plus léger et plus rapide sur les documents propres et petits, à environ 2,6 secondes par page ; MinerU est le moteur par défaut et traite les documents denses, complexes et volumineux de façon robuste, à environ 4,8 secondes par page. L'échantillon de MinerU est bien plus grand, donc la vitesse de Docling est rapportée avec cette réserve. Consultez le comparatif des convertisseurs.
Que signifie un résultat partiel ?
Les documents très longs peuvent atteindre un budget de temps flexible et renvoyer un résultat partiel marqué ; environ 4 % des jobs dans cette fenêtre l'ont fait. Le reste a été converti intégralement.