PDF-zu-Markdown-Benchmark: Tempo und Stabilität
Die meisten "Benchmarks" sind synthetisch. Dieser ist echt: Jede Zahl unten stammt aus Produktionsverkehr über ein Zeitfenster von zwei Wochen, rund 2.940 tatsächliche Konvertierungen. Keine handverlesene Stichprobe, keine Laborbedingungen.
Die Zahlen
Produktionsverkehr, 2026-06-10 bis 2026-06-24. Die Verarbeitungszeit wird serverseitig gemessen; sie schließt jede Wartezeit in der Warteschlange aus.
99,8 %
Erfolgsquote der Konvertierung (5 Fehler bei ~2.945 Versuchen)
~2.940
echte Dokumente, konvertiert im 15-tägigen Zeitfenster
~14 s
mittlere Zeit für eine kurze PDF (1 bis 5 Seiten)
~4,8 s
pro Seite, auf der Standard-Engine, über alle Größen hinweg
Wie lange eine Konvertierung dauert
Die Zeit skaliert mit der Seitenzahl, wie zu erwarten. Das sind die Werte der Standard-Engine (die größte Stichprobe, 2.899 Konvertierungen). Der Median ist der typische Fall; das 90. Perzentil zeigt den langsamen Ausläufer.
| Dokumentgröße | Konvertierungen | Mittlere Zeit | 90. Perzentil |
|---|---|---|---|
| 1 bis 5 Seiten | 975 | 14 s | 42 s |
| 6 bis 20 Seiten | 959 | 56 s | 3,1 min |
| 21 bis 50 Seiten | 508 | 2,4 min | 7,2 min |
| 51+ Seiten | 448 | 8,2 min | 16,3 min |
Eine echte Mischung aus Dokumenten: fast 1.000 kurze Dateien, ~960 mittlere und ~950 lange (21+ Seiten). Die Zahlen sind nicht dadurch verzerrt, dass nur leichte Dokumente konvertiert wurden.
Was im großen Maßstab passiert
Über das Zeitfenster hinweg gelang die Konvertierung zu 99,8 % der Fälle. Über die Handvoll Fehler und Teilergebnisse lohnt es sich, ehrlich zu sein.
5 Fehler insgesamt
Von ~2.945 Versuchen: vier waren Timeouts bei sehr großen Dokumenten, einer war ein Sonderfall mit leerer Ausgabe.
~4 % Teilergebnisse
Die längsten Dokumente können ein weiches Zeitbudget erreichen und ein markiertes Teilergebnis statt gar nichts zurückgeben. Der Rest wird vollständig konvertiert.
Nahezu keine Wiederholungen
Die Standard-Engine kam im Schnitt auf 0,005 Wiederholungen pro Job: Konvertierungen brauchten fast nie einen zweiten Versuch.
MinerU und Docling
Der Dienst betreibt zwei Open-Source-Engines. Sie zeigen in diesen Daten einen klaren, erwartbaren Kompromiss.
MinerU – das Arbeitspferd
Die Standard-Engine und der Großteil der Stichprobe (2.899 Konvertierungen, 99,8 % Erfolg). Sie verarbeitet dichte, mehrspaltige und große Dokumente robust, mit etwa 4,8 Sekunden pro Seite. Jedes Größensegment oben ist MinerU.
Docling – leichter und schneller
Bei sauberen, kleineren Dokumenten ist Docling flotter, etwa 2,6 Sekunden pro Seite (8,9 s Median für 1 bis 5 Seiten gegenüber 14 s). Seine Stichprobe ist hier klein (41 Konvertierungen), daher melden wir es als Tempo-Signal bei sauberen Dateien, nicht als Direktvergleichs-Urteil.
Wie das gemessen wurde, und was es nicht abdeckt
Was wir gemessen haben
Was es nicht abdeckt
Das sind reale Zahlen auf geteilter Infrastruktur, daher hängen die absoluten Zeiten von der Last ab. Am nützlichsten sind sie als Anhaltspunkt dafür, wie die Konvertierungszeit mit der Dokumentgröße skaliert, und als Beleg, dass die Konvertierung im großen Maßstab stabil ist.
Probier es mit deiner eigenen PDF
Zahlen sind das eine; dein Dokument ist das andere. Konvertiere eines gratis im Browser, oder steuere dieselbe Konvertierung über die API.
Häufige Fragen
Wie wurde dieser Benchmark gemessen?
An echtem Produktionsverkehr zwischen 2026-06-10 und 2026-06-24: etwa 2.940 Konvertierungen, serverseitig als ready minus Start gemessen. Erfolg bedeutet, dass der Job den Zustand ready erreicht hat. Es ist gemessen, kein synthetischer Test.
Wie hoch ist die Erfolgsquote?
99,8 %. Es gab 5 Fehler von etwa 2.945 Versuchen im Zeitfenster; die Fehler waren Timeouts bei sehr großen Dokumenten und ein Sonderfall mit leerer Ausgabe.
Wie lange dauert eine Konvertierung?
Sie skaliert mit der Dokumentgröße. Die mittlere Verarbeitungszeit liegt bei etwa 14 Sekunden für 1 bis 5 Seiten, 56 Sekunden für 6 bis 20 Seiten, 2,4 Minuten für 21 bis 50 Seiten und 8,2 Minuten für Dokumente mit mehr als 50 Seiten.
Misst der Benchmark die Genauigkeit?
Nein. Dieser Benchmark deckt Tempo und Stabilität ab. Die Genauigkeit, also die Treue von Tabellen, Formeln und OCR, braucht eine separate gelabelte Auswertung und ist ein Folgeschritt.
Welche Engine ist schneller?
Docling ist leichter und schneller bei sauberen, kleinen Dokumenten, mit etwa 2,6 Sekunden pro Seite; MinerU ist die Standard-Engine und verarbeitet dichte, komplexe und große Dokumente robust, mit etwa 4,8 Sekunden pro Seite. Die MinerU-Stichprobe ist deutlich größer, daher wird Doclings Tempo mit diesem Vorbehalt angegeben. Sieh dir die Konverter-Übersicht an.
Was bedeutet ein Teilergebnis?
Sehr lange Dokumente können ein weiches Zeitbudget erreichen und ein markiertes Teilergebnis zurückgeben; etwa 4 % der Jobs in diesem Zeitfenster taten das. Der Rest wurde vollständig konvertiert.