Benchmark

PDF-zu-Markdown-Benchmark: Tempo und Stabilität

Die meisten "Benchmarks" sind synthetisch. Dieser ist echt: Jede Zahl unten stammt aus Produktionsverkehr über ein Zeitfenster von zwei Wochen, rund 2.940 tatsächliche Konvertierungen. Keine handverlesene Stichprobe, keine Laborbedingungen.

Auf einen Blick

Die Zahlen

Produktionsverkehr, 2026-06-10 bis 2026-06-24. Die Verarbeitungszeit wird serverseitig gemessen; sie schließt jede Wartezeit in der Warteschlange aus.

99,8 %

Erfolgsquote der Konvertierung (5 Fehler bei ~2.945 Versuchen)

~2.940

echte Dokumente, konvertiert im 15-tägigen Zeitfenster

~14 s

mittlere Zeit für eine kurze PDF (1 bis 5 Seiten)

~4,8 s

pro Seite, auf der Standard-Engine, über alle Größen hinweg

Tempo nach Dokumentgröße

Wie lange eine Konvertierung dauert

Die Zeit skaliert mit der Seitenzahl, wie zu erwarten. Das sind die Werte der Standard-Engine (die größte Stichprobe, 2.899 Konvertierungen). Der Median ist der typische Fall; das 90. Perzentil zeigt den langsamen Ausläufer.

Dokumentgröße Konvertierungen Mittlere Zeit 90. Perzentil
1 bis 5 Seiten97514 s42 s
6 bis 20 Seiten95956 s3,1 min
21 bis 50 Seiten5082,4 min7,2 min
51+ Seiten4488,2 min16,3 min

Eine echte Mischung aus Dokumenten: fast 1.000 kurze Dateien, ~960 mittlere und ~950 lange (21+ Seiten). Die Zahlen sind nicht dadurch verzerrt, dass nur leichte Dokumente konvertiert wurden.

Stabilität

Was im großen Maßstab passiert

Über das Zeitfenster hinweg gelang die Konvertierung zu 99,8 % der Fälle. Über die Handvoll Fehler und Teilergebnisse lohnt es sich, ehrlich zu sein.

5 Fehler insgesamt

Von ~2.945 Versuchen: vier waren Timeouts bei sehr großen Dokumenten, einer war ein Sonderfall mit leerer Ausgabe.

~4 % Teilergebnisse

Die längsten Dokumente können ein weiches Zeitbudget erreichen und ein markiertes Teilergebnis statt gar nichts zurückgeben. Der Rest wird vollständig konvertiert.

Nahezu keine Wiederholungen

Die Standard-Engine kam im Schnitt auf 0,005 Wiederholungen pro Job: Konvertierungen brauchten fast nie einen zweiten Versuch.

Zwei Engines

MinerU und Docling

Der Dienst betreibt zwei Open-Source-Engines. Sie zeigen in diesen Daten einen klaren, erwartbaren Kompromiss.

MinerU – das Arbeitspferd

Die Standard-Engine und der Großteil der Stichprobe (2.899 Konvertierungen, 99,8 % Erfolg). Sie verarbeitet dichte, mehrspaltige und große Dokumente robust, mit etwa 4,8 Sekunden pro Seite. Jedes Größensegment oben ist MinerU.

Docling – leichter und schneller

Bei sauberen, kleineren Dokumenten ist Docling flotter, etwa 2,6 Sekunden pro Seite (8,9 s Median für 1 bis 5 Seiten gegenüber 14 s). Seine Stichprobe ist hier klein (41 Konvertierungen), daher melden wir es als Tempo-Signal bei sauberen Dateien, nicht als Direktvergleichs-Urteil.

Methodik

Wie das gemessen wurde, und was es nicht abdeckt

Was wir gemessen haben

Zeitfenster: 2026-06-10 bis 2026-06-24, alle Produktionskonvertierungen.
Zeit: serverseitige Verarbeitung (ready minus Start), ohne Wartezeit in der Warteschlange.
Erfolg: ein Job, der den Zustand ready erreicht hat; Fehler sind ausdrückliche Fehlermeldungen.

Was es nicht abdeckt

Die Genauigkeit (Treue von Tabellen, Formeln und OCR) braucht einen gelabelten Auswertungssatz; sie ist ein separater Folgeschritt, hier nicht geschätzt.
Die Kosten pro Seite werden nicht gebenchmarkt: Die Engines laufen auf geteilter Infrastruktur statt mit Abrechnung pro Seite.

Das sind reale Zahlen auf geteilter Infrastruktur, daher hängen die absoluten Zeiten von der Last ab. Am nützlichsten sind sie als Anhaltspunkt dafür, wie die Konvertierungszeit mit der Dokumentgröße skaliert, und als Beleg, dass die Konvertierung im großen Maßstab stabil ist.

Probier es mit deiner eigenen PDF

Zahlen sind das eine; dein Dokument ist das andere. Konvertiere eines gratis im Browser, oder steuere dieselbe Konvertierung über die API.

FAQ

Häufige Fragen

Wie wurde dieser Benchmark gemessen?

An echtem Produktionsverkehr zwischen 2026-06-10 und 2026-06-24: etwa 2.940 Konvertierungen, serverseitig als ready minus Start gemessen. Erfolg bedeutet, dass der Job den Zustand ready erreicht hat. Es ist gemessen, kein synthetischer Test.

Wie hoch ist die Erfolgsquote?

99,8 %. Es gab 5 Fehler von etwa 2.945 Versuchen im Zeitfenster; die Fehler waren Timeouts bei sehr großen Dokumenten und ein Sonderfall mit leerer Ausgabe.

Wie lange dauert eine Konvertierung?

Sie skaliert mit der Dokumentgröße. Die mittlere Verarbeitungszeit liegt bei etwa 14 Sekunden für 1 bis 5 Seiten, 56 Sekunden für 6 bis 20 Seiten, 2,4 Minuten für 21 bis 50 Seiten und 8,2 Minuten für Dokumente mit mehr als 50 Seiten.

Misst der Benchmark die Genauigkeit?

Nein. Dieser Benchmark deckt Tempo und Stabilität ab. Die Genauigkeit, also die Treue von Tabellen, Formeln und OCR, braucht eine separate gelabelte Auswertung und ist ein Folgeschritt.

Welche Engine ist schneller?

Docling ist leichter und schneller bei sauberen, kleinen Dokumenten, mit etwa 2,6 Sekunden pro Seite; MinerU ist die Standard-Engine und verarbeitet dichte, komplexe und große Dokumente robust, mit etwa 4,8 Sekunden pro Seite. Die MinerU-Stichprobe ist deutlich größer, daher wird Doclings Tempo mit diesem Vorbehalt angegeben. Sieh dir die Konverter-Übersicht an.

Was bedeutet ein Teilergebnis?

Sehr lange Dokumente können ein weiches Zeitbudget erreichen und ein markiertes Teilergebnis zurückgeben; etwa 4 % der Jobs in diesem Zeitfenster taten das. Der Rest wurde vollständig konvertiert.