Benchmark de PDF para Markdown: velocidade e confiabilidade
A maioria dos "benchmarks" é sintética. Este é real: cada número abaixo vem de tráfego de produção ao longo de uma janela de duas semanas, cerca de 2.940 conversões de verdade. Sem amostra escolhida a dedo, sem condições de laboratório.
Os números
Tráfego de produção, de 2026-06-10 a 2026-06-24. O tempo de processamento é medido do lado do servidor; exclui qualquer tempo de espera na fila.
99,8%
taxa de sucesso da conversão (5 falhas em ~2.945 tentativas)
~2.940
documentos reais convertidos na janela de 15 dias
~14 s
tempo mediano de um PDF curto (1 a 5 páginas)
~4,8 s
por página, no motor padrão, em todos os tamanhos
Quanto tempo leva uma conversão
O tempo escala com o número de páginas, como era de se esperar. Estes são os números do motor padrão (a maior amostra, 2.899 conversões). A mediana é o caso típico; o percentil 90 mostra a cauda lenta.
| Tamanho do documento | Conversões | Tempo mediano | Percentil 90 |
|---|---|---|---|
| 1 a 5 páginas | 975 | 14 s | 42 s |
| 6 a 20 páginas | 959 | 56 s | 3,1 min |
| 21 a 50 páginas | 508 | 2,4 min | 7,2 min |
| 51+ páginas | 448 | 8,2 min | 16,3 min |
Uma mistura real de documentos: quase 1.000 arquivos curtos, ~960 médios, e ~950 longos (21+ páginas). Os números não estão enviesados por converter apenas documentos fáceis.
O que acontece em escala
Ao longo da janela, a conversão teve sucesso em 99,8% das vezes. Vale a pena ser honesto sobre o punhado de falhas e resultados parciais.
5 falhas no total
De ~2.945 tentativas: quatro foram timeouts em documentos muito grandes, uma foi um caso limite de saída vazia.
~4% de resultados parciais
Os documentos mais longos podem atingir um orçamento de tempo flexível e devolver um parcial marcado em vez de nada. O restante é convertido por completo.
Retentativas quase nulas
O motor padrão teve média de 0,005 retentativas por trabalho: as conversões quase nunca precisaram de uma segunda tentativa.
MinerU e Docling
O serviço roda dois motores de código aberto. Eles mostram um compromisso claro e esperado nesses dados.
MinerU – o cavalo de batalha
O motor padrão e a maior parte da amostra (2.899 conversões, 99,8% de sucesso). Lida com documentos densos, multicoluna e grandes de forma robusta, a cerca de 4,8 segundos por página. Todas as faixas de tamanho acima são do MinerU.
Docling – mais leve e rápido
Em documentos limpos e menores, o Docling é mais veloz, cerca de 2,6 segundos por página (mediana de 8,9 s para 1 a 5 páginas contra 14 s). Sua amostra aqui é pequena (41 conversões), então a reportamos como um sinal de velocidade em arquivos limpos, não um veredito direto.
Como isto foi medido, e o que não cobre
O que medimos
O que não cobre
Estes são números do mundo real sobre infraestrutura compartilhada, então os tempos absolutos dependem da carga. São mais úteis como um guia de como o tempo de conversão escala com o tamanho do documento, e como evidência de que a conversão é confiável em escala.
Teste com o seu próprio PDF
Os números são uma coisa; o seu documento é outra. Converta um de graça no navegador, ou conduza a mesma conversão pela API.
Perguntas comuns
Como este benchmark foi medido?
Sobre tráfego real de produção entre 2026-06-10 e 2026-06-24: cerca de 2.940 conversões, cronometradas do lado do servidor como ready menos início. Sucesso significa que o trabalho atingiu o estado ready. É medido, não um teste sintético.
Qual é a taxa de sucesso?
99,8%. Houve 5 falhas em cerca de 2.945 tentativas na janela, sendo as falhas timeouts em documentos muito grandes e um caso limite de saída vazia.
Quanto tempo leva uma conversão?
Escala com o tamanho do documento. O tempo de processamento mediano é de cerca de 14 segundos para 1 a 5 páginas, 56 segundos para 6 a 20 páginas, 2,4 minutos para 21 a 50 páginas, e 8,2 minutos para documentos com mais de 50 páginas.
O benchmark mede a precisão?
Não. Este benchmark cobre velocidade e confiabilidade. A precisão, ou seja a fidelidade de tabelas, fórmulas e OCR, precisa de uma avaliação rotulada à parte e é um trabalho posterior.
Qual motor é mais rápido?
Docling é mais leve e rápido em documentos limpos e pequenos, a cerca de 2,6 segundos por página; MinerU é o padrão e lida com documentos densos, complexos e grandes de forma robusta, a cerca de 4,8 segundos por página. A amostra do MinerU é bem maior, então a velocidade do Docling é reportada com essa ressalva. Veja o resumo de conversores.
O que significa um resultado parcial?
Documentos muito longos podem atingir um orçamento de tempo flexível e devolver um resultado parcial marcado; aproximadamente 4% dos trabalhos nesta janela fizeram isso. O restante foi convertido por completo.