Benchmark

Benchmark de PDF para Markdown: velocidade e confiabilidade

A maioria dos "benchmarks" é sintética. Este é real: cada número abaixo vem de tráfego de produção ao longo de uma janela de duas semanas, cerca de 2.940 conversões de verdade. Sem amostra escolhida a dedo, sem condições de laboratório.

De relance

Os números

Tráfego de produção, de 2026-06-10 a 2026-06-24. O tempo de processamento é medido do lado do servidor; exclui qualquer tempo de espera na fila.

99,8%

taxa de sucesso da conversão (5 falhas em ~2.945 tentativas)

~2.940

documentos reais convertidos na janela de 15 dias

~14 s

tempo mediano de um PDF curto (1 a 5 páginas)

~4,8 s

por página, no motor padrão, em todos os tamanhos

Velocidade por tamanho de documento

Quanto tempo leva uma conversão

O tempo escala com o número de páginas, como era de se esperar. Estes são os números do motor padrão (a maior amostra, 2.899 conversões). A mediana é o caso típico; o percentil 90 mostra a cauda lenta.

Tamanho do documento Conversões Tempo mediano Percentil 90
1 a 5 páginas97514 s42 s
6 a 20 páginas95956 s3,1 min
21 a 50 páginas5082,4 min7,2 min
51+ páginas4488,2 min16,3 min

Uma mistura real de documentos: quase 1.000 arquivos curtos, ~960 médios, e ~950 longos (21+ páginas). Os números não estão enviesados por converter apenas documentos fáceis.

Confiabilidade

O que acontece em escala

Ao longo da janela, a conversão teve sucesso em 99,8% das vezes. Vale a pena ser honesto sobre o punhado de falhas e resultados parciais.

5 falhas no total

De ~2.945 tentativas: quatro foram timeouts em documentos muito grandes, uma foi um caso limite de saída vazia.

~4% de resultados parciais

Os documentos mais longos podem atingir um orçamento de tempo flexível e devolver um parcial marcado em vez de nada. O restante é convertido por completo.

Retentativas quase nulas

O motor padrão teve média de 0,005 retentativas por trabalho: as conversões quase nunca precisaram de uma segunda tentativa.

Dois motores

MinerU e Docling

O serviço roda dois motores de código aberto. Eles mostram um compromisso claro e esperado nesses dados.

MinerU – o cavalo de batalha

O motor padrão e a maior parte da amostra (2.899 conversões, 99,8% de sucesso). Lida com documentos densos, multicoluna e grandes de forma robusta, a cerca de 4,8 segundos por página. Todas as faixas de tamanho acima são do MinerU.

Docling – mais leve e rápido

Em documentos limpos e menores, o Docling é mais veloz, cerca de 2,6 segundos por página (mediana de 8,9 s para 1 a 5 páginas contra 14 s). Sua amostra aqui é pequena (41 conversões), então a reportamos como um sinal de velocidade em arquivos limpos, não um veredito direto.

Metodologia

Como isto foi medido, e o que não cobre

O que medimos

Janela: de 2026-06-10 a 2026-06-24, todas as conversões de produção.
Tempo: processamento do lado do servidor (ready menos início), excluindo a espera na fila.
Sucesso: um trabalho que atingiu o estado ready; as falhas são erros explícitos.

O que não cobre

A precisão (fidelidade de tabelas, fórmulas e OCR) precisa de um conjunto de avaliação rotulado; é um trabalho à parte, não estimado aqui.
O custo por página não é medido: os motores rodam sobre infraestrutura compartilhada em vez de medição por página.

Estes são números do mundo real sobre infraestrutura compartilhada, então os tempos absolutos dependem da carga. São mais úteis como um guia de como o tempo de conversão escala com o tamanho do documento, e como evidência de que a conversão é confiável em escala.

Teste com o seu próprio PDF

Os números são uma coisa; o seu documento é outra. Converta um de graça no navegador, ou conduza a mesma conversão pela API.

Perguntas frequentes

Perguntas comuns

Como este benchmark foi medido?

Sobre tráfego real de produção entre 2026-06-10 e 2026-06-24: cerca de 2.940 conversões, cronometradas do lado do servidor como ready menos início. Sucesso significa que o trabalho atingiu o estado ready. É medido, não um teste sintético.

Qual é a taxa de sucesso?

99,8%. Houve 5 falhas em cerca de 2.945 tentativas na janela, sendo as falhas timeouts em documentos muito grandes e um caso limite de saída vazia.

Quanto tempo leva uma conversão?

Escala com o tamanho do documento. O tempo de processamento mediano é de cerca de 14 segundos para 1 a 5 páginas, 56 segundos para 6 a 20 páginas, 2,4 minutos para 21 a 50 páginas, e 8,2 minutos para documentos com mais de 50 páginas.

O benchmark mede a precisão?

Não. Este benchmark cobre velocidade e confiabilidade. A precisão, ou seja a fidelidade de tabelas, fórmulas e OCR, precisa de uma avaliação rotulada à parte e é um trabalho posterior.

Qual motor é mais rápido?

Docling é mais leve e rápido em documentos limpos e pequenos, a cerca de 2,6 segundos por página; MinerU é o padrão e lida com documentos densos, complexos e grandes de forma robusta, a cerca de 4,8 segundos por página. A amostra do MinerU é bem maior, então a velocidade do Docling é reportada com essa ressalva. Veja o resumo de conversores.

O que significa um resultado parcial?

Documentos muito longos podem atingir um orçamento de tempo flexível e devolver um resultado parcial marcado; aproximadamente 4% dos trabalhos nesta janela fizeram isso. O restante foi convertido por completo.