Convertir une facture PDF en Markdown
Les factures sont surtout un tableau de lignes plus quelques champs d'en-tête. Convertissez-les en Markdown propre, avec le tableau de lignes reconstruit et les reçus numérisés ou photographiés passés à l'OCR, prêts à analyser ou à passer à un LLM.
Un tableau propre que vous pouvez vraiment exploiter
Copier une facture depuis un PDF mélange en général les lignes en un texte désaligné, et un reçu numérisé n'est qu'une image. La conversion en Markdown corrige les deux : la grille de lignes est reconstruite en un véritable tableau Markdown aligné, et l'OCR transforme un scan ou une photo de téléphone en texte sélectionnable. Les champs d'en-tête (fournisseur, numéro de facture, dates et totaux) sont eux aussi conservés en tant que texte. Le résultat n'est pas un export rigide champ par champ : c'est du Markdown propre, trivial à analyser ou à passer à un LLM qui en extrait exactement les champs dont vous avez besoin.
Convertissez une facture en 4 étapes
Sans compte. Fonctionne avec les factures numériques et les reçus numérisés ou photographiés.
Ouvrez le convertisseur
Installez l'extension Chrome ou ouvrez l'app web.
Ajoutez la facture
Glissez le PDF, choisissez-le depuis le disque ou collez une URL. Les reçus numérisés et photographiés fonctionnent aussi.
Attendez le traitement
Le statut passe par en file, en cours, prêt. Les lignes deviennent un tableau Markdown et le texte d'image est passé à l'OCR.
Copiez, téléchargez ou analysez
Copiez le Markdown, téléchargez un fichier .md, ou passez-le à un LLM pour extraire le fournisseur, les totaux et les lignes.
D'une facture PDF à un texte analysable
Lignes alignées
Description, quantité, prix unitaire et montant sont reconstruits en un véritable tableau Markdown, pas du texte désaligné.
Reçus numérisés
Une photo de téléphone ou un reçu numérisé est passé à l'OCR vers du Markdown modifiable.
Facile à analyser
Le Markdown propre est simple à lire avec un script, ou à passer à un LLM pour extraire des champs.
Beaucoup à la fois
Convertissez un dossier de factures avec la conversion par lots pour la comptabilité ou un pipeline.
Besoin de champs précis en JSON ? Cet outil vous donne du Markdown propre, qui est la première étape fiable. Passez ce Markdown à un LLM avec un prompt court, et extraire le total, la date d'échéance ou la taxe devient simple et cohérent.
De la facture aux champs, en deux étapes
D'abord le PDF devient du Markdown structuré ; ensuite un prompt court le transforme en exactement les champs dont vous avez besoin.
Étape 1. Le convertisseur reconstruit l'en-tête et la grille de lignes en Markdown propre :
# Facture INV-2048 Acme Supplies Ltd · Émise 2026-05-12 · Échéance 2026-06-11 | Description | Qté | Prix unit. | Montant | | ------------------ | --- | ---------- | ------- | | Papier A4 Standis | 12 | 4,50 $ | 54,00 $ | | Toner XL | 2 | 89,00 $ | 178,00 $| | Livraison | 1 | 15,00 $ | 15,00 $ | Sous-total 247,00 $ · Taxe (10%) 24,70 $ · **Total 271,70 $**
Étape 2. Comme les données sont déjà du texte propre, un LLM extrait les champs de façon fiable à partir d'un prompt d'une ligne :
Extract invoice_number, vendor, issue_date, due_date, total and the line_items (description, qty, unit_price, amount) as JSON from the invoice Markdown below.
Procéder en deux étapes est ce qui rend le résultat fiable. Demander à un modèle de lire un PDF brut perd ou mal interprète souvent des cellules ; lui donner un tableau Markdown aligné élimine les conjectures de mise en page, ainsi les totaux et les quantités ressortent justes. Le même schéma fonctionne avec les reçus, les bons de commande et les relevés.
Questions fréquentes
Puis-je convertir une facture ou un reçu PDF en Markdown ?
Oui. Les lignes deviennent un véritable tableau Markdown et le texte d'en-tête (fournisseur, dates, totaux) est conservé en tant que texte, y compris pour les reçus numérisés ou photographiés grâce à l'OCR.
Extrait-il les champs de la facture sous forme de données structurées ?
Il produit du Markdown propre, pas un JSON figé de champs. Ce Markdown est facile à analyser, ou vous pouvez le passer à un LLM pour extraire de façon fiable le fournisseur, le total et les lignes.
Et un reçu numérisé ou photographié ?
L'OCR convertit l'image en Markdown sélectionnable, ainsi une photo de téléphone ou un scan d'un reçu devient du texte et un tableau modifiables plutôt qu'une image. Voir PDF numérisé en Markdown.
Les lignes restent-elles alignées ?
Oui. Des colonnes comme description, quantité, prix unitaire et montant sont reconstruites en un tableau Markdown aligné plutôt que de s'effondrer en un fouillis de texte.
Puis-je traiter de nombreuses factures à la fois ?
Oui. Utilisez la conversion par lots via l'API pour convertir un dossier entier de factures en Markdown pour votre comptabilité ou un pipeline de LLM.
Est-ce gratuit ?
Oui. Convertissez de façon anonyme dans le navigateur sur l'offre gratuite (3 emplacements, fichiers de 10 Mo, budget de temps de 15 minutes, conservation d'1 heure). Les offres payantes augmentent chaque limite.