Images et figures

Extraire les images d'un PDF vers Markdown

Les diagrammes, captures d'écran et figures font partie du document. Lorsque vous convertissez un PDF vers Markdown ici, les images suivent : intégrées en ligne pour s'afficher partout, ou conservées en marqueurs légers quand vous n'avez besoin que du texte.

Réponse courte

Les figures voyagent avec le texte

Un PDF mêle texte et images sur chaque page. Le convertisseur extrait les deux : la prose devient du Markdown propre et chaque figure est reportée en tant qu'image. Vous choisissez comment, avec un mode image. Intégrer écrit les images en ligne (par exemple en base64), si bien qu'un seul fichier Markdown se rend complet dans n'importe quel lecteur. Marqueur garde le fichier léger et indique seulement où va chaque image, idéal quand c'est le texte qu'il vous faut. Tout mot présent dans une image, comme un diagramme étiqueté, est capté par l'OCR.

Comment faire

Convertir un PDF riche en images

Aucun compte requis. Choisissez le mode image selon la destination du Markdown.

1

Ouvrez le convertisseur

Installez l'extension Chrome ou ouvrez l'application web.

2

Choisissez intégrer ou marqueur

Dans les paramètres, décidez si les images sont intégrées en ligne ou conservées en marqueurs. Intégrer pour un fichier autonome, marqueur pour le texte le plus léger.

3

Ajoutez le PDF et attendez

Glissez le fichier ou collez une URL. Le statut passe par en file, en cours, prêt. Les figures sont conservées et le texte de la page passe par l'OCR.

4

Copiez ou téléchargez

Prévisualisez le Markdown rendu avec les images, puis copiez-le ou téléchargez un fichier .md.

Quel mode

Intégrer ou marqueur

Le bon choix dépend de si vous voulez un document complet ou seulement les mots.

Intégrer en ligne

Markdown autonome qui se rend complet dans n'importe quel lecteur, avec les figures à leur place.
Idéal pour les notes, documents et tout ce que vous lisez en Markdown, comme un import dans Obsidian ou Notion.

Marqueurs

Sortie légère qui garde le fichier petit et le texte facile à comparer.
Idéal pour alimenter un LLM ou un pipeline RAG en texte, là où les images ne sont pas l'essentiel.
Dans le Markdown

Ce que produit chaque mode

Les deux modes utilisent la même structure de document ; ils ne diffèrent que par la façon dont chaque figure est écrite.

Avec intégrer, une figure est écrite en ligne comme une image Markdown standard, si bien qu'un seul fichier .md est totalement autonome et affiche l'image partout :

## Figure 2. Architecture du système

![Figure 2. Architecture du système](data:image/png;base64,iVBORw0KGgo...)

La requête circule du client vers l'API facade puis vers le worker.

Avec marqueur, le même endroit reçoit une marque légère au lieu des octets de l'image, gardant le fichier petit et facile à comparer tout en enregistrant où va la figure :

## Figure 2. Architecture du système

[image : Figure 2. Architecture du système]

La requête circule du client vers l'API facade puis vers le worker.

À propos de la taille : intégrer une image en ligne (en base64) peut multiplier plusieurs fois la taille du fichier Markdown pour un PDF riche en images, ce qui est parfait pour un document portable mais lourd pour un prompt de LLM. Si vous alimentez le texte vers un modèle ou un index de recherche, les marqueurs réduisent le nombre de tokens tout en conservant les légendes et les titres qui portent le sens.

FAQ

Questions fréquentes

Conserve-t-il les images et figures d'un PDF ?

Oui. Les figures et images sont reportées dans le Markdown, soit intégrées en ligne (par exemple en base64), soit en marqueur de référence, selon le mode image que vous choisissez.

Comment les images sont-elles intégrées dans le Markdown ?

Les images en ligne utilisent la syntaxe standard des images Markdown, elles s'affichent donc dans n'importe quel lecteur Markdown. Un marqueur, en revanche, garde le fichier plus léger et indique où va l'image.

Puis-je désactiver l'intégration des images ?

Oui. Un paramètre de mode image vous permet d'intégrer les images ou d'utiliser des marqueurs, afin de garder le Markdown léger quand vous n'avez besoin que du texte.

Et une page entièrement numérisée, en image seule ?

Le texte de la page passe par l'OCR vers le Markdown. Lorsqu'une page est essentiellement une image sans texte récupérable, elle peut être conservée en image de page pour que rien ne soit perdu. Voir PDF numérisé vers Markdown.

Les diagrammes et graphiques sont-ils convertis en données ?

Les images restent des images ; les légendes, étiquettes et tout texte lisible autour sont convertis en Markdown. Un graphique n'est pas reconverti en ses chiffres sous-jacents.

Est-ce gratuit ?

Oui. Convertissez de façon anonyme dans le navigateur avec l'offre gratuite (3 emplacements, fichiers de 10 Mo, budget de temps de 15 minutes, conservation d'1 heure). Les offres payantes augmentent chaque limite.