Tabellen aus PDF in Markdown extrahieren
Hol echte, ausgerichtete Markdown-Tabellen aus einem PDF – keinen Screenshot und kein Durcheinander aus Zeilen. Mehrspaltige und mehrseitige Tabellen, Formeln und gescannte Tabellen inklusive.
Ja – echte Markdown-Tabellen, keine Bilder
Eine Tabelle aus einem PDF zu kopieren lässt sie meist zu unausgerichteten Zeilen zusammenfallen, weil ein PDF Zeichen nach Position speichert, nicht als Tabelle. PDF to Markdown baut die Zeilen und Spalten wieder auf und schreibt sie als echte Markdown-Tabelle – Pipes, eine Kopfzeile und ausgerichtete Zellen – damit die Zahlen editierbar, vergleichbar und durchsuchbar bleiben. Es bewältigt mehrspaltige Seiten, Tabellen über mehrere Seiten, Formeln und Tabellen auf gescannten Seiten, ganz ohne Einrichtung.
Eine PDF-Tabelle in 4 Schritten konvertieren
Kein Konto nötig. Das gesamte Dokument wird konvertiert, Tabellen inklusive.
Konverter öffnen
Installiere die Chrome-Erweiterung oder öffne die Web-App. Beide funktionieren anonym.
PDF hinzufügen
Zieh die Datei rein, wähle sie von der Festplatte oder füge eine direkte PDF-URL ein.
Auf den Job warten
Der Status durchläuft in Warteschlange, wird verarbeitet, fertig. Spalten werden in ausgerichtete Markdown-Tabellen zurückgebaut.
Kopieren oder herunterladen
Sieh dir das gerenderte Markdown und den Quelltext an, kopiere dann die Tabelle oder lade eine .md-Datei herunter.
Tipp: Du brauchst nur die Tabellen aus vielen Dateien? Steuere dieselbe Konvertierung über die REST API oder das gehostete MCP und parse die Markdown-Tabellen in deinem eigenen Code.
Struktur erhalten, keine Screenshots
Der Konverter baut die Tabelle wieder auf, die ein PDF nur visuell zeichnet, so ist das Ergebnis nutzbare Daten.
Ausgerichtete Zeilen & Kopfzeilen
Spalten werden zu echten Markdown-Tabellenzellen mit einer Kopfzeile, statt zu unausgerichtetem Text.
Mehrspaltige Reihenfolge
Zwei- und dreispaltige Seitenlayouts werden in der korrekten Lesereihenfolge gelesen, so landen Zellen am richtigen Platz.
Mehrseitige Tabellen
Eine Tabelle, die über mehrere Seiten läuft, wird zu einer Markdown-Tabelle zusammengefügt, statt aufgeteilt zu werden.
Formeln in Zellen
Mathematische Notation in oder neben einer Tabelle bleibt erhalten, statt zu unleserlichen Zeichen verflacht zu werden.
Gescannte Tabellen
Reine Bild- und gescannte Tabellen werden per OCR in auswählbare Markdown-Tabellen umgewandelt.
Engine-Auswahl
MinerU ist robust bei dichten, komplexen Tabellen; Docling ist schnell bei sauberen, einfachen.
Eine Seitentabelle kommt als reines Markdown zurück, das du in ein Dokument, einen Tabellen-Importer oder einen LLM-Prompt einfügen kannst:
| Region | Units | Revenue | | ------ | ----- | ------- | | North | 1,240 | $312K | | South | 980 | $244K | | EMEA | 1,610 | $402K |
Da es reiner Text ist, geht die Tabelle überallhin: füg sie in Google Sheets oder Excel ein, leg sie in ein Markdown-Dokument, vergleiche sie in Git oder reiche sie an ein LLM als sauberen Kontext weiter. Kein manuelles Ausrichten, und die Zahlen bleiben editierbar, statt in einem Bild eingesperrt zu sein.
Komplexe Tabellen: dichte Tabellen mit verbundenen oder verschachtelten Kopfzellen oder seitlich gedrehte Tabellen auf der Seite werden ebenfalls konvertiert, können aber eine kurze Sichtprüfung brauchen. Einfache Raster sind sofort einsatzbereit.
Formeln überstehen die Konvertierung
Die meisten PDF-Extraktoren machen aus Gleichungen Unsinn. Hier bleibt die mathematische Notation erhalten, so bleiben technische und wissenschaftliche Dokumente nutzbar.
Warum es wichtig ist
Eine verflachte Formel ist in einem LLM-Prompt oder einer Wissensdatenbank schlimmer als nutzlos: die Symbole verwürfeln sich und die Bedeutung geht verloren. Die Notation zu erhalten heißt, dass Gleichungen neben deinen Tabellen, und die Werte, die sie liefern, für Menschen und Modelle lesbar bleiben.
Gut zu wissen
Tabellen im großen Maßstab extrahieren?
Derselbe Konverter ist eine REST API und ein gehosteter MCP-Endpunkt. Konvertiere ein PDF und parse die Markdown-Tabellen in deinem eigenen Code oder aus einem Agenten heraus – sieh dir das Python-Tutorial im Entwickler-Hub an.
Häufige Fragen
Kann es PDF-Tabellen in Markdown konvertieren?
Ja. Spalten werden in echte, ausgerichtete Markdown-Tabellen (Pipes und Zeilen) zurückgebaut, statt in einen Screenshot oder ein Durcheinander aus Zeilen, so bleiben die Daten editierbar und durchsuchbar.
Bleiben mehrseitige und mehrspaltige Tabellen intakt?
Ja. Mehrspaltige Layouts werden in der richtigen Reihenfolge gelesen und eine Tabelle, die über mehrere Seiten läuft, wird zu einer Markdown-Tabelle zusammengefügt. Sehr komplexe Tabellen mit verbundenen Zellen können etwas Nacharbeit brauchen.
Bleiben Formeln erhalten?
Ja. Die mathematische Notation bleibt erhalten, statt zu unleserlichen Zeichen verflacht zu werden, so überstehen Formeln in und um Tabellen die Konvertierung.
Was ist mit Tabellen in gescannten PDFs?
Gescannte und reine Bild-Tabellen werden per OCR in auswählbare Markdown-Tabellen umgewandelt. Sieh dir gescannte PDFs konvertieren für den vollständigen OCR-Durchlauf an.
Kann ich die Tabellen über eine API bekommen?
Ja. Die REST API und das gehostete MCP geben das vollständige Markdown zurück, Tabellen inklusive, so kannst du Tabellen programmatisch oder aus einem Agenten heraus extrahieren.
Kann ich die extrahierten Tabellen in Excel oder Google Sheets öffnen?
Ja. Eine Markdown-Tabelle lässt sich sauber in ein Tabellenblatt einfügen, oder du wandelst die Pipes in ein paar Zeilen in CSV um. Da die Zellen echter Text sind und kein Bild, sind die Daten sofort editierbar.
Warum brechen die Spalten, wenn ich eine Tabelle aus einem PDF kopiere?
Ein PDF speichert Zeichen nach Position, nicht als Tabelle, deshalb verliert Kopieren und Einfügen die Spaltenstruktur und alles fällt in unausgerichtete Zeilen zusammen. Die Konvertierung in Markdown baut die Zeilen und Spalten wieder auf.
Ist es kostenlos?
Ja. Konvertiere anonym im Browser ohne Konto im Gratis-Tarif (3 Slots, 10 MB Dateien, ein Zeitbudget von 15 Minuten, 1 Stunde Aufbewahrung). Bezahlte Tarife heben jedes Limit an.