Tabellen & Formeln

Tabellen aus PDF in Markdown extrahieren

Hol echte, ausgerichtete Markdown-Tabellen aus einem PDF – keinen Screenshot und kein Durcheinander aus Zeilen. Mehrspaltige und mehrseitige Tabellen, Formeln und gescannte Tabellen inklusive.

Kurze Antwort

Ja – echte Markdown-Tabellen, keine Bilder

Eine Tabelle aus einem PDF zu kopieren lässt sie meist zu unausgerichteten Zeilen zusammenfallen, weil ein PDF Zeichen nach Position speichert, nicht als Tabelle. PDF to Markdown baut die Zeilen und Spalten wieder auf und schreibt sie als echte Markdown-Tabelle – Pipes, eine Kopfzeile und ausgerichtete Zellen – damit die Zahlen editierbar, vergleichbar und durchsuchbar bleiben. Es bewältigt mehrspaltige Seiten, Tabellen über mehrere Seiten, Formeln und Tabellen auf gescannten Seiten, ganz ohne Einrichtung.

Anleitung

Eine PDF-Tabelle in 4 Schritten konvertieren

Kein Konto nötig. Das gesamte Dokument wird konvertiert, Tabellen inklusive.

1

Konverter öffnen

Installiere die Chrome-Erweiterung oder öffne die Web-App. Beide funktionieren anonym.

2

PDF hinzufügen

Zieh die Datei rein, wähle sie von der Festplatte oder füge eine direkte PDF-URL ein.

3

Auf den Job warten

Der Status durchläuft in Warteschlange, wird verarbeitet, fertig. Spalten werden in ausgerichtete Markdown-Tabellen zurückgebaut.

4

Kopieren oder herunterladen

Sieh dir das gerenderte Markdown und den Quelltext an, kopiere dann die Tabelle oder lade eine .md-Datei herunter.

Tipp: Du brauchst nur die Tabellen aus vielen Dateien? Steuere dieselbe Konvertierung über die REST API oder das gehostete MCP und parse die Markdown-Tabellen in deinem eigenen Code.

Was erhalten bleibt

Struktur erhalten, keine Screenshots

Der Konverter baut die Tabelle wieder auf, die ein PDF nur visuell zeichnet, so ist das Ergebnis nutzbare Daten.

Ausgerichtete Zeilen & Kopfzeilen

Spalten werden zu echten Markdown-Tabellenzellen mit einer Kopfzeile, statt zu unausgerichtetem Text.

Mehrspaltige Reihenfolge

Zwei- und dreispaltige Seitenlayouts werden in der korrekten Lesereihenfolge gelesen, so landen Zellen am richtigen Platz.

Mehrseitige Tabellen

Eine Tabelle, die über mehrere Seiten läuft, wird zu einer Markdown-Tabelle zusammengefügt, statt aufgeteilt zu werden.

Formeln in Zellen

Mathematische Notation in oder neben einer Tabelle bleibt erhalten, statt zu unleserlichen Zeichen verflacht zu werden.

Gescannte Tabellen

Reine Bild- und gescannte Tabellen werden per OCR in auswählbare Markdown-Tabellen umgewandelt.

Engine-Auswahl

MinerU ist robust bei dichten, komplexen Tabellen; Docling ist schnell bei sauberen, einfachen.

Eine Seitentabelle kommt als reines Markdown zurück, das du in ein Dokument, einen Tabellen-Importer oder einen LLM-Prompt einfügen kannst:

| Region | Units | Revenue |
| ------ | ----- | ------- |
| North  | 1,240 | $312K   |
| South  |   980 | $244K   |
| EMEA   | 1,610 | $402K   |

Da es reiner Text ist, geht die Tabelle überallhin: füg sie in Google Sheets oder Excel ein, leg sie in ein Markdown-Dokument, vergleiche sie in Git oder reiche sie an ein LLM als sauberen Kontext weiter. Kein manuelles Ausrichten, und die Zahlen bleiben editierbar, statt in einem Bild eingesperrt zu sein.

Komplexe Tabellen: dichte Tabellen mit verbundenen oder verschachtelten Kopfzellen oder seitlich gedrehte Tabellen auf der Seite werden ebenfalls konvertiert, können aber eine kurze Sichtprüfung brauchen. Einfache Raster sind sofort einsatzbereit.

Mathe & Formeln

Formeln überstehen die Konvertierung

Die meisten PDF-Extraktoren machen aus Gleichungen Unsinn. Hier bleibt die mathematische Notation erhalten, so bleiben technische und wissenschaftliche Dokumente nutzbar.

Warum es wichtig ist

Eine verflachte Formel ist in einem LLM-Prompt oder einer Wissensdatenbank schlimmer als nutzlos: die Symbole verwürfeln sich und die Bedeutung geht verloren. Die Notation zu erhalten heißt, dass Gleichungen neben deinen Tabellen, und die Werte, die sie liefern, für Menschen und Modelle lesbar bleiben.

Gut zu wissen

Inline- und Block-Mathematik in und um Tabellen bleibt bei der Konvertierung erhalten.
Gescannte Gleichungen laufen wie der Rest der Seite durch OCR.
Sehr dichte Mathematik kann eine kurze Sichtprüfung brauchen, wie bei jedem Konverter.

Tabellen im großen Maßstab extrahieren?

Derselbe Konverter ist eine REST API und ein gehosteter MCP-Endpunkt. Konvertiere ein PDF und parse die Markdown-Tabellen in deinem eigenen Code oder aus einem Agenten heraus – sieh dir das Python-Tutorial im Entwickler-Hub an.

FAQ

Häufige Fragen

Kann es PDF-Tabellen in Markdown konvertieren?

Ja. Spalten werden in echte, ausgerichtete Markdown-Tabellen (Pipes und Zeilen) zurückgebaut, statt in einen Screenshot oder ein Durcheinander aus Zeilen, so bleiben die Daten editierbar und durchsuchbar.

Bleiben mehrseitige und mehrspaltige Tabellen intakt?

Ja. Mehrspaltige Layouts werden in der richtigen Reihenfolge gelesen und eine Tabelle, die über mehrere Seiten läuft, wird zu einer Markdown-Tabelle zusammengefügt. Sehr komplexe Tabellen mit verbundenen Zellen können etwas Nacharbeit brauchen.

Bleiben Formeln erhalten?

Ja. Die mathematische Notation bleibt erhalten, statt zu unleserlichen Zeichen verflacht zu werden, so überstehen Formeln in und um Tabellen die Konvertierung.

Was ist mit Tabellen in gescannten PDFs?

Gescannte und reine Bild-Tabellen werden per OCR in auswählbare Markdown-Tabellen umgewandelt. Sieh dir gescannte PDFs konvertieren für den vollständigen OCR-Durchlauf an.

Kann ich die Tabellen über eine API bekommen?

Ja. Die REST API und das gehostete MCP geben das vollständige Markdown zurück, Tabellen inklusive, so kannst du Tabellen programmatisch oder aus einem Agenten heraus extrahieren.

Kann ich die extrahierten Tabellen in Excel oder Google Sheets öffnen?

Ja. Eine Markdown-Tabelle lässt sich sauber in ein Tabellenblatt einfügen, oder du wandelst die Pipes in ein paar Zeilen in CSV um. Da die Zellen echter Text sind und kein Bild, sind die Daten sofort editierbar.

Warum brechen die Spalten, wenn ich eine Tabelle aus einem PDF kopiere?

Ein PDF speichert Zeichen nach Position, nicht als Tabelle, deshalb verliert Kopieren und Einfügen die Spaltenstruktur und alles fällt in unausgerichtete Zeilen zusammen. Die Konvertierung in Markdown baut die Zeilen und Spalten wieder auf.

Ist es kostenlos?

Ja. Konvertiere anonym im Browser ohne Konto im Gratis-Tarif (3 Slots, 10 MB Dateien, ein Zeitbudget von 15 Minuten, 1 Stunde Aufbewahrung). Bezahlte Tarife heben jedes Limit an.