Veröffentlichung der PDF Table Extraction Erweiterung

Extraktion tabellarischer Daten aus PDF-Dateien

Veröffentlicht von Edwin Yaqub (RapidMiner) am 4.03.2017

Viele öffentliche und private Daten werden in PDF-Dateien gespeichert. Besonders der hohe Verbreitungsgrad des Formats trägt dazu bei. Jedoch sind tabellarische Daten aus PDFs oft schwer zu extrahieren. Mit der neuen PDF Table Extraction Erweiterung für RapidMiner können solche Daten nun direkt in Datenanalyse Prozesse integriert werden. Der PDF Table Extraction Erweiterungs Blogpost zeigt ein mögliches Anwendungsbeispiel auf.