Aktualisierung der Data Search for Data Mining Erweiterung

Fortgeschrittene Verwendung

Veröffentlicht von Edwin Yaqub (RapidMiner) am 26.04.2019

Die neue Version der RapidMiner-Erweiterung "Data Search for Data Mining" (Version 2.1.0) wurde auf dem RapidMiner Marketplace veröffentlicht. Diese Version enthält einige Verbesserungen der Codebasis und der Dokumentation im Operator "Enrich Table by Data Fusion". Dieser Operator erweitert eine Datentabelle mit mehreren neuen Attributen, indem er die Unbeschränkte Suche auf Nutzerseite ausführt.

Diese Version wurde um eine neue Anwendungsvorlage und einen Tutorialprozess ergänzt. Beide zeigen einen neuen Usecase - ein vollständig automatisierter Datenanreicherungsprozess, der Fehlwerte in Attributen eines Datensatzes ersetzt. Hierzu wird das Augmentationsproblem in ein Multi-Objektiv-Optimierungsproblem umwandeln. Diese Umformung bietet verschiedene Vorteile:

  • Die Komplexität für den Endnutzer wird reduziert, da er nicht mehr selbst die Parameterwerte wählen muss um ein gutes Ergebnis zu erhalten.
  • Sie ermöglicht die Bewertung der Qualität von Fuzzy-Übereinstimmungen, indem der Endnutzer seine eigenen Übereinstimmungskriterien (als Variable, die die Anzahl der True Positives darstellt) für das Optimierungsproblem definieren kann.