Das DS4DM Projekt hat innovative Konzepte für Datensuche und -integration sowohl geplant, als auch umgesetzt. Suchheuristiken wie die Correspondence Search, Unconstraint Search und Correlation Search wurden entwickelt um tabellarische Datensammlungen effektiv auswerten zu können und gleichzeitig dem Benutzer eine (halb-)automatische Integration anzubieten. Das Projekt entwickelte außerdem Werkzeuge um Daten aus nicht trivialen, aber verbreiteten Datenformaten zu extrahieren, wie zum Beispiel der Zugriff auf Dokumente in der Cloud in Form von online Spreadsheets oder Sharepoint. Das Hauptziel war es die Möglichkeiten von RapidMiner durch neue Erweiterung zu vergrößern um neue Daten in bestehende Prozesse integrieren zu können.
Im dritten Projektjahr war das Ziel, die Möglichkeiten von RapidMiner über Informatica, eine der bekanntesten Plattformen für Datenintegration, bereitzustellen. Diese Integration ist das Ergebnis einer strategischen Partnerschaft zwischen RapidMiner und Informatica, laut Gartner einer der führenden ETL und Machine Learning Plattformen und dem weltweit führendem Anbieter für Datenintegrationswerkzeuge. Die Integration erfolgt über eine Schnittstelle, welche es erlaubt RapidMiner Prozesse (als REST Webservice) aus der Informaticas Cloud Abläufen (Mappings genannt). Damit werden nicht nur weitere Anwendungen und eine nachhaltige Nutzung der Projektarbeit ermöglicht, durch die Ausführung von Datensuche und -extraktion als Teil von Informatica Mappings, es ermöglicht auch das Ausführen von beliebigen RapidMiner Prozessen im Informatica Ökosystem.
Eine erste Version des Connectors wurde am 13. Mai auf zwei Produktionsumgebungen von Informatica veröffentlicht und soll Kunden beider Plattformen helfen ihre Vorhersagemodelle in die Informatica Cloud Arbeitsabläufe zu integrieren. Eine Demo wurde von RapidMiner auf der Informatica World in Las Vegas, USA vorgestellt (22.-24. Mai 2018). Eine gemeinsame Pressemitteilung wurde am 23. Mai veröffentlicht.