Willkommen bei der Forschungsgruppe für Datenmanagement und -engineering (dme).?
Unsere aktuelle Forschung befasst sich mit dem Entwurf und der Bewertung von Algorithmen für die Integration und Synthese relationaler Daten mit einem besonderen Schwerpunkt auf Schema-Matching und Entity-Matching.
?
Unsere Lehre umfasst sowohl Algorithmen als auch Systeme für Datenmanagement und -verarbeitung. Dazu geh?ren neben Datenintegration und -synthese auch Dataset Discovery, Data Profiling, Data Cleaning, Data Mining, relationale und nicht-relationale Datenbankmanagementsysteme sowie verteilte Datenverarbeitung und die Verarbeitung von Echtzeitdaten.
Neuigkeiten
Zwei unserer?Forschungsarbeiten wurden auf der diesj?hrigen International Conference on Extending Database Technology (EDBT) angenommen.?Beide Forschungsprojekte resultieren aus einer Kooperation mit dem Hasso-Plattner-Institut aus Potsdam.
?
- PRISMA: A Privacy-Preserving Schema Matcher using Functional Dependencies.?Um Datenquellen integrieren zu k?nnen, müssen zun?chst Korrespondenzen zwischen ihren Schemata identifiziert werden.?Eine solche Identifizierung erweist sich als schwierig, wenn die zu vergleichenden Datenquellen unterschiedlich kodiert sind (z. B. unterschiedliche Sprachen oder verschiedene Verschlüsselungen). In dieser Arbeit stellen wir mit Prisma einen neuen kodierungsunabh?ngigen Schema Matcher vor, der funktionale Abh?ngigkeiten innerhalb der einzelnen Datenquellen verwendet um diese abzugleichen.
? - Icewafl: A Configurable Data Stream Polluter.?Das Benchmarking von Data Engineering Algorithmen erfordert geeignete Testdaten. In vielen F?llen spielen Datenfehler dabei eine gro?e Rolle (z. B. um die Effektivit?t von Algorithmen zur Erkennung solcher Fehler oder der Robustheit von datenverarbeitenden Algorithmen gegenüber solcher Fehler zu evaluieren). In diesem Papier stellen wir einen neuen Ansatz zur Verschmutzung von Datenstr?men vor.