Eike Schallehn
Dr.-Ing. Eike Schallehn
Abgeschlossene Projekte
Load-balanced Index Structures for Self-tuning DBMS
Laufzeit: 01.01.2010 bis 31.12.2014
Index tuning as part of database tuning is the task of selecting and creating indexes with the goal of reducing query processing times. However, in dynamic environments with various ad-hoc queries it is difficult to identify potentially useful indexes in advance. The approach for self-tuning index cogurations developed in previous research provides a solution for continuous tuning on the level of index configurations, where configurations are a set of common index structures. In this project we investigate a novel approach, that moves the solution of the problem at hand to the level of the index structures, i.e. to create index structures which have an inherently self-optimizing structure.
ViERforES - Interoperabilität für digitale Produkte mit eingebetteten Systemen
Laufzeit: 01.09.2008 bis 31.12.2010
Die Funktionalität neuer Produkte wird durch einen zunehmenden Anteil von Software in Form von Eingebetteten Systemen erzielt. Im Zusammenwirken mit anderen funktionsbestimmenden Komponenten komplexer technischer Systeme erfordert das neue Techologien zur Beherrschung von höchster Sicherheit und Zuverlässigkeit von Produktentwicklungen. Ziel von VIERforES ist es, durch Einsatz von Virtueller und Erweiterter Realität auch nicht physikalische Produkteigenschaften sichtbar zu machen und so adäquate Methoden und Werkzeuge für das Engineering zu entwickeln. Die Bereitstellung von Lösungen zur gesamtheitlichen Betrachtung komplexer Produkte oder Anlagen in der Entwicklung, dem Tests und während des Betriebes stellt die Informationstechnik vor große Herausforderungen. Unter anderem müssen unabhängig voneinander modellierte Komponenten in einen Gesamtkontext eingebracht werden, wofür die virtuelle oder erweiterte Realität als integrierter Arbeitsbereich nutzbar gemacht werden kann. Ziel des Teilprojektes "Interoperabilität für digitale Produkte mit eingebetteten Systemen" ist daher die Sicherstellung der Interoperabilität der beteiligten heterogenen Systeme und der von diesen verwalteten Modelle. Dies reicht von der syntaktischen (verschiedene Schnittstellen, Datenmodelle, etc.) über die semantische (Bedeutung und Zusammenhang von unterschiedlich modellierten Daten und Funktionalitäten) bis zur pragmatischen Ebene (Verwendung durch Nutzer, Unterstützung von Arbeitsabläufen, Kooperation).
Lastbalancierte Indexstrukturen zur Unterstützung des Self-Tuning in DBMS
Laufzeit: 03.03.2007 bis 31.03.2010
Indexstrukturen werden seit langer Zeit in Datenbankmanagementsystemen eingesetzt, um bei grösen Datenmengen den Zugriff auf Datenobjekte zu beschleunigen. Dabei werden Datenräume in der Regel gleichmäßig indexiert, um möglichst konstante Zugriffskosten zu erzielen. Weiterhin sind die Indexstrukturen dafür optimiert, den gesamten Datenbereich zu beschreiben, wodurch in der Regel große Indexinstanzen entstehen. Im Rahmen dieses Projektes wird untersucht, welche Möglichkeiten existieren, um Indexe im Rahmen eines Self-Tuning besser an aktuelle Anforderungen eines Systems anzupassen. Im Gegensatz zur parallel betriebenen Forschungen an Indexkonfigurationen sollen hierbei die Indexe selber adaptiv sein, indem sie sich an das Lastverhalten in Form von Zugriffen auf bestimmte Datenbereiche selbständig anpassen. Resultierende Indexstrukturen müssen dementsprechend nicht mehr höhenbalanciert sein und können gegebenenfalls dünnbesetzt sein oder den Datenraum nur partiell überdecken.
Lastbalancierte Indexstrukturen zur Unterstützung des Self-Tuning in DBMS
Laufzeit: 01.10.2004 bis 02.03.2007
Indexstrukturen werden seit langer Zeit in Datenbankmanagementsystemen eingesetzt, um bei grösen Datenmengen den Zugriff auf Datenobjekte zu beschleunigen. Dabei werden Datenräume in der Regel gleichmäßig indexiert, um möglichst konstante Zugriffskosten zu erzielen. Weiterhin sind die Indexstrukturen dafür optimiert, den gesamten Datenbereich zu beschreiben, wodurch in der Regel große Indexinstanzen entstehen. Im Rahmen dieses Projektes wird untersucht, welche Möglichkeiten existieren, um Indexe im Rahmen eines Self-Tuning besser an aktuelle Anforderungen eines Systems anzupassen. Im Gegensatz zur parallel betriebenen Forschungen an Indexkonfigurationen sollen hierbei die Indexe selber adaptiv sein, indem sie sich an das Lastverhalten in Form von Zugriffen auf bestimmte Datenbereiche selbständig anpassen. Resultierende Indexstrukturen müssen dementsprechend nicht mehr höhenbalanciert sein und können gegebenenfalls dünnbesetzt sein oder den Datenraum nur partiell überdecken.
Ähnlichkeitsbasierte Operationen für die Integration strukturierter Daten
Laufzeit: 01.10.2000 bis 02.08.2005
Die Behandlung von Diskrepanzen in Daten ist immer noch eine große Herausforderung und zum Beispiel relevant zur Beseitigung von Duplikaten aus semantisch überlappenden Datenquellen als auch zur Verbindung komplementärer Daten aus verschiedenen Quellen. Entsprechende Operationen können meist nicht nur auf Wertegleichheit basieren, da nur in wenigen Fällen über Systemgrenzen hinweg gültige Identifikatoren existieren.Die Verwendung weiterer Attributwerte ist problematisch, da fehlerhafte Daten und unterschiedliche Darstellungsweisen ein häufiges Problem in diesem Kontext sind. Deshalb müssen solche Operation auf der Ähnlichkeit von Datenobjekten und -werten basieren.Dieser Probleme wird sich in dem Promotionsprojekt von Herr Eike Schallehn angenommen, indem ähnlichkeitsbasierte Operationen entsprechend einem leichtgewichtigen, generischen Rahmen bereitgestellt werden. Die ähnlichkeitsbasierte Selektion, der Verbund und die Gruppierung werden bezüglich ihrer allgemeinen Semantik und besonderer Aspekte der zugrunde liegenden Ähnlichkeitsrelationen diskutiert. Entsprechende Algorithmen für die Datenbearbeitung werden für materialisierte und virtuelle Datenintegrationsszenarien beschrieben. Implementierungen werden vorgestellt und bezüglich der Anwendbarkeit und Effizienz der vorgestellten Ansätze evaluiert.
Selbstverwaltung von Indexkonfigurationen in DBMS
Laufzeit: 01.04.2003 bis 31.03.2005
Ein Hauptmittel zum Tuning von Datenbanken ist das Anlegen von Indexen zur Beschleunigung der Ausführung einer Vielzahl von Operationen. Jedoch ist das Anlegen der geeigneten Indexe eine schwierige Aufgabe, die genaues Wissen über die Nutzung der Daten und die Arbeitsweise des jeweiligen Datenbankmanagementsystems voraussetzt. Zur Unterstützung dieser Aufgabe wurden in den letzten Jahren von den DBMS-Herstellern Werkzeuge entwickelt, die zum Beispiel typische Anfragen oder Anfrage-Logs analysieren und eine statische Empfehlung für eine Indexkonfiguration ableiten.In der Praxis existieren Datenbanken aber in einem sehr dynamischen Umfeld, wo sich neben typischen Nutzungsprofilen (Anfragen) auch die Daten selber und ebenfalls zur Verfügung stehenden Systemressourcen permanent ändern. Im Rahmen dieses Projektes wird untersucht, wie basierend auf einer kontinuierlichen Analyse des Systems und seiner Nutzung automatisch die aktuelle Indexkonfiguration an sich ändernde Anforderungen angepasst werden kann.
2018
- Xiao Chen, Roman Zoun, Eike Schallehn,
Sravani Mantha, Kirity Rapuru, and Gunter Saake.
Exploring Spark-SQL-Based Entity Resolution Using the
Persistence Capability.
In Beyond Databases, Architectures and Structures, pages 3–17,
September 2018.
- Xiao Chen, Kirity Rapuru,
Gabriel Campero Durand, and Eike Schallehn.
Performance Comparison of Three Spark-Based
Implementations of Parallel Entity Resolution.
In International Workshop on Big Data Management in Cloud Systems
(BDMICS-DEXA), pages 76–87. Springer, September
2018.
- Otmane Azeroual, Gunter Saake, and Eike
Schallehn.
Analyzing
data quality issues in research information systems via data
profiling.
International Journal of Information Management, Volume 41, pages
50–56, April 2018.
- Xiao Chen, Eike Schallehn, and Gunter
Saake.
Cloud-Scale Entity Resolution: Current State and Open Challenges.
Open Journal of Big Data, 4(1):30–51, April 2018.
(PDF)
2015
- Siba Mohammad, Eike Schallehn, and
Gunter Saake.
A Self-Tuning Framework for Cloud Storage
Clusters.
In 19th East-European Conference on Advances in Databases and Information
Systems (ADBIS), pages 351–364. Springer,
2015.
- Ziqiang Diao, Pengfei Zhao, Eike
Schallehn, and Siba Mohammad.
Achieving Consistent Storage for Scalable MMORPG
Environments.
In 19th International Database Engineering & Applications Symposium
(IDEAS '15), pages 33–40. ACM Press, 2015.
2014
- Ziqiang Diao, Shuo Wang, and Eike
Schallehn.
Cloud-based Persistence Services for
MMORPGs.
In The 11th International Baltic Conference on DB and IS
(DB&IS2014), pages 303–314. TUT Press,
2014.
- Christian Hansen, Stefan Knoll, Veit
Köppen, Georg Krempl, Claudia Krull, and Eike Schallehn, editors.
Tagungsband der Magdeburger-Informatik-Tage 3. Doktorandentagung
2014.
Otto-von-Guericke-Universität Magdeburg, 2014.
- Ziqiang Diao, Shuo Wang, Eike
Schallehn, and Gunter Saake.
CloudCraft: Cloud-based Data Management for
MMORPGs.
Databases and Information Systems VIII, 270(9):71–84,
2014.
2013
- Siba Mohammad, Eike Schallehn, and
Sebastian Breß.
Clustering the Cloud: A Model for
(Self-)Tuning of Cloud Data Management Systems.
In Proceedings of the 3rd International Conference on Cloud Computing and
Services Science (CLOSER), pages 520–524. SciTePress – Science and
Technology Publications, 2013.
- Ziqiang Diao and Eike Schallehn.
Cloud Data Management for Online Games: Potentials and Open
Issues.
In BTW Workshop on Data Management in the Cloud (DMC).
Köllen-Verlag, 2013.
Accepted for publication.
- Ziqiang Diao and Eike Schallehn.
Towards Cloud Data Management for MMORPGs.
In The 3rd International Conference on Cloud Computing and Services
Science (CLOSER 2013), pages 303–308. SciTePress,
2013.
- Sebastian Breß, Felix Beier, Hannes
Rauhe, Kai-Uwe Sattler, Eike Schallehn, and Gunter Saake.
Efficient Co-Processor Utilization in Database Query Processing.
Information Systems, 38(8):1084–1096, 2013.
http://dx.doi.org/10.1016/j.is.2013.05.004.
- Stefan Barthel and Eike Schallehn.
MVAL:
Addressing the Insider Threat by Valuation-based Query
Processing.
In Proceedings of the 25th Workshop Grundlagen von Datenbanken
(GvD), page TBA. CEUR-WS, 2013.
- Ziqiang Diao, Eike Schallehn, Shuo
Wang, and Siba Mohammad.
Cloud Data Management for Online Games: Potentials and Open Issues.
Datenbank-Spektrum, 13(3):179–188, November
2013.
2012
- Sebastian Breß, Siba Mohammad, and
Eike Schallehn.
Self-Tuning Distribution of DB-Operations
on Hybrid CPU/GPU Platforms.
In Proceedings of the 24st Workshop Grundlagen von Datenbanken
(GvD), pages 89–94. CEUR-WS, 2012.
- Siba Mohammad, Sebastian Breß, and
Eike Schallehn.
Cloud Data
Management: a Short Overview and Comparison of Current
Approaches.
In Proceedings of the 24th Workshop Grundlagen von Datenbanken
(GvD), pages 41–46. CEUR-WS, 2012.
- Sebastian Breß, Eike Schallehn, and
Ingolf Geist.
Towards Optimization of Hybrid CPU/GPU Query Plans in Database
Systems.
In Second ADBIS workshop on GPUs In Databases (GID), pages 27–35.
Springer, 2012.
- Sebastian Breß, Felix Beier, Hannes
Rauhe, Eike Schallehn, Kai-Uwe Sattler, and Gunter Saake.
Automatic Selection of Processing Units for Coprocessing in
Databases.
In 16th East-European Conference on Advances in Databases and Information
Systems (ADBIS), pages 57–70. Springer, 2012.
- Sebastian Breß, Ingolf Geist, Eike
Schallehn, Maik Mory, and Gunter Saake.
A Framework for Cost based Optimization of Hybrid
CPU/GPU Query Plans in Database Systems.
Control and Cybernetics, 41(4):715–742, 2012.
(PDF)
2011
- Syed Saif ur Rahman, Eike Schallehn,
and Gunter Saake.
ECOS: Evolutionary Column-Oriented Storage.
Technical Report FIN-03-2011, Department of Technical and Business Information
Systems, Faculty of Computer Science, University of Magdeburg,
2011.
- Syed Saif ur Rahman, Eike Schallehn,
and Gunter Saake.
ECOS:
Evolutionary Column-Oriented Storage.
In In Proceedings of the 28th British National Conference on Databases
(BNCOD 2011), volume 7051 of LNCS, pages 18–32.
Springer, July 2011.
2008
- Alsayed Algergawy, Eike Schallehn, and
Gunter Saake.
A New XML Schema Matching Approach Using Prüfer Sequences.
In Proceedings International Baltic Conference on Databases and
Information Systems (DB&IS), volume 187 of Frontiers in
Artificial Intelligence and Applications, pages 217–228,
2008.
2004
- Eike Schallehn.
Efficient Similarity-based
Operations for Data Integration.
Dissertation, University of Magdeburg, Germany, March 2004.
(PDF)
- Eike Schallehn, Kai-Uwe Sattler, and
Gunter Saake.
Efficient Similarity-based Operations for Data Integration.
Data and Knowledge Engineering, 48(3):361–387,
2004.