Dr.-Ing.
Dr. Robert Heyer
AG Databases & Software Engineering
Current projects
Optimizing graph databases focussing on data processing and integration of machine learning for large clinical and biological datasets
Duration: 01.12.2021 bis 30.04.2025
Graphdatenbanken stellen eine effiziente Technik zur Speicherung und zum Zugriff auf hochgradig
verknüpfte Daten unter Verwendung einer Graphstruktur dar, wie z.B. Verbindungen zwischen Messdaten zu Umweltparametern oder klinischen Patientendaten. Die flexible Knotenstruktur macht es einfach, die Ergebnisse verschiedener Untersuchungen hinzuzufügen. Dies reicht von einfachen Blutdruckmessungen über die neuesten CT- und MRT-Scans bis hin zu hochauflösenden Omics-Analysen (z.B. von Tumorbiopsien, Darmmikrobiom-Proben). Allerdings wird das volle Potenzial der Datenverarbeitung und -analyse mittels Graphdatenbanken in biologischen und klinischen Anwendungsfällen noch nicht vollständig ausgeschöpft. Insbesondere die riesige Menge an miteinander verbundenen Daten, die geladen, verarbeitet und analysiert werden müssen, führt zu zu langen Verarbeitungszeiten, um in klinische Arbeitsabläufe integriert werden zu können. Um dieses Ziel zu erreichen sind neuartige Optimierungen von Graph-Operatoren sowie eine geeignete Integration von Analyseansätzen notwendig.
Dieses Projekt zielt darauf ab, die oben genannten Probleme in zwei Richtungen zu lösen: (i) Vorschlag geeigneter Optimierungen für Graphdatenbank-Operationen, auch unter Einsatz moderner Hardware, und(ii) Integration von Algorithmen des maschinellen Lernens für eine einfachere und schnellere Analyse der biologischen Daten. Für die erste Richtung untersuchen wir den Stand der Technik von Graphdatenbanksystemenund deren Speicherung sowie ihr Verarbeitungsmodell. Anschließend schlagen wir Optimierungen für effiziente
operationale und analytische Operatoren vor. Für die zweite Richtung stellen wir uns vor, Algorithmen des maschinellen Lernens näher an ihre Datenlieferanten - die Graphdatenbanken - heranzubringen. Zu diesem Zweck füttern wir in einem ersten Schritt die Algorithmen des maschinellen Lernens direkt mit dem Graphen als Eingabe, indem wir geeignete Graphenoperatoren entwerfen. In einem zweiten Schritt integrieren wir das maschinelle Lernen direkt in die Graphdatenbank, indem wir spezielle Knoten hinzufügen, die das Modell des Algorithmus für maschinelles Lernen repräsentieren.
Die Ergebnisse unseres Projekts sind verbesserte Operatoren, die sowohl moderne Hardware als auch Integrationskonzepte für Algorithmen des maschinellen Lernens nutzen. Unsere allgemein entwickelten Ansätze werden das Verarbeiten und Analysieren riesiger Graphen in einer Fülle von Anwendungsfällen über unseren angestrebten Anwendungsfall der biologischen und klinischen Datenanalyse hinaus vorantreiben.
Completed projects
Optimizing graph databases focussing on data processing and integration of machine learning for large clinical and biological datasets
Duration: 01.12.2021 bis 30.11.2024
Graphdatenbanken stellen eine effiziente Technik zur Speicherung und zum Zugriff auf hochgradig
verknüpfte Daten unter Verwendung einer Graphstruktur dar, wie z.B. Verbindungen zwischen Messdatenzu Umweltparametern oder klinischen Patientendaten. Die flexible Knotenstruktur macht es einfach, dieErgebnisse verschiedener Untersuchungen hinzuzufügen. Dies reicht von einfachen Blutdruckmessungenüber die neuesten CT- und MRT-Scans bis hin zu hochauflösenden Omics-Analysen (z.B. von Tumorbiopsien,Darmmikrobiom-Proben). Allerdings wird das volle Potenzial der Datenverarbeitung und -analyse mittelsGraphdatenbanken in biologischen und klinischen Anwendungsfällen noch nicht vollständig ausgeschöpft.Insbesondere die riesige Menge an miteinander verbundenen Daten, die geladen, verarbeitet und analysiertwerden müssen, führt zu zu langen Verarbeitungszeiten, um in klinische Arbeitsabläufe integriert werdenzu können. Um dieses Ziel zu erreichen sind neuartige Optimierungen von Graph-Operatoren sowie eine
geeignete Integration von Analyseansätzen notwendig.
Dieses Projekt zielt darauf ab, die oben genannten Probleme in zwei Richtungen zu lösen: (i) Vorschlag
geeigneter Optimierungen für Graphdatenbank-Operationen, auch unter Einsatz moderner Hardware, und(ii) Integration von Algorithmen des maschinellen Lernens für eine einfachere und schnellere Analyse der biologischenDaten. Für die erste Richtung untersuchen wir den Stand der Technik von Graphdatenbanksystemen
und deren Speicherung sowie ihr Verarbeitungsmodell. Anschließend schlagen wir Optimierungen für effizienteoperationale und analytische Operatoren vor. Für die zweite Richtung stellen wir uns vor, Algorithmen desmaschinellen Lernens näher an ihre Datenlieferanten - die Graphdatenbanken - heranzubringen. Zu diesemZweck füttern wir in einem ersten Schritt die Algorithmen des maschinellen Lernens direkt mit dem Graphenals Eingabe, indem wir geeignete Graphenoperatoren entwerfen. In einem zweiten Schritt integrieren wir dasmaschinelle Lernen direkt in die Graphdatenbank, indem wir spezielle Knoten hinzufügen, die das Modell des Algorithmus für maschinelles Lernen repräsentieren. Die Ergebnisse unseres Projekts sind verbesserte Operatoren, die sowohl moderne Hardware als auch Integrationskonzepte für Algorithmen des maschinellen Lernens nutzen. Unsere allgemein entwickeltenAnsätze werden das Verarbeiten und Analysieren riesiger Graphen in einer Fülle von Anwendungsfällen überunseren angestrebten Anwendungsfall der biologischen und klinischen Datenanalyse hinaus vorantreiben.
Integrated Cycles for Urban Biomass (ICU): Optimization of biomass streams and recycling processes in urban residential building aiming at a CO2-neutral city
Duration: 01.12.2019 bis 28.02.2021
Successful counteraction of progressive global warming requires urgently the development of a CO2 neutral society based on sustainable creation cycles. However, currently CO2 neutral concepts for supply of food and utilization of biogenic residues are lacking. One approach therefore, would be the recycling of biomass, accumulating in buildings and at least a partial integration of food production into the city and the buildings. In such a scenario, an anaerobic digester placed into the technical center of a building degrades anaerobically the biogenic residues generated by the humans into methane and CO2. Methane indeed can be usedby an in-house combined heat and power plant for the supply of electricity and heat. The remaining digestate can be utilized as nutrient supplier for the cultivation of fruits and vegetables in-house or on the rooftops. In order to achieve the highest yield, the plants could be cultivated directly in the nutrient supply (hydroponic cultures). However, application of this process operation requires testing whether certain substances in the digestate may hamper the plant grow and whether the plants may utilize ammonia and other nutrients from the digestate or whether certain microorganisms (on the roots) have to convert them. The advantage of this local biomass recycling is the optimal utilization of the available biomass streams. In order to implement this vision it is necessary to evaluate in beforehand the economic, energetic, material, technical, legal and hygienic aspects of this concept and to estimate its potentials. This evaluation should be carried out within the scope of this feasibility study.
InflammatorySystems-Microbiome: Systemdiagnostik des menschlichen Darmmikrobioms bei entzündungsbedingten Erkrankungen mittels Metaproteomeanalyse
Duration: 01.10.2017 bis 31.10.2018
Das menschliche Darmsystem zählt zu den größten Organsystemen. Es wird von mehreren chronisch-entzündlichen Darmerkrankungen (IBD) mit teilweise unbekannter Pathogenese, wie Morbus Crohn oder Colitis ulcerosa, befallen. Diese begünstigen wiederum die Entwicklung von Tumoren. Darüber hinaus scheinen Aberrationen im Darmmikrobiom mit einem breiten Spektrum von Entzündungskrankheiten zusammenzuhängen, einschließlich allergischer Erkrankungen, Asthma und Reizdarmerkrankungen. Die Pathogenese von IBD, insbesondere der Einfluss des Mikrobioms auf das Darmsystem und umgekehrt, ist kaum verstanden. Ein Grund dafür ist der Mangel an geeigneten Methoden für die umfassende Untersuchung des Darmmikrobioms und dessen Funktion bei Gesundheit und Krankheit. Bisher befassen sich die Methoden zur Untersuchung von Fäkalproben nur mit einzelnen Parametern, z.B. erhöhte Spiegel von Calprotectin und Lactoferrin als Marker für Schleimhautentzündungen oder die Menge an Elastase 1 als Marker für chronische Pankreatitis und Pankreaskrebs. Durch die Entwicklung von Hochdurchsatzverfahren zur Identifizierung von Genen (Metagenomik / Metatranskriptomik) und Proteinen (Metaproteomik) kann das Mikrobiom jedoch in seiner Gesamtheit untersucht werden.
- Software and database development for analysis of complex microbial communities
- Metaproteome analysis
- Human gut microbiome
Methoden der Proteinanalytik