Unsere Nachwuchsforschungsgruppe arbeitet an der Entwicklung und Anwendung biostatistischer Methoden, um vielfältige Fragestellungen in der Umweltmedizin zu adressieren. Angesichts der wachsenden Verfügbarkeit hochdimensionaler biomedizinischer Daten verfolgen wir einen interdisziplinären Ansatz, der methodische Statistik, skalierbare Algorithmen und biomedizinische Expertise integriert.
Unsere interdisziplinären Projekte reichen von der Genomik bis hin zur klinischen Medizin und Umweltepidemiologie. Wir entwickeln statistische Methoden sowohl für detaillierte biomolekulare Daten, wie etwa Einzelzell-RNA-Sequenzierungsdaten, als auch für umfassende epidemiologische Daten aus Kohortenstudien. Dieser integrative Ansatz von der zellulären Ebene bis hin zur Bevölkerungsebene ermöglicht eine umfassende Analyse genetischer und umweltbedingter Faktoren, um Krankheitsmechanismen besser zu verstehen und zielgerichtete Strategien für die individuelle Prävention und öffentliche Gesundheit zu entwickeln.
Große und hochdimensionale Daten aus molekularen und Bevölkerungsstudien, die hunderttausende von Zellen oder Individuen sowie tausende bis Millionen genetischer und umweltbedingter Variablen umfassen, erfordern die Entwicklung interpretierbarer Modelle und Methoden zur Quantifizierung von Unsicherheit. Dafür entwickeln wir skalierbare statistische Lernverfahren zur Variablenselektion, Schätzung und Prädiktion, einschließlich regularisierter Regression, Boosting und Bayesianischer Ansätze. Ein besonderer Schwerpunkt liegt auf der Modellierung polygener Risikoscores zur Vorhersage von Gesundheitsphänotypen, um die Generalisierbarkeit über verschiedene Bevölkerungsgruppen hinweg zu verbessern. Zusätzlich entwickeln wir flexible Regressionsmodelle, die räumliche und zeitliche Effekte umfassen, um das Auftreten von Krankheiten in Populationen zu modellieren.
Nachwuchsgruppenleiter:
Christian Staerk