Umgekippte Tablettendose mit Tabletten

Epidemiologische Forschung mittels Deep Learning bei Bayer (seit 2019)

Bei der Pharmaherstellerin werden Wirkungsweise und Sicherheit von Medikamenten nach Marktstart konstant mittels „Real World Data“ evaluiert. Diese Evaluation erfolgt mittels Patientinnendaten, die in Arztpraxen, in Krankenhäusern, bei Krankenkassen und ähnlichen Orten erhoben werden können. Ein aktuelles Forschungsthema ist die Verbesserung der statistisch-epidemiologischen Modelle, die zur Auswertung dieser Daten genutzt werden.

Problemstellung

Die Beurteilung der Nebenwirkungen, Verträglichkeit, Wirksamkeit o.ä. von Medikamenten nach Markteinführung ist ein wichtiger Punkt, um die Sicherheit von Medikamenten sicherzustellen und zu optimieren. Mittels traditioneller statistischer Modelle können so Fragestellungen beantwortet werden, die in klinischen Studien nicht untersuchbar sind. Die wissenschaftliche Fachliteratur diskutiert jedoch zunehmend mehr die Relevanz von Deep Learning Algorithmen zur Verbesserung der bestehenden Modelle.

Beratungs- und Projektinhalte

Wir wurden von Bayer als Dienstleister für die Durchführung von Forschungsprojekten zur Evaluation und Umsetzung von Machine Learning und Deep Learning in der epidemiologischen Forschung beauftragt. Die erste Projektphase bestand aus der Durchführung mehrerer Workshops, um herauszufinden, wie der klassische Ansatz in der Pharmakoepidemiologie bei Bayer aktuell genutzt wird. Anschließend wurde der aktuelle Forschungsstand zu Machine und Deep Learning erarbeitet und mögliche Wege zur Verbesserung der bisherigen Modelle durch Neuronale Netze und verschiedene Typen regularisierter Regressionen skizziert.
In der zweiten Projektphase haben wir bestehende Modelle erweitert und in ein Python basiertes Machine Learning Framework überführt. Das Machine Learning Framework unterstützt automatische Code-Dokumentation, vollständige Reproduzierbarkeit von Experimenten und Versionierung von Daten-Pipelines und Daten-Quellen. Aufbauend auf dem Framework haben wir ein Simulationsverfahren der Universität Harvard als Python Package implementiert, welches die Performance-Bewertung verschiedener Modelle ermöglicht.

Seit September überführen wir die Implementierung in eine Full-Stack Analyse-Plattform, die auch nicht-technischen Nutzerinnen die Möglichkeit zur Anwendung Künstlicher Intelligenz gibt. Nutzerinnen können über ein User Interface Machine Learning Methoden auf beliebige Datensätze anwenden, benchmarken und jederzeit reproduzieren. Die Plattform kann mit Datensätzen von mehreren Millionen Einträgen umgehen und wird auf der Bayer eigenen Infrastruktur betrieben.