Bayer ist eines der weltweit größten Life-Science-Unternehmen, das sich auf die Entwicklung, Herstellung und den Vertrieb von Produkten für die Bereiche Gesundheit und Landwirtschaft spezialisiert hat.
Die pharmazeutische Industrie ist stark reguliert, und die Arzneimittelentwicklung umfasst zahlreiche Phasen, die für die Gewährleistung von Sicherheit und Wirksamkeit entscheidend sind. Für jedes potenzielle Medikament müssen die Wissenschaftler:innen von Bayer umfangreiche Tests unter kontrollierten Laborbedingungen durchführen, bevor ein Produkt am Menschen getestet werden kann.
Die Durchsicht dieser präklinischen Daten - die in der Vergangenheit über mehrere Systeme verteilt waren - und der Studienberichte, die insgesamt bis zu 1500 Seiten umfassen können, war schwierig und zeitaufwändig und stellte für die Zeitpläne der Produktentwicklung ein potenzielles Risiko dar.
Um diese Herausforderungen zu bewältigen, machte sich Bayer die neuesten digitalen Technologien von AWS zunutze und entwickelte eine neue moderne Datenplattform für seine präklinischen Daten. Gemäß der Bayer-Vision „Health for all, Hunger for none“ wurden neue Funktionen geschaffen, um die Geschwindigkeit und Genauigkeit der Arzneimittelentwicklungspipeline zu erhöhen und damit die Ergebnisse für Patienten zu verbessern.
Eine moderne Datenplattform auf Basis von AWS
In Zusammenarbeit mit Thoughtworks hat Bayer eine moderne Datenplattform entwickelt, die in der AWS-Cloud gehostet wird und native AWS Managed Services nutzt, um:
den Zugriff auf präklinische Daten und Ergebnisse aus verschiedenen internen Datenquellen an einem einzigen Ort zu ermöglichen
einen strukturierteren Ansatz für die Datenverwaltung zu schaffen und aufrechtzuerhalten
eine mühelose Suche in bestehenden Datensätzen und früheren Studien zu ermöglichen
die Dateninterpretation durch maßgeschneiderte Visualisierungen zu vereinfachen
die strengen Vorschriften der Branche einzuhalten
Die neue Datenplattform PRINCE (Preclinical Information Center) fungiert als zentrale Anlaufstelle für alle präklinischen Daten und führt die bisher getrennten Datenquellen des Unternehmens zusammen. „Ein einziger Zugangspunkt mit einheitlichen Daten, die bedarfsgerecht ausgewertet werden können, spart viel Zeit“, erklärt Verena Ziegler, Head of Genetic & Computational Toxicology bei Bayer.
Das primäre Datenprodukt enthält die Ergebnisse von Tausenden von toxikologischen Studien sowie In-vitro- und In-vivo-Bioassay-Daten sowie Informationen zu den Wirkstoffen.
Darüber hinaus haben Nutzer:innen Zugang zu strukturierten und unstrukturierten Daten, unabhängig davon, ob sie über APIs, Dashboards oder die Suchoberfläche der Plattform auf die historische Datenbank zugreifen. So können die Forscher:innen ihre Arbeit auf der Grundlage bereits durchgeführter Untersuchungen und gewonnener Erkenntnisse durchführen.
„PRINCE ist ein wichtiger Meilenstein in der Digitalisierung unseres präklinischen Datendomäne“, sagt Jonas Münch, Head of IT for Safety & Pharmacology bei Bayer. „Wir glauben, dass es als Blaupause für eine zukünftige domänenzentrierte, dezentrale Datenlandschaft in der Forschung und Entwicklung dienen kann.“ Mit einer besseren Kontrolle über und Einsicht in die präklinischen Daten des Unternehmens können Bayer-Teams während des gesamten Arzneimittelentwicklungsprozesses bessere datengesteuerte Entscheidungen treffen, um einen funktionsübergreifenden Zugriff sicherzustellen und Ineffizienzen zu reduzieren.
PRINCE ist ein wichtiger Meilenstein in der Digitalisierung unserer präklinischen Datendomäne. Wir glauben, dass es als Blaupause für eine zukünftige domänenzentrierte, dezentrale Datenlandschaft in der Forschung und Entwicklung dienen kann.
Maßgeschneiderte Suchfunktionen, die Zeit sparen
Eine der wertvollsten Komponenten der Datenplattform ist die speziell entwickelte Suchmaschine. In ihrer ursprünglichen Form gaben die Forscher:innen in die Suchmaschine Freitext ein. Basierend auf Erkenntnissen aus regelmäßigen User Feedback Sessions, entwickelte Bayer die Funktionen der Suchmaschine so weiter, dass die Forscher:innen spezifische Parameter statt reiner Keywords eingeben können. In seiner aktuellen Version beschleunigt das maßgeschneiderte Suchtool die Datenerfassung erheblich.
Forscher:innen können sowohl strukturierte Daten, einschließlich Informationen über Wirkstoffe, Projekte, Zielmoleküle, Studien-Metadaten und Schlüsselergebnisse, als auch unstrukturierte Daten wie Schlussfolgerungen und Zusammenfassungen von genehmigten Studienberichten frei suchen und filtern.
Forscher:innen können den Prozess der Datenanalyse durch erweiterte Suchfunktionen wie die Verwendung von Synonymen, Legacy-Identifikatoren und chemischen Strukturen weiter beschleunigen.
„Unsere Datenplattform wird für mich als Wissenschaftler die bahnbrechende Innovation sein.“, sagt Jan Sternberg, Studiendirektor und Laborleiter bei Bayer. „Sie ermöglicht mir, schnell, effizient und flexibel zu sein und hilft mir, Antworten auf dringende Fragen zu präklinischen Studien zu finden.“
Darüber hinaus und im Einklang mit der laufenden digitalen Transformation bei Bayer können Datenwissenschaftler auch SQL-ähnliche Abfragen direkt im Backend der Plattform durchführen, was komplexe Analysen und Anwendungen für maschinelles Lernen ermöglicht.
Eine Plattform, die sich ständig weiterentwickelt
Durch den Einsatz von Infrastructure-as-Code auf der Grundlage von Terraform hat das Produktteam während des gesamten Entwicklungsprozesses der Plattform wiederverwendbare Vorlagen für die Infrastrukturkonfiguration erstellt. Dies ermöglichte eine reibungslose Übergabe der einzelnen Komponenten der Datenplattform und eine automatisierte Orchestrierung der Bereitstellung mithilfe von Continuous Delivery Pipelines.
Die Entwicklung und Bereitstellung sind agil. Die präklinischen Entwicklungsteams von Bayer liefern kontinuierlich Input durch regelmäßige Live-Sitzungen mit den Nutzer:innen und monatliche Wave-Sitzungen, in denen die Prioritäten der Nutzer:innen für die kontinuierliche Verbesserung der Plattform erfasst werden. Das Produktteam präsentiert während regelmäßiger Showcases neue Funktionen, die auf Grundlage des Stakeholder-Feedbacks hinzugefügt wurden.
Die verantwortungsvolle Verwaltung der präklinischen Daten und die Kontrolle von Bayer darüber, wer auf welche Datensätze zugreift, wird durch den Einsatz von AWS Glue-Stack-Komponenten und Managed Services als Teil der Datenplattform gewährleistet. Dies wurde mithilfe eines Compliance-as-Code-Ansatzes erreicht, der automatisch nachweist, dass neuer Code bei jedem Schritt mit den relevanten Richtlinien und Vorschriften übereinstimmt. Ein wesentlicher Vorteil ist die Möglichkeit, bei Bedarf Prüfpfade zu automatisieren.
Ausweitung auf neue Bereiche
Für die Zukunft werden sich die Projektmanager:innen darauf konzentrieren, die Auswahl von Studiendesigns zu verbessern sowie retrospektive und prädiktive Datenanalysen zu optimieren. Ein Beispiel dafür ist die Möglichkeit, mit PRINCE historische Daten aus früheren Studien zu erfassen. Historische Daten könnten verwendet werden, um virtuelle Kontrollgruppen für künftige präklinische Studien zu erstellen — ein Konzept, das derzeit wissenschaftlich erforscht wird.
„PRINCE erfüllt meinen lang gehegten Wunsch nach einer präklinischen Sicherheitsdatenbank.“, sagt Thomas Steger-Hartmann, Head of Investigational Toxicology bei Bayer. „Sie wird datengetriebene Entscheidungen in der Forschung und Entwicklung verbessern und beschleunigen und viele unserer Wissenssilos abbauen.“
Darüber hinaus erforscht Bayer, wie Datenprodukte andere Bereiche unterstützen können und ob sich durch die Verknüpfung mehrerer solcher Datenprodukte Vorteile erzielen lassen. Beispielsweise wird PRINCE bald als Daten- und Analyse-Backend für eines der präklinischen Labor-Informations-Management-Systeme (LIMS) von Bayer eingesetzt. Ergänzend werden derzeit die Vorteile des Einsatzes von Large Language Models untersucht, um den Wissenschaftler:innen von Bayer fortschrittliche innovative Funktionen zur Verfügung zu stellen.
PRINCE erfüllt meinen lang gehegten Wunsch nach einer präklinischen Sicherheitsdatenbank. Sie wird datengetriebene Entscheidungen in der Forschung und Entwicklung verbessern und beschleunigen und viele unserer Wissenssilos abbauen.