Research Phase 2

Maschinelles Lernen zur Analyse der Proteinsynthese

Research Ergebnisse /

Proteine sind biologische Makromoleküle und ein zentraler Baustein des Lebens auf unserem Planeten. Für den Einsatz in Therapeutika, Diagnostika oder in der Lebensmittelindustrie werden Proteine in lebenden Zellen synthetisiert. Aufgrund zahlreicher und teilweise unbekannter Einflussfaktoren und Wechselwirkungen sind diese biologischen Prozesse hochkomplex und schwer vorherzusagen.

Algorithmen des maschinellen Lernens ermöglichen die Analyse hochdimensionaler Prozessdaten und die Erstellung prädiktiver Qualitätsmodelle. Damit eröffnen sie neue Möglichkeiten der Prozessoptimierung. Dies erfordert eine enge Zusammenarbeit zwischen Dateningenieuren und Fachleuten sowie ein gegenseitiges Verständnis der Arbeit des oder der anderen. In diesem Projekt wurden Algorithmen des maschinellen Lernens entwickelt, um die Proteinsynthese zu analysieren und zu modellieren, wobei der Schwerpunkt auf der Modelltransparenz und einer umfassenden Bewertung lag.

Es wurden verschiedene Methoden zur Qualitätsbewertung von Prozessmodellen getestet. Die entwickelten Methoden wurden in eine Toolbox integriert und es wurde ein Handbuch für maschinelles Lernen entworfen, um die interdisziplinäre Kommunikation zwischen Dateningenieuren und Prozessexperten zu verbessern. Einige Proteine können genauer modelliert werden können als andere. Eine hohe Varianz bei mehreren Vorhersagemodellen deutet darauf hin, dass die verfügbaren Daten externe Faktoren, die die Proteinproduktion maßgeblich beeinflussen, nicht erfassen.