Enzyme sind wichtige Biokatalysatoren in allen lebenden Zellen: Sie ermöglichen chemische Reaktionen, mit denen alle für den Organismus bedeutsamen Moleküle aus Grundsubstanzen (den Substraten) hergestellt werden. Die meisten Organismen besitzen Tausende verschiedener Enzyme, jedes ist für eine ganz bestimmte Reaktion verantwortlich. Die Funktion aller Enzyme zusammen macht den Stoffwechsel aus und bedingt damit das Leben und Überleben des Organismus.
Auch wenn Gene, die Enzyme kodieren, recht leicht als solche erkannt werden können, so ist die genaue Funktion des resultierenden Enzyms in den allermeisten Fällen – bei mehr als 99 Prozent – unbekannt. Denn ihre Arbeit experimentell zu charakterisieren und damit zu erkennen, welche Ausgangsmoleküle ein bestimmtes Enzym konkret in welches Endmolekül umwandelt, ist extrem aufwändig.
Das Forschungsteam um Prof. Dr. Martin Lercher von der Arbeitsgruppe Computergestützte Zellbiologie an der HHU entwickelte zusammen mit Kollegen aus Schweden und Indien eine Methode, die KI-basiert vorhergesagt, ob ein beliebiges Enzym ein bestimmtes Molekül als Ausgangsstoff für die von ihm katalysierte Reaktion verarbeiten kann.
Prof. Lercher: „Die Besonderheit unseres ESP-Modells – dies steht für „Enzyme-Substrate-Prediction“ – ist, dass wir nicht auf einzelne, spezielle Enzyme und ihre nahen Verwandten beschränkt sind, wie dies in bisherigen Ansätzen der Fall war. Unser allgemeines Modell kann mit jeder Kombination aus einem beliebigen Enzym und über 1.000 verschiedenen Substraten arbeiten.“
Doktorand Alexander Kroll, Erstautor der Studie, hat ein sogenanntes Deep Learning-Modell entwickelt, in dem die Informationen über die Enzyme und die Substrate in mathematischen Strukturen, sogenannten numerischen Vektoren, kodiert wurden. Die Vektoren von rund 18.000 experimentell bekannten Enzym-Substrat-Kombinationen – bei denen Enzym und Substrat tatsächlich zusammenarbeiten – wurden als Trainingsmaterial in das Deep Learning-Modell gefüttert.
Alexander Kroll: „Das so von uns trainierte Modell haben wir dann auf einen unabhängigen Testdatensatz angewandt, für den wir die korrekten Antworten schon kannten. In 91 Prozent der Fälle sagte das Modell korrekt voraus, welche Substrate zu welchen Enzymen passen.“
Diese Methode hat erhebliches Anwendungspotenzial. Sowohl in der Arzneimittelforschung als auch in der Biotechnologie ist es von großer Bedeutung zu wissen, welche Stoffe von Enzymen umgesetzt werden können. Prof. Lercher: „So können Forschung und Industrie aus einer großen Menge an möglichen Kombinationen diejenigen eingrenzen, die am vielversprechendsten sind, um damit neue Medikamente, Chemikalien oder auch Biokraftstoffe enzymatisch herzustellen.“
Kroll ergänzt: „Hiermit werden auch bessere Modelle möglich, um den Stoffwechsel in Zellen zu simulieren. Darüber kann die Physiologie verschiedener Organismen – von Bakterien bis zum Menschen – verstanden werden.“
An der Studie waren neben Kroll und Lercher auch Prof. Dr. Martin Engqvist von der Chalmers University of Technology im schwedischen Gothenburg und Sahasra Ranjan vom Indian Institute of Technology in Mumbai beteiligt. Engqvist hat das Studiendesign mit erarbeitet, Ranjan hat das Modell implementiert, das die Enzyminformationen kodiert, die in das von Kroll entworfene Gesamtmodell eingespeist werden.
Originalpublikation
Kroll, A., Ranjan, S., Engqvist, M.K.M., Lercher, M., A general model to predict small molecule substrates of enzymes based on machine and deep learning. Nat Commun 14, 2787 (2023), https://doi.org/10.1038/s41467-023-38347-2