Zum Inhalt springenZur Suche springen

Informatik: Veröffentlichung in PLOS Biology
Wer transportiert hier was?

Für den ständigen Austausch von Stoffen in und aus einer biologischen Zelle heraus sind Transportproteine verantwortlich. Es ist aber schwierig zu bestimmen, welche Stoffe ein bestimmtes Protein transportieren kann. Bioinformatiker der Heinrich-Heine-Universität Düsseldorf (HHU) haben nun mithilfe Künstlicher Intelligenz (KI) ein SPOT genanntes Modell entwickelt, das dies mit hoher Genauigkeit vorhersagen kann. In der Fachzeitschrift PLOS Biology stellen sie ihren neuen, für beliebige Transportproteine geeigneten Ansatz vor.

Zoom

Schematische Darstellung des Vorhersageprozesses: Proteindatenbanken liefern für das Training einen Datensatz mit 8.500 experimentell validierten Transport-Substrat-Paaren (oben). Transportproteine bestehen aus einer Sequenz von Aminosäuren, die von einem Deep-Learning-Modell in Vektoren transformiert wurden (Mitte links in unterschiedlichen Grüntönen). Ebenfalls werden Informationen über potenzielle Substrate in numerische Vektoren umgewandelt (Mitte rechts in Gelbtönen). Diese Vektoren trainieren ein sogenanntes Gradient Boosting-Modell (Ensemble mehrerer Entscheidungsbäume), um vorherzusagen, ob das Molekül ein Substrat für ein bestimmtes Transportprotein ist (unten). (Abbildung: HHU / Alexander Kroll)

Ständig müssen Stoffe in biologische Zellen durch die Zellmembran hinein- oder heraustransportiert werden, damit diese überleben und ihre Funktion erfüllen können. Aber längst nicht alle Stoffe, die sich durch den Körper bewegen, sollen in die Zelle gelangen. Und manche dieser Transportvorgänge müssen steuerbar sein, etwa nur zu bestimmter Zeit oder unter bestimmten Bedingungen funktionieren, um eine Zellfunktion auszulösen.

Die Rolle dieser aktiven und spezialisierten Transportkanäle übernehmen sogenannte Transportproteine oder kurz Transporter, von denen viele unterschiedliche in die Zellmembranen eingebaut sind. Ein Transportprotein besteht aus einer großen Zahl einzelner Aminosäuren, die insgesamt eine komplexe dreidimensionale Struktur bilden.

Jeder Transporter ist auf ein ganz bestimmtes Molekül – das sogenannte Substrat – oder eine kleine Gruppe von Substraten spezialisiert. Doch auf welche genau? Forschende suchen immer wieder nach den passenden Paaren von Transportern und Substraten.

Prof. Dr. Martin Lercher von der Arbeitsgruppe für Computational Cell Biology und Korrespondenzautor einer nun in PLOS Biology erschienenen Studie: „Experimentell zu bestimmen, welche Substrate zu welchen Transportern passen, ist schwierig. Schon die dreidimensionale Struktur eines Transporters – aus der man gegebenenfalls auf die Substrate schließen kann – zu ermitteln ist eine Herausforderung, denn sobald man die Proteine aus der Membran herauslöst, werden sie instabil.“

„Wir haben einen anderen, einen KI-basierten Ansatz gewählt“, sagt Dr. Alexander Kroll, Erstautor der Studie und Postdoc bei Prof. Lercher. „Unsere SPOT genannte Methode nutzte für ein Deep Learning-Modell über 8.500 bereits experimentell validierte Transporter-Substrat-Paare als Trainingsdatensatz.“

Damit ein Computer die Transporterproteine und Substratmoleküle verarbeiten kann, verwandeln die Düsseldorfer Bioinformatiker die Proteinsequenzen und Substratmoleküle zunächst jeweils in numerische Vektoren, die von KI-Modellen verarbeitet werden können. Nach dem fertigen Lernprozess kann dann der Vektor für einen neuen Transporter und diejenige für möglicherweise passende Substrate in das KI-System eingegeben werden. Das Modell gibt eine Vorhersage, mit einer wie hohen Wahrscheinlichkeit bestimmte Substrate zu dem Transporter passen.

Kroll: „Wir haben unser fertig angelerntes Modell mit einem unabhängigen Testdatensatz überprüft, bei dem wir ebenfalls die Transporter-Substrat-Paarungen kannten. Mit einer Genauigkeit von über 92 Prozent sagt SPOT voraus, ob irgendein Molekül ein Substrat für einen speziellen Transporter ist.“

SPOT schlägt also vielversprechende Substratkandidaten vor. „Wir können so den Suchraum für Experimentatoren sehr stark einschränken. Sie können dann viel schneller im Labor tatsächlich herausfinden, welches Substrat sicher zu einem Transporter passt“, erläutert Prof. Lercher das Zusammenspiel von bioinformatischer Vorhersage und experimenteller Verifizierung.

Kroll ergänzt: „Und dies gilt für jedes beliebige Transportprotein, nicht nur – wie bei bisherigen Ansätzen – für eingeschränkte Klassen ähnlicher Proteine.“

Das Modell hat verschiedene denkbare Anwendungsfelder. Lercher: „In der Biotechnologie können Stoffwechselwege so verändert werden, dass bestimmte Produkte, etwa Biokraftstoffe, hergestellt werden. Oder aber es können Arzneimittel auf Transporter hin angepasst werden, so dass diese leichter in genau die Zelle gelangen, wo sie wirken sollen.“

Originalpublikation

Alexander Kroll, Nico Niebuhr, Gregory Butler, Martin J. Lercher. SPOT: a machine learning model that predicts specific substrates for transport proteins. PLOS Biology, 2024.

DOI: 10.1371/journal.pbio.3002807

Autor/in:
Kategorie/n: Schlagzeilen, Pressemeldungen, Math.-Nat.-Fak.-Aktuell, Forschung News
Verantwortlichkeit: