Modelle wie AlphaFold oder RosettaFold haben die Strukturbiologie stark beeinflusst. Sie sagen voraus, wie sich Proteine räumlich falten und wie sie mit anderen Molekülen interagieren. Eine Studie der Universität Basel zeigt jedoch, dass diese Programme physikalische Zusammenhänge nur unzureichend erfassen. Stattdessen lernen sie Muster aus den Trainingsdaten auswendig – mit Folgen für die Zuverlässigkeit in der Wirkstoffforschung.
Bedeutung von Proteinstrukturen für die Medikamentenentwicklung
Proteine fungieren in therapeutischen Anwendungen als Wirkstoff oder Zielstruktur. Die exakte Kenntnis ihrer dreidimensionalen Struktur ist daher zentral. Moderne KI-Modelle sollten die aufwendige strukturelle Aufklärung unterstützen.
«Diese Möglichkeit, die Struktur von Proteinen zusammen mit einem Liganden vorauszusagen, ist von unschätzbarem Wert für die Medikamentenentwicklung», sagt Prof. Dr. Markus Lill vom Departement für Pharmazeutische Wissenschaften der Universität Basel.
Zweifel an hoher Erfolgsquote
Trotz begrenzter Trainingsdaten – rund 100’000 bekannte Protein-Ligand-Strukturen – erreichten KI-Modelle angeblich hohe Vorhersagegenauigkeiten. Lill und sein Team hinterfragten dies.
«Wir wollten herausfinden, ob diese KI-Modelle anhand der Trainingsdaten wirklich die physikalisch-chemischen Grundlagen lernen und richtig anwenden», so Lill.
Manipulierte Bindungsstellen entlarven Schwächen
Die Forschenden veränderten Aminosäuresequenzen verschiedener Proteine so, dass ihre Bindungsstellen eine neue Ladungsverteilung aufwiesen oder komplett blockiert waren. Dennoch sagten die KI-Modelle weiterhin dieselbe Struktur voraus – so, als wäre die Bindung unverändert möglich.
In vielen Fällen passierte Gleiches, wenn die Liganden manipuliert wurden.
«Das zeigt uns, dass selbst die modernsten KI-Modelle nicht wirklich verstehen, warum ein Medikament an ein Protein bindet; sie erkennen nur Muster, die sie schon einmal gesehen haben», fasst Lill zusammen.
Neue Proteine bleiben besondere Herausforderung
Die Schwächen traten besonders deutlich hervor, wenn die Modelle Proteine vorhersagen sollten, die kaum Ähnlichkeiten zu den Trainingsdaten aufwiesen. «Wenn sie etwas völlig Neues sehen, liegen sie schnell daneben; genau dort liegt aber der Schlüssel zu neuen Medikamenten», betont Lill.
Validierung bleibt unverzichtbar
Für die Medikamentenentwicklung bedeutet dies, dass KI-Vorhersagen stets experimentell oder durch physikalisch basierte Simulationen überprüft werden müssen.
«Die bessere Lösung wäre, die physikalisch-chemischen Gesetzmässigkeiten in künftige KI-Modelle zu integrieren», sagt Lill. Realistischere Strukturvorhersagen könnten insbesondere für bislang schwer zugängliche Proteinstrukturen entscheidend sein.
Literatur
Matthew R. Masters, Amr H. Mahmoud & Markus A. Lill: "Investigating whether deep learning models for co-folding learn the physics of protein-ligand interactions", Nature Communications (2025), doi: 10.1038/s41467-025-63947-5