Digitale Chemiker

Erste Programme können vollständige Syntheseabläufe im Labor planen.

  • Bernd Schröder
  • Lesedauer: 7 Min.

Ob Schach, Dame, Go oder gar Poker - selbst Spitzenspieler haben inzwischen kaum noch eine Chance gegen Computer. Zumindest in Teilbereichen machen sich die Maschinen nun auch auf, menschliche Chemiker zu ersetzen. Erstmals soll ein Computerprogramm komplette chemische Synthesen in allen dafür nötigen Schritten erfolgreich planen können. Ganz ohne menschliche Aufsicht, heißt es, doch das ist so nicht ganz richtig: Anders als bei den selbstlernenden Schach- und Go-Computern speist sich die Weisheit des Programms aus 250 Jahren Geschichte der organischen Chemie.

Denn weshalb chemische Reaktionen ablaufen, und was dabei unter welchen jeweils gegebenen Bedingungen herauskommen könnte - dieses Wissen basiert auf unzähligen Versuchen, erfolgreichen ebenso wie gescheiterten. Die Planung chemischer Synthesen ist eine sehr anspruchsvolle Aufgabe, die von Chemikern jahrelange Erfahrung sowie ein gehöriges Maß an Zeit und Mühe einfordert. Die Arbeit setzt sich aus drei Teilaufgaben zusammen: der Syntheseplanung selber, die eine geeignete, zum gewünschten Zielmolekül führende Strategie sucht, der Reaktionsplanung, die passende Reaktionsbedingungen bestimmt, und der Reaktionsvorhersage mit Details zum erwarteten Reaktionsverlauf.

Eine generelle Schwierigkeit ist die Bewältigung der schieren Datenmenge, die über die Zeit angehäuft wurde - und die weiter anschwillt. Die Anzahl publizierter Verbindungen in der CAS-Registry-Datenbank der Amerikanischen Chemischen Gesellschaft zeigt eine um die Jahrtausendwende einsetzende rasante Zunahme: Allein 2014 waren mehr Verbindungen hinzugekommen als in den Jahren von 1965 bis 1990 zusammengenommen. 2015 wurde die 100 Millionste Verbindung registriert. Auch der Umfang an Reaktionsdaten hat gerade in der jüngeren Vergangenheit stark zugelegt. Sie werden in speziellen Reaktionsdatenbanken erfasst.

Um bei dieser nur noch schwer zu überblickenden Datenfülle Reaktionen planen zu können, werden verstärkt Informatik-Lösungen gesucht. Mit dem Einzug neuer Rechentechnik in die Labore kam die Idee auf, die Planung von Synthesen Computern zu überlassen. Die Versuche dazu sind seit den 1970er als CAOS (Computer-Assisted Organic Synthesis) bekannt.

Einer der Pioniere: der spätere Chemie-Nobelpreisträger Elias James Corey von der Harvard-Universität, der mit dem Syntheseplanungsprogramm OCSS (Organic Chemistry Synthesis Simulator) erste wichtige Schritte auf dem Gebiet unternahm, dem das bekanntere LHASA (Logic and Heuristics Applied to Synthetic Analysis) folgte. Auf Corey geht auch ein heute wichtiger Ansatz für die Syntheseplanung zurück, die sogenannte Retrosynthese. Dabei wird die Synthese vom Zielmolekül ausgehend rückwärts geplant. Kurz nach OCSS und LHASA tauchte das Programm SYNCHEM auf. Dies war im Gegensatz zu seinen Vorgängern entwickelt worden, um sich ganz unabhängig von Chemiker-Vorschlägen selbst zum Ziel zu führen.

Der große Durchbruch ließ allerdings auf sich warten - trotz jahrzehntelanger Forschung gelang es Computern offenbar bis vor Kurzem nicht, vollständige Synthesewege zu generieren, die dann erfolgreich im Labor umgesetzt wurden. Meist war der Wissensfundus an chemischen Reaktionen zu beschränkt, oder die Programme waren nicht dafür konzipiert, das riesige Terrain synthetischer Möglichkeiten auf intelligente Art und Weise zu durchkämmen. Denn die Anzahl von Möglichkeiten eines jeden retrosynthetischen Schritts liegt bei rund 100, bei n Schritten sind es 100n Möglichkeiten. Die Schwierigkeit, bei dieser Ausgangslage aussichtsreiche Synthesewege zu finden, liegt auf der Hand. Hier sind intelligente Algorithmen gefragt, die weniger Erfolg versprechende Pfade selbstständig verlassen und ihre Suche auf möglichst effiziente Wege konzentrieren können.

Glaubt man den Entwicklern des 2012 erstmals vorgestellten Programms Chematica, so verknüpft dieses chemische Expertise mit leistungsfähigen Rechnern, Netzwerksuche und Künstlicher Intelligenz. Bartosz Grzybowski vom Ulsan National Institute of Science & Technology in Südkorea und der Polnischen Akademie der Wissenschaften hatte mit mehreren Mitarbeitern sein Programm 15 Jahre perfektioniert, bevor er seine Firma Grzybowski Scientific Inventions (GSI) 2017 an das Pharmaunternehmen Merck Millipore verkaufte.

Ausgangspunkt der Arbeit an Chematica war die Erkenntnis, dass die Zusammenführung der Daten zu allen bekannten chemischen Verbindungen mit den vielfältigen zwischen ihnen möglichen chemischen Reaktionen zu einer völlig neuartigen Wissensplattform führen würde. Diese Verknüpfung einer jeden jemals durchgeführten Reaktion mit jeder jemals hergestellten Substanz würde ein kollektives »chemisches Gehirn« entstehen lassen, das dann mit Algorithmen durchsucht werden kann, wie sie etwa in Telekommunikationsnetzwerken zur Anwendung kommen.

Die Algorithmen sind so programmiert, dass innerhalb von Sekundenbruchteilen Milliarden chemischer Reaktionsmöglichkeiten gescannt werden, die zu einem gewünschten Molekül führen könnten. Das Programm soll vor allem den Suchfähigkeiten menschlicher Chemiker unter die Arme greifen, die wegen der großen Anzahl von Möglichkeiten längst überfordert sind. Das Programm ist am Ziel, wenn es bei den benötigten Ausgangsmaterialien bei gängigen Chemikalien anlangt: entweder kommerziell erhältlichen - der Sigma-Aldrich-Katalog listet gegenwärtig mehr als 200 000 davon auf - oder bei den unter Synthesechemikern bekannten, rund sieben Millionen Molekülen aus Patenten und der chemischen Literatur.

Und auch dem Trend zur »grünen Chemie« will Chematica entgegenkommen: durch die Möglichkeit, Einschränkungen vorzugeben. Man kann zum Beispiel einstellen, dass die Reaktionen keine umweltschädlichen Lösungsmittel verlangen oder wahlweise nur wasserlösliche Komponenten zulassen.

Im Rahmen eines Stipendiums des US-Verteidigungsministeriums ist auch die DARPA (Defense Advanced Research Projects Agency) am Forschungsprogramm beteiligt. Die Behörde verspricht sich Erkenntnisse darüber, ob Nicht-Experten solche Programme erfolgreich verwenden könnten, um gezielt chemische Substanzen herzustellen. Außerdem will man bisher unbekannte Reaktionswege finden, die aus bislang als harmlos eingestuften Ausgangssubstanzen chemische Kampf- oder Sprengstoffen herstellen lassen. Denn bisher überwachen die Behörden vor allem Einzelverbindungen, die als gefährlich gelten.

In die aktuelle Version von Chematica wurden rund 50 000 Regeln zur chemischen Reaktivität eingearbeitet. In einer zusätzlichen Datenbank sind 200 000 spezialisierte Reaktionen nebst chemischer Regeln, Literaturreferenzen, Reaktionsbedingungen und mehr vorrätig. Die Regeln stammen aus publizierten Reaktionsvorschriften oder Erfahrungswerten der organischen Chemiker des Projekts - sie sagen dem Programm, welche Umwandlungen für jedwedes gegebenes Molekül möglich sind.

Die Algorithmen des Programms navigieren mit Hilfe dieser Regeln durch das Dickicht der chemischen Möglichkeiten. Am Ende sollen dann neue, selektive und vor allem effiziente Synthesevorschriften stehen. Gerade in letztgenannter Hinsicht ein besonders wünschenswertes Ziel: statt mehrstufiger Reaktionen zu einer Eintopf-Reaktion zu kommen, bei der alle Ausgangsmaterialien in einem Reaktionsgefäß zum Endprodukt reagieren. Das würde die oft aufwendigen Reinigungsschritte der Zwischenstufen überflüssig machen und so den Zeitaufwand verringern. Eine andere denkbare Anwendung ist das Auffinden von Alternativen in der Herstellung von Substanzen, deren bekannte Synthesewege patentiert sind.

Um die Planerfähigkeiten des Programms zu demonstrieren, wurden für die jüngste Veröffentlichung im Fachjournal »Chem« (DOI: 10.1016/ j.chempr.2018.02.002) acht Zielmoleküle vorgegeben: sieben wirtschaftlich interessante bioaktive Substanzen und ein Naturstoff. Für zwei der Zielmoleküle gab es zuvor keine publizierte Synthesevorschrift.

Chematica benötigte auf einem Rechner mit 64 Prozessorkernen pro Syntheseweg 15 bis 20 Minuten bis zum Finden eines Vorschlags, der von den Chemikern optimiert und dann entsprechend synthetisch umgesetzt wurde. Die Chemiker konnten nach eigenen Angaben durch das Befolgen der ermittelten Synthesewege erfolgreich alle acht Zielverbindungen herstellen. In den meisten Fällen konnten die Wissenschaftler entweder die Ausbeute im Vergleich zu publizierten Synthesewegen erhöhen, die Zahl der dafür notwendigen Schritte verringern oder den Zeit- und Kostenaufwand reduzieren. Für die zwei Substanzen ohne bekannten Herstellungsweg gelang erstmalig die Synthese. Künftig will man durch Aufrüstung der Rechner auch deutlich größere »Retrosynthese-Bäume« durchforsten können. So nannte Corey 1969 die von ihm eingeführten Strukturen wegen der vielen Verzweigungen auf dem Weg vom gewünschten Zielmolekül bis zu praktikablen Ausgangsmaterialien.

Einige Chemiker träumen bereits von einer Revolution im Chemielabor, von einer Produktivität, die sich besonders im Zusammenspiel mit automatisierten Syntheserobotern in ungeahnte Höhen schrauben ließe.

Andere Kollegen sind skeptischer. Weniger wegen der vagen Vorahnung, dass ihre Arbeitsplätze bald hinfällig werden könnten, denn noch droht ein solches Szenario nicht. Kritiker finden die gerade präsentierten Ergebnissen nicht überzeugend, zu marginal seien die erzielten Verbesserungen. Der Beweis, dass Chematica tatsächlich bessere Synthesewege ersinne als Menschen, stehe nach wie vor aus. Noch andere sehen die vorgestellte Veröffentlichung weniger als eine ernst zu nehmende wissenschaftliche Studie als vielmehr den Versuch, ein Produkt zu bewerben.

Sollte das Programm letztendlich funktionieren, könnte einer breiteren Anwendung ein anderes Problem im Wege stehen: die Frage des geistigen Eigentums, etwa für die von Chematica erzeugten Synthesewege. Sarah Trice, Chefin für die kommerzielle Entwicklung chemoinformatischer Technologien bei Merck Millipore, wird im Onlinedienst »Chemical & Engineering News« zitiert, dass Molekülsuchen nur von demjenigen Nutzer eingesehen werden können, der sie durchführt, und dass das Unternehmen die Rechte am geistigen Eigentum der jeweils generierten Vorschriften nicht zu kontrollieren gedenkt. Noch hat das Unternehmen nicht bekanntgegeben, wann oder wie Chematica kommerziell verfügbar sein wird. Die nächsten sind allerdings schon am Start: Im Fachblatt »Nature« (DOI: 10.1038/nature25978) stellte vorige Woche eine Forschergruppe von der Uni Münster ein ebenfalls auf Verfahren der Künstlichen Intelligenz beruhendes lernfähiges Programm vor. Die Synthesevorschläge wurden Chemikern in einem Doppelblindversuch mit bereits erprobten Synthesewegen vorgelegt. Die fanden die Computervorschläge gleichwertig.

Für die menschliche Erfindungskraft dürfte jedenfalls auch in der Zukunft noch genügend Platz bleiben.

Werde Mitglied der nd.Genossenschaft!
Seit dem 1. Januar 2022 wird das »nd« als unabhängige linke Zeitung herausgeben, welche der Belegschaft und den Leser*innen gehört. Sei dabei und unterstütze als Genossenschaftsmitglied Medienvielfalt und sichtbare linke Positionen. Jetzt die Beitrittserklärung ausfüllen.
Mehr Infos auf www.dasnd.de/genossenschaft

Linken, unabhängigen Journalismus stärken!

Mehr und mehr Menschen lesen digital und sehr gern kostenfrei. Wir stehen mit unserem freiwilligen Bezahlmodell dafür ein, dass uns auch diejenigen lesen können, deren Einkommen für ein Abonnement nicht ausreicht. Damit wir weiterhin Journalismus mit dem Anspruch machen können, marginalisierte Stimmen zu Wort kommen zu lassen, Themen zu recherchieren, die in den großen bürgerlichen Medien nicht vor- oder zu kurz kommen, und aktuelle Themen aus linker Perspektive zu beleuchten, brauchen wir eure Unterstützung.

Hilf mit bei einer solidarischen Finanzierung und unterstütze das »nd« mit einem Beitrag deiner Wahl.

Unterstützen über:
  • PayPal