Bild: Shutterstock, KI-generiertes Bild
Fokusartikel Gentechfrei Magazin Nr. 130
Wenn Chatbots beim CRISPRen helfen
Immer öfter bringen Startups und Tech-Giganten Werkzeuge der generativen Künstlichen Intelligenz in die Gentech-Labore. Dort könnten bald Organismen entstehen, deren Herstellung zuvor nicht möglich war. Die Diskussion möglicher Risiken hat eben erst begonnen.
Bereits breit im Einsatz: Vorhersagenmodelle für mögliche Auswirkungen gentechnischer Eingriffe. Start-ups verwenden KI, um CRISPR-Sorten mit neuen Eigenschaften zu züchten. Mit ihnen soll Zeit und Kosten gespart werden.
Text: Benno Vogel
«Hallo, ich bin dein KI-Assistent, der mit biologischen Sequenzen umgehen kann. Wie kann ich dir helfen?» Wer seine Besucher und Besucherinnen mit diesen Worten begrüsst, ist ChatNT – ein Bot, der mit künstlicher Intelligenz (KI) Forschenden dabei hilft, DNA-Aufgaben zu lösen. «Lässt diese Gensequenz meine Pflanze grün leuchten?» oder «Wie aktiv ist dieses Gen in Maiszellen?» sind Fragen, die er in Sekundenschnelle beantwortet.
Die Lancierung von ChatNT, der aus den KI-Laboren von Instadeep, einer Tochterfirma des mRNA-Pioniers BioNTech, stammt, war anfangs Mai 2024. Zwei Wochen zuvor war der Start von CRISPR-GPT, einem von Google mitentwickeltem Chatbot. Wie ChatNT steht er Forschenden bei ihrer Arbeit mit DNA zur Seite. Seine Unterstützung besteht aber weniger in der Analyse von Genen, sondern vielmehr in deren Veränderung: Er hilft bei der Planung und Durchführung von Experimenten mit der Genschere CRISPR und soll damit die Genomeditierung einfacher machen.
Kurz vor CRISPR-GPT wiederum war EVO gestartet, ein gemeinsames Produkt der KI-Firmen TogetherAI und Arc Institute. Trainiert mit Gensequenzen aus 2,7 Millionen Genomen von Bakterien und Viren ist EVO ein genomisches Sprachmodell. So heissen KI-Systeme, die auf riesigen DNA-Datensätzen beruhen. EVO ist zudem eine generative KI: Forschende können mit ihr Gene, Proteine oder gar ganze Genome entwerfen, die es in der Natur zuvor nicht gab.
New-to-Nature-Gene und Proteine
Werkzeuge wie Evo, ChatNT und CRISPR-GPT erscheinen derzeit fast wöchentlich. Sie sind das Resultat eines Trends, die KI-Technologien in Gentechnik-Labore zu bringen, die hinter Bots wie ChatGPT oder Bildergeneratoren wie DALL-E stehen und seit rund zwei Jahren weltweit für Furore sorgen. Wie andere Branchen soll die neue KI auch die Gentechnik entscheidend verändern – sei es durch leistungsstarke deskriptive Modelle, mit denen sich die Auswirkungen gentechnischer Eingriffe vorhersagen lassen, oder durch generative Modelle, mit denen sich Gene und Proteine entwerfen lassen, die – so der Fachjargon – new-to-nature sind.
Schnelleres CRISPR dank KI
Ein Bereich, in dem Vorhersagemodelle bereits breit im Einsatz sind, ist die CRISPR-basierte Pflanzenzüchtung. Das zeigt ein Blick auf die zahlreichen Startups, die in den letzten Jahren begonnen haben, mit der Genschere CRISPR neue Sorten zu züchten und ausnahmslos KI verwenden. Drei Beispiele: Die in London ansässige Firma Phytoform setzt ihre KI-getriebene Editierungsplattform CRE.AI.TIVE. ein, um Tomaten und Kartoffeln ertragreicher zu machen. In den USA nutzt Benson Hill sein Tool CropOS für die gentechnische Herstellung proteinreicher Erbsen und Sojabohnen. Das niederländische Startup Hudson River Biotechnology wiederum hat kürzlich AccelATrait vorgestellt – ein Tool, das gemeinsam mit der deutschen KI-Firma Computomics entwickelte wurde und bei bisher nur schwer editierbaren Pflanzenarten zum Einsatz kommen soll.
Was die Kombo von CRISPR und KI für Firmen so interessant macht, sind die Einsparungen an Zeit und Kosten, die durch die Vorhersagemodelle möglich werden. Mussten die Firmen früher mit langwierigen und teuren Experimenten ermitteln, welche Auswirkungen eine Geneditierung hat, können sie heute im Computer simulieren, welche Eigenschaft eine Pflanze nach einem Erbguteingriff hat. Ein Beispiel dazu: Die US-Firma TreeCo arbeitet an der Herstellung von Pappeln, die weniger Lignin bilden und dadurch die Papierherstellung erleichtern sollen. Sie hat dazu als erstes am Computer für die 21 Gene, die an der Ligninsynthese beteiligt sind, mehr als 69`000 mögliche Editierungsstrategien simuliert. Nur die sieben vielversprechendsten Kombinationen von Genveränderungen hat sie dann mit CRISPR im Pappelerbgut erzeugt. Im Gewächshaus wiesen einige der so erzeugten Pappeln bis zu 49 Prozent weniger Lignin auf.
10 Millionen simulierte Mutationen
Ob die Startups bereits die neuen, generativen KI-Technologien einsetzen, bleibt in den meisten Fällen Geschäftsgeheimnis. Eine Ausnahme ist Inari, eine vor acht Jahren in den USA gegründete Firma, die sich selbst auch The SEEDesign Company nennt. Sie hat 2022 FloraBERT vorgestellt – ein Vorhersage-Tool, das auf neuster KI beruht und auf Genschalter, sogenannte Promotoren, spezialisiert ist. Trainiert mit Promotorsequenzen aus dem Erbgut von 93 Pflanzenarten und 25 verschiedener Maissorten, lässt sich mit FloraBERT nun für mehrere Maisgewebe vorhersagen, wie sich Änderungen in den Promotoren auf die Genaktivität auswirken. Der Marktwert von Inari ist seit der Präsentation von FloraBERT auf 1,65 Milliarden US-Dollar gestiegen.
Jüngst ist auch Google in die Pflanzenzüchtung eingestiegen. Der Tech-Gigant hat gemeinsam mit Instadeep AgroNT entwickelt – ein genomisches Sprachmodell, das auf 10 Millionen Erbgutsequenzen von 48 Pflanzenarten beruht. Was mit dem Ende 2023 vorgestellten Modell möglich ist, haben die beiden Firmen am folgenden Beispiel gezeigt: Sie haben mit AgroNT im Maniok-Erbgut mehr als 10 Millionen (!) Mutationen simuliert und für jede einzelne bewertet, wie sie sich auf die Genaktivität in der Pflanze auswirkt.
Neue generative KI-Systeme beschleunigen gentechnische Eingriffe an Mikroben. Mithilfe Millionen Gensequenzen von Bakterien und Viren können Forschende neben Genomanalyse und Simulation von genetechnischen Veränderungen Genome von Grund auf neu entwerfen.
Unmengen an biologischen Daten
FloraBERT und AgroNT sind die beiden ersten öffentlichen genomischen Basismodelle für Pflanzen. Sie dürften der Genomeditierung einen weiteren Produktivitätsschub verleihen und die Herstellung editierter Sorten nochmals beschleunigen. Auch für die Gentechnik bei Mikroorganismen stehen bereits zwei dieser neuen generativen KI-Systeme bereit. Neben dem oben erwähnten EVO gibt es noch GenSLM. Das von mehreren US-Universitäten und dem Chip-Hersteller NVIDIA entwickelte System basiert auf über 110 Millionen Gensequenzen von Bakterien und Viren. Wie EVO können Forschende auch GenSLM nicht nur dafür einsetzen, Genome zu analysieren und die Auswirkungen von gentechnischen Veränderungen zu simulieren. Sie können die generative KI auch dazu verwenden, Gene und Genome von Grund auf neu zu entwerfen.
Bald dürfte es ein drittes genomisches Basismodell für Mikroorganismen geben. 2023 hat Gingko Bioworks, ein weltweit führendes Unternehmen im Bereich der Synthetischen Biologie, eine Kooperation mit Google gestartet. Das Ziel: Die Konstruktion von Gentech-Mikroben leichter machen. Google steuert sein KI-Knowhow bei, Gingko seine Unmengen an biologischen Daten: Zwei Milliarden Gensequenzen plus Daten aus den über 100 Millionen jährlich kreierten Genomeditierungen. Das geplante Basismodell ist zwar vorerst für die Entwicklung von Medikamenten vorgesehen, dürfte aber auch in Gingkos Agrarabteilung zum Einsatz kommen. Dort arbeitet die Firma unter anderem mit Bayer zusammen an Gentech-Bakterien, die bei Getreide für die Stickstoff-Düngung einsetzbar sind.
Bild: Shutterstock, KI-generiertes Bild
Ebenfalls KI-basiert: Protein-design-Tools bringen neue Dimensionen in die Gentechnik. Es sollen neuartige Proteine entstehen, etwa Enzyme, die die Fotosynthese effektiver machen.
Milionen eingesparter Arbeitsjahre
Während es erst wenige genomische Basismodelle gibt, sind in den letzten fünf Jahren bereits über 50 KI-Tools entstanden, mit denen Forschende Proteine analysieren und generieren können. Neben einer Reihe akademischer Labore und Startups mischen hier auch Tech-Konzerne mit. Die beiden Software-Giganten Microsoft und Salesforce, der Internetkonzern Meta, dem Facebook und Instagram gehören, und ByteDance, der Konzern hinter TikTok – sie alle bieten KI-Werkzeuge an, die Proteinsequenzen verstehen oder generieren können. Das berühmteste Tool ist Alphafold von Google. Innerhalb eines Jahres hat es die 3D-Strukturen von über 200 Millionen Proteinen entschlüsselt – eine Aufgabe, für die Forschende ohne leistungsstarke KI Millionen von Arbeitsjahren benötigt hätten. Laut Demis Hassabi, dem Kopf von Googles KI-Abteilung, ist Alphafold seit dem Open-Sourcing im Jahr 2021 von über einer Million Forschenden aus 190 Ländern eingesetzt worden.
Wie genomische Sprachmodelle bringen auch Proteindesign-Tools einen neuen Schub in die Gentechnik. Denn mit den Genen, die für new-to-nature-Proteine codieren, lassen sich letztendlich auch neuartige Pflanzen und Mikroben gentechnisch herstellen. Die Firma Arzeda zum Beispiel will mit KI eine neue Version von Rubisco entwerfen – das ist das Protein, mit dem Pflanzen CO2 aus der Luft fixieren und so Kohlenstoff in die Nahrungskette einschleusen. Gentech-Pflanzen mit einem neu designtem Rubisco sollen dereinst mehr Ertrag bringen.
Disruptive Konvergenz
Generative KI und CRISPR gelten beide als disruptive Technologien. Wenn sie jetzt in den Forschungslaboren konvergieren, verändern sie dort nicht nur grundlegend die Art und Weise, wie Gentechnik betrieben wird, sie werden auch zu Organismen führen, deren Herstellung zuvor nicht möglich war. Die Erwartungen und Versprechen der Startups und Tech-Giganten, die die Konvergenz vorantreiben, sind denn auch hoch. Doch während die KI-Tools in die Labore kommen, wachsen unter den AkteurInnen auch die Sorgen. «Es gibt Bedenken hinsichtlich eines möglichen Missbrauchs, sozialer und gesundheitlicher Ungerechtigkeit und Umweltzerstörung», schreiben die Firmen hinter EVO, als sie im Februar 2024 ihr genomisches Basismodell vorstellen. Sie empfehlen Leitlinien zu entwickeln, die ethische Praktiken beschreiben und den Rahmen für einen verantwortungsvollen Einsatz der KI-Tools bilden sollen. Ähnlich klingt es an einem Kongress zum KI-gestützten Proteindesign, der im März 2024 stattfand. Eine Gruppe von über 100 Forschenden warnte dort vor neuen Biowaffen, die mit den KI-Tools möglich werden, und verpflichtete sich, ausschließlich zum Wohle der Gesellschaft zu forschen und gefährliche Praktiken zu vermeiden.
Der Ruf nach Selbstregulierung und -verpflichtung ist zu begrüssen. Doch ob er ausreicht für einen gemeinwohlorientierten Umgang mit der KI-CRISPR-Konvergenz? Wenn eine kleine Tech-Elite mit Geldern milliardenschwerer Tech-Giganten Tools mit Risiken entwickelt, bei deren Eintreten die Bevölkerung oder die Umwelt leiden würden, sollten Politik und Gesellschaft mitreden und für eine angemessene staatliche Regulierung sorgen. Die Diskussionen dazu sollten bald beginnen. Denn die Geschwindigkeit, mit der sich die generative KI entwickelt, ist atemberauend.
In einem Interview mit ChatGPT zur CRISPR-KI-Konvergenz sagt der Bot unter anderem (siehe Seite 18): «Der kombinierte Einsatz von generativer KI und Gentechnik kann potenzielle Gefahren für Mensch und Umwelt bergen, insbesondere wenn sie nicht angemessen kontrolliert oder reguliert werden.»
Autor
Benno Vogel ist freischaffender Biologe in Winterthur und Berlin. Seit 25 Jahren bietet er Beratungen zu Gen- und Biotechnologie für NGOs und Behörden an