Kann KI Versuchstiere retten? – Die Realisierbarkeit der "Generativen KI-gestützten Arzneimittelentwicklung", die die Anzahl der Mäuse um 30–50 % reduzieren könnte

Kann KI Versuchstiere retten? – Die Realisierbarkeit der "Generativen KI-gestützten Arzneimittelentwicklung", die die Anzahl der Mäuse um 30–50 % reduzieren könnte

Kann KI Versuchstiere retten? – Die Realisierbarkeit von „Generative AI Drug Discovery“, das die Anzahl der Mäuse um 30–50 % reduzieren könnte

In der Entwicklung neuer Medikamente gibt es seit langem eine unvermeidliche Frage.
„Kann man zuverlässige wissenschaftliche Ergebnisse erzielen, ohne möglichst viele Tiere zu verwenden?“

Aus ethischer Sicht ist es besser, die Anzahl der in Experimenten verwendeten Tiere so gering wie möglich zu halten. Aus wissenschaftlicher Sicht jedoch sind Experimente mit zu wenigen Tieren anfällig für zufällige Schwankungen. Um zu beurteilen, ob ein Arzneimittelkandidat tatsächlich wirksam ist oder ob es nur zufällig so aussieht, sind eine ausreichende Anzahl von Daten erforderlich, um Sicherheit und Wirksamkeit zu bewerten.

Eine Studie, die versucht, dieses Dilemma mit generativer KI anzugehen, ist aufgetaucht. Ein Forscherteam der Goethe-Universität Frankfurt, der Philipps-Universität Marburg und des Fraunhofer ITMP hat eine generative KI namens „genESOM“ entwickelt. Ziel ist es, die Anzahl der in präklinischen Studien verwendeten Versuchstiere, insbesondere Mäuse, zu reduzieren und gleichzeitig die Zuverlässigkeit der Forschungsergebnisse zu gewährleisten.

Laut der Veröffentlichung könnte genESOM die Anzahl der Tiere in explorativen pharmakologischen Studien um 30–50 % reduzieren. Dies ist nicht nur eine Frage der Effizienz. Sollte die Technologie in die Praxis umgesetzt werden, könnte sie erhebliche Auswirkungen auf die Kosten der Arzneimittelentwicklung, die Forschungsethik, das Tierwohl und die Diskussion über die wissenschaftliche Nutzung von KI haben.


„KI ersetzt nicht Tierversuche“, sondern „unterstützt weniger Experimente“

Wichtig bei dieser Studie ist, dass genESOM keine Technologie ist, die Tierversuche vollständig ersetzt.

Der Begriff generative KI lässt leicht an KI denken, die Texte oder Bilder erstellt. Doch genESOM generiert keine Texte oder Bilder, sondern neue Datenpunkte, die den Eigenschaften von experimentellen Daten ähneln. Die Forscher lassen die KI die bereits gewonnenen Daten aus Mäuseexperimenten lernen und deren innere Struktur verstehen. Dadurch wird es möglich, Daten zu generieren, die so aussehen, als wären sie von einer größeren Anzahl von Tieren gewonnen worden, obwohl tatsächlich keine zusätzlichen Tiere verwendet wurden.

Nehmen wir an, es gibt ein Wirksamkeitsmuster, das ursprünglich mit 26 Mäusen überprüft wurde. Selbst wenn die statistische Signifikanz bei nur 18 Mäusen verloren geht, könnte genESOM durch das Erlernen der Datenstruktur und die Erstellung zusätzlicher Daten im geeigneten Bereich möglicherweise Ergebnisse erzielen, die den ursprünglichen Experimenten nahekommen.

Dies ist weniger ein „Erhöhen“ imaginärer Mäuse im Labor, sondern eher ein sorgfältiges Lesen der Struktur der bereits beobachteten experimentellen Ergebnisse durch die KI, um Daten zu ergänzen, die als zusätzliche Messwerte in diesem Bereich plausibel erscheinen.

Es gibt jedoch einen wichtigen Vorbehalt. Die von der KI erstellten Daten basieren auf den tatsächlich aus Experimenten gewonnenen Daten. Wenn die ursprünglichen experimentellen Daten zu gering oder voreingenommen sind, könnte die KI diese Verzerrungen und zufälligen Geräusche verstärken. Mit anderen Worten, genESOM sollte nicht als „Magie, die Experimente überflüssig macht“, sondern als „Technologie, die den Spielraum zur Reduzierung der Anzahl der Tiere erweitert, basierend auf ausreichenden realen Daten“ betrachtet werden.


Der Schlüssel zur Forschung liegt in einem System, das „Fehler nicht übermäßig vergrößert“

Eines der beängstigendsten Probleme bei der Verwendung generativer KI in der wissenschaftlichen Forschung ist der „plausible Fehler“.

Bei textgenerierenden KIs kann es vorkommen, dass sie nicht existierende Arbeiten oder Fakten selbstbewusst präsentieren. Auch bei der Generierung von experimentellen Daten besteht die Gefahr, dass Daten erstellt werden, die zwar natürlich aussehen, aber wissenschaftlich bedeutungslos sind. Besonders problematisch ist es, wenn nicht nur die tatsächlich interessierenden Signale in der Forschung, sondern auch zufällige Schwankungen vergrößert werden, sodass Variablen, die eigentlich keine Wirkung haben sollten, fälschlicherweise als wichtig erscheinen.

Dieses Problem wird als „Fehlerinflation“ bezeichnet. Einfach ausgedrückt: Je mehr Daten die KI generiert, desto mehr dehnen sich auch die Fehler aus.

Ein Merkmal von genESOM ist, dass es ein System zur Überwachung dieser Fehlerinflation integriert hat. Das Forschungsteam hat die Phase, in der die KI die Datenstruktur lernt, und die Phase, in der neue Daten generiert werden, getrennt. Darüber hinaus wurde ein künstliches Fehlersignal in den Generierungsprozess integriert, sodass gemessen werden kann, wie weit sich dieser Fehler ausbreitet.

Durch dieses System kann entschieden werden, die Generierung zu stoppen, bevor die KI zu viele Daten erstellt und die wissenschaftliche Validität beeinträchtigt. Mit anderen Worten, genESOM ist nicht nur eine „KI, die Daten vermehrt“, sondern auch eine „KI, die beobachtet, wie weit die Daten vermehrt werden dürfen“.

Dies ist ein sehr wichtiger Punkt, wenn es darum geht, die Reduzierung von Tierversuchen zu betrachten. Auch wenn es ein ethisches Ziel gibt, die Anzahl der Tiere zu reduzieren, würde eine wissenschaftlich falsche Bewertung der Arzneimittelwirksamkeit letztendlich Risiken für klinische Studien am Menschen und Patienten mit sich bringen. Tierschutz und wissenschaftliche Zuverlässigkeit müssen in Einklang gebracht werden, ohne dass eines von beiden geopfert wird.


Von 18 Mäusen zu Ergebnissen, die denen von 26 Mäusen nahekommen

Das Forschungsteam hat die Leistungsfähigkeit von genESOM anhand von Daten aus früheren präklinischen Studien zu einem Multiple-Sklerose-Modell überprüft.

In der ursprünglichen Studie wurden 26 Mäuse in drei Behandlungsgruppen aufgeteilt, um die Wirkung eines experimentellen Medikaments zu untersuchen. Das Forschungsteam reduzierte diese Daten absichtlich auf 18 Mäuse, also sechs pro Gruppe, und simulierte, „was passieren würde, wenn von Anfang an mit weniger Tieren experimentiert worden wäre“.

Das Ergebnis war, dass bei nur 18 Mäusen die in der ursprünglichen Studie beobachtete Behandlungseffektivität verschwand. Es gab keinen signifikanten Unterschied in den statistischen Tests, und selbst mit maschinellem Lernen konnten die Unterschiede zwischen den Behandlungsgruppen nicht gut unterschieden werden. Dies ist ein häufiges Problem bei Studien mit kleinen Stichproben. Selbst wenn eine Wirkung vorhanden ist, kann sie aufgrund der geringen Datenmenge nicht erkannt werden.

Dann wurde genESOM verwendet, um zusätzliche Daten aus den 18 realen Daten zu generieren. Dadurch tauchte der in den ursprünglichen 26-Mäuse-Experimenten beobachtete Effekt wieder in einer Form auf, die dem ursprünglichen Signifikanzniveau nahekam. Außerdem gab es keine auffällige Zunahme von falsch positiven Ergebnissen, bei denen bedeutungslose Variablen fälschlicherweise als wichtig angesehen wurden.

Laut dem Forschungsteam wurden auch andere komplexe Deep-Learning-Modelle ausprobiert, aber in diesem Fall funktionierten sie nicht so gut wie genESOM. Dies zeigt, dass es für die Ergänzung wissenschaftlicher Daten nicht ausreicht, einfach große und komplexe KI zu verwenden. Für kleine biomedizinische Daten sind Designs erforderlich, die die Struktur und Fehler von kleinen Datenmengen berücksichtigen.


Die Reduzierung von Tierversuchen steht im Einklang mit dem „3R“-Prinzip

In internationalen Diskussionen über Tierversuche wird seit langem das „3R“-Prinzip betont.
Es umfasst Replacement, Reduction und Refinement.

Replacement bedeutet die Ersetzung durch Methoden, die keine Tiere verwenden.
Reduction bedeutet die Reduzierung der Anzahl der verwendeten Tiere.
Refinement bedeutet die Verbesserung von Experimentiermethoden, um das Leiden der Tiere so weit wie möglich zu verringern.

Das genESOM bezieht sich stark auf die Reduktion. Es ist keine Technologie, die Tierversuche vollständig abschafft, aber es könnte die Anzahl der Tiere, die erforderlich sind, um dasselbe wissenschaftliche Ziel zu erreichen, reduzieren.

Diese Position ist auch realistisch. In den letzten Jahren haben sich Technologien, die Tierversuche ersetzen oder ergänzen, wie Organoide, Organ-on-a-Chip, Computersimulationen und Tests mit menschlichen Zellen, schnell entwickelt. Dennoch können nicht alle Phasen der Arzneimittelentwicklung sofort ohne Tiere durchgeführt werden. In Situationen, in denen komplexe Wechselwirkungen wie Immunreaktionen, Stoffwechsel und Auswirkungen auf das Nervensystem des gesamten Körpers bewertet werden müssen, werden weiterhin Tiermodelle verwendet.

Deshalb wird derzeit nicht nach einem „Alles-oder-Nichts“-Ansatz gesucht, sondern nach Technologien, die „notwendige Experimente weniger und präziser machen“. genESOM befindet sich in dieser realistischen Zwischenposition.


Mögliche Reaktionen in sozialen Medien – Erwartungen, Skepsis und Ethik

Die Reaktionen auf diese Nachricht in den sozialen Medien waren zum Zeitpunkt der Veröffentlichung des Artikels noch begrenzt, da die Anzahl der öffentlich zugänglichen Kommentare und Verbreitungen noch gering war. Auch auf Phys.org war die Anzahl der geteilten Inhalte zum Zeitpunkt der Überprüfung gering, und die Kommentarspalte war nicht stark in Bewegung.

Dieses Thema wird jedoch in den sozialen Medien leicht diskutiert. Denn es vereint Schlüsselwörter wie „KI“, „Tierversuche“, „Arzneimittelentwicklung“ und „Ethik“, die sowohl Emotionen als auch Wissenschaft berühren.

Zunächst wird es wohl positive Stimmen geben.
„Wenn wir die Anzahl der Versuchstiere reduzieren können, ist das großartig.“
„Das ist eine ziemlich gute Anwendung von KI.“
„Wenn es zur Vereinbarkeit von Tierschutz und Forschung beiträgt, möchte ich es unterstützen.“
Solche Reaktionen sind natürlich. Generative KI wird oft wegen Urheberrechtsproblemen, Auswirkungen auf die Beschäftigung und Fehlinformationen kritisiert. In diesem Zusammenhang wird eine Nutzung, die das Potenzial hat, das Opfer von Tieren zu reduzieren, relativ positiv aufgenommen.

Andererseits wird es sicherlich auch vorsichtige Stimmen geben.
„Sollten wir von KI erstellte Daten als Experimentergebnisse behandeln?“
„Besteht nicht die Gefahr, dass KI günstige Ergebnisse verstärkt?“
„Wird dies nicht von Pharmaunternehmen als Vorwand zur Kostensenkung genutzt?“
Solche Bedenken sind berechtigt. Von KI erstellte Daten sind nicht die Realität selbst. Egal wie geschickt sie erstellt wurden, sie sollten von direkt in Experimenten beobachteten Daten unterschieden werden. In wissenschaftlichen Arbeiten und bei der regulatorischen Überprüfung muss klar angegeben werden, wie synthetische Daten erstellt wurden und in welchem Umfang sie verwendet wurden.

Darüber hinaus könnten aus der Perspektive derjenigen, die Tierversuche ablehnen, Stimmen laut werden, dass „eine Reduzierung um 30–50 % nicht ausreicht“. Für Menschen, die das Leiden von Tieren als Problem betrachten, ist die Reduzierung ein Fortschritt, aber das ultimative Ziel ist der vollständige Ersatz. Umgekehrt könnten Forscher und medizinische Fachleute Bedenken äußern, dass „wenn die Reduzierung der Anzahl der Tiere zu sehr zum Ziel wird, die Sicherheitsbewertung von Medikamenten nachlässig wird“.

Das Interessante an dieser Nachricht ist, dass sie nicht einfach mit „KI ist großartig“ endet. KI könnte Tiere retten. Aber es besteht auch die Gefahr, dass KI falsches Vertrauen in die Wissenschaft bringt. Deshalb werden nicht nur die Technologie selbst, sondern auch Betriebsregeln, Transparenz, Regulierung und Forschungsethik gleichzeitig in Frage gestellt.


Wie weit können wir „von KI erstellten Daten“ vertrauen?

Die Ergänzung von Daten durch generative KI wird in den Bereichen Medizin und Biologie bereits aufmerksam verfolgt. Patientendaten unterliegen erheblichen Datenschutzbeschränkungen, und bei seltenen Krankheiten gibt es ohnehin nur wenige Fälle. Auch in der präklinischen Forschung ist es aus Kosten- und ethischen Gründen nicht einfach, riesige Datensätze zu erstellen.

Daher besteht ein großer Bedarf an Technologien, die aus wenigen Daten lernen und innerhalb eines statistisch angemessenen Rahmens ergänzende Daten erstellen können. Doch hier stellt sich die Frage, ob „es so aussieht, als ob die Daten zugenommen haben“ und „das Wissen zugenommen hat“ dasselbe ist.

Selbst wenn sich die Anzahl der Datenpunkte von 100 auf 200 erhöht, steigt die Zuverlässigkeit der Forschung nicht, wenn der zusätzliche Teil das reale Phänomen nicht korrekt widerspiegelt. Vielmehr besteht die Gefahr, dass nur die scheinbare Präzision zunimmt und falsche Schlussfolgerungen mit Zuversicht gezogen werden.

Ein Punkt, an dem genESOM bewertet wird, ist, dass das Forschungsteam dieses Risiko direkt angeht. Fehlerüberwachung, Stoppkriterien und die Unterdrückung von falsch positiven Ergebnissen sind Mechanismen, die die Schwächen der Nutzung synthetischer Daten berücksichtigen. Wenn KI in die Wissenschaft eingeführt wird, kann es wichtiger sein, „nicht zu viel zu erstellen“ als „es erstellen zu können“.


Auswirkungen auf die pharmazeutische Forschung

Sollte eine Technologie wie genESOM weit verbreitet werden, könnte sich das Design präklinischer Studien ändern.

Erstens könnte die Anzahl der Tiere, die in den frühen Phasen explorativer Studien benötigt werden, reduziert werden. In der Phase, in der es viele Arzneimittelkandidaten gibt, ist es nicht realistisch, alle Kandidaten in groß angelegten Tierversuchen zu testen. Wenn wenige experimentelle Daten durch KI ergänzt werden und vielversprechende Kandidaten eingegrenzt werden können, steigt die Effizienz der Forschung.

Zweitens steigt der Wert der in der Vergangenheit gesammelten experimentellen Daten. Da genESOM aus realen Daten lernt, werden qualitativ hochwertige historische Daten wichtig. Forschungseinrichtungen und Unternehmen werden stärker motiviert sein, Daten zu organisieren und in einer wiederverwendbaren Form zu verwalten.

Drittens wird die Beziehung zu den Regulierungsbehörden wichtig. Inwieweit können von KI generierte Daten in der präklinischen Bewertung verwendet werden? In welcher Phase werden sie als ergänzende Informationen behandelt und in welcher Phase ist eine erneute Bestätigung durch Experimente erforderlich? In der Arzneimittelentwicklung ist nicht nur die wissenschaftliche Validität, sondern auch die regulatorische Akzeptanz der Schlüssel zur praktischen Umsetzung.

Insbesondere bei der Entscheidung, zu klinischen Studien am Menschen überzugehen, ist es schwer vorstellbar, sich ausschließlich auf von KI generierte Daten zu verlassen. Vielmehr ist es wahrscheinlich, dass sie vorerst in Bereichen wie der Optimierung von Versuchsplänen, explorativen Analysen und der Priorisierung zusätzlicher Experimente verwendet werden.


Drei Missverständnisse, die vermieden werden sollten

Beim Lesen dieser Nachricht gibt es drei Punkte, die leicht missverstanden werden können.

Erstens das Missverständnis, dass „KI Tierversuche überflüssig macht“. Die aktuelle Technologie erstellt keine Ergebnisse ohne reale Daten. Vielmehr setzt sie voraus, dass genügend tatsächlich gewonnene Daten vorhanden sind.

Zweitens das Missverständnis