GPT-3 ist der wohl fortschrittlichste Textgenerator der Welt. Seine Entwicklung kostet Milliarden von Dollar, hat einen enormen CO2-Fußabdruck und wurde von einigen der weltweit führenden KI-Experten anhand eines der größten jemals kuratierten Datensätze trainiert. Und trotz alledem ist sie auch von Natur aus bigott.
Im Vergleich zu anderen Religionen zeigt das Modell durchweg eine viel höhere Rate an Gewaltäußerungen, wenn das Wort „Muslim“ in der Aufforderung enthalten ist.
Dies zeigt objektiv, dass GPT-3 mit größerer Wahrscheinlichkeit „Gewalt“ mit Muslimen assoziiert. Dies hat nichts mit tatsächlichen Vorfällen muslimischer Gewalt zu tun, da GPT-3 nicht auf der Grundlage realer, faktengeprüfter Daten trainiert wurde, sondern auf der Grundlage menschlicher Stimmungen, die von Websites wie Reddit stammen.
Soweit wir wissen, wurde GPT-3 in erster Linie auf englischsprachige Daten trainiert, so dass die Wahrscheinlichkeit groß ist, dass antimuslimische Vorurteile im Datensatz stärker ins Gewicht fallen als bei einem Training auf Arabisch oder anderen Sprachen, die am häufigsten mit der Religion in Verbindung gebracht werden.
Auf der Grundlage der Ergebnisse der Stanford/McMaster-Studie können wir genau feststellen, dass GPT-3 voreingenommene Ergebnisse in Form von neuartigen bigotten Aussagen erzeugt. Es kotzt nicht einfach nur rassistisches Zeug aus, das es online gelesen hat, sondern es erfindet tatsächlich seinen eigenen neuen bigotten Text.
Es kann auch eine Menge anderer Dinge tun, aber es ist eine wahre Aussage, dass GPT-3 der fortschrittlichste und teuerste Bigotterie-Generator der Welt ist.
Und deshalb ist es auf eine Weise gefährlich, die wir vielleicht nicht sofort erkennen. Es gibt offensichtliche Gefahren, die über die Sorge hinausgehen, dass jemand damit dumme Witze über „einen Muslim, der in eine Bar gegangen ist“ machen könnte. Wenn es unendlich viele antimuslimische Witze erzeugen kann, kann es auch unendlich viel Propaganda erzeugen. Aufforderungen wie „Warum sind Muslime schlecht“ oder „Muslime sind gefährlich, weil“ können bis zum Gehtnichtmehr eingegeben werden, bis etwas herauskommt, das für den menschlichen Verzehr schlüssig genug ist.
Im Grunde genommen könnte eine solche Maschine Bigotterie in großem Maßstab automatisieren, mit weitaus größerer Wirkung und Reichweite als jede Trollfarm oder jedes Bot-Netzwerk.
Die wirkliche Befürchtung ist, dass die Forscher unmöglich alle Möglichkeiten berücksichtigen können, wie es von Fanatikern benutzt werden könnte, um Schaden anzurichten.
Auf einer gewissen Ebene ist die Diskussion rein akademisch. Wir wissen, dass GPT-3 von Natur aus bigott ist, und wie heute berichtet wurde, wissen wir, dass es Gruppen gibt, die daran arbeiten, es für den öffentlichen, quelloffenen Gebrauch zurückzuentwickeln.
Das heißt, die Katze ist bereits aus dem Sack. Welchen Schaden GPT-3 oder ein ähnlich voreingenommener und leistungsfähiger Textgenerator auch immer anrichten kann, liegt in den Händen der Allgemeinheit.
Letztendlich können wir ohne den Schatten eines Zweifels sagen, dass die „Ansicht“ von GPT-3 fälschlicherweise gegen Muslime voreingenommen ist. Vielleicht ist sie auch gegenüber anderen Gruppen voreingenommen. Das ist das zweite Problem: Wir haben buchstäblich keine Möglichkeit zu wissen, warum GPT-3 irgendeinen Text erzeugt. Wir können die Blackbox nicht öffnen und ihren Prozess zurückverfolgen, um zu verstehen, warum sie ihre Ausgabe erzeugt.