In den letzten Monaten wurde vor allem in angelsächsischen Kreisen viel über die Verbreitung neuer Systeme »künstlicher Intelligenz« gesprochen, die die geistige Arbeit und das Leben des Durchschnittsbürgers unterstützen sollen. Wir sagen »künstliche Intelligenz« in Anführungszeichen, weil es sich dabei in der Tat nicht um Intelligenz im landläufigen Sinne des Wortes handelt. Die menschliche Spezies ist eine mit Intelligenz ausgestattete Spezies, wie Engels lehrt (in seinem Artikel über den »Anteil der Arbeit an der Menschwerdung des Affen«)[1], weil sie eine Spezies mit einer gesellschaftlichen Struktur ist, die auf der Existenz gesellschaftlicher Arbeit aufgebaut ist. Wenn es keine gesellschaftliche Arbeit gäbe, wäre der Mensch nur ein Affe ohne Intelligenz im wahrsten Sinne des Wortes. Das menschliche Bewusstsein hat weder in der natürlichen noch in der künstlichen Welt seinesgleichen. Die heutige so genannte »künstliche Intelligenz« ist nichts anderes als ein Sprachmodell, das seine Antworten so gestaltet, wie der Benutzer es angeblich will (mit einer statistischen Vorhersage, völlig ohne Bewusstsein). Im Folgenden werden wir einige Beispiele dafür anführen. Das doppelte Problem dessen, was in den letzten Monaten passiert ist, ist folgendes: Einerseits steht die entwickelte Technologie, obwohl sie ausserordentlich mächtig ist, unter der Kontrolle einer sehr kleinen Anzahl von gigantischen Unternehmen nordamerikanischer Herkunft;[2] andererseits interagiert die Existenz dieses Sprachmodells wie jede Technologie mit dem Leben der Bevölkerung und vor allem mit dem, was das Proletariat daraus machen soll und kann. Letztendlich handelt es sich um ein einziges, doppelseitiges Problem, das sich natürlich aus dem kapitalistischen System und den Kriterien des internationalen Wettbewerbs auf dem Markt ableitet, was in der gegenwärtigen imperialistischen Phase des Kapitalismus natürlich zu einer monopolistischen Konzentration der fortschrittlichsten Technologien führt.
Analysieren wir zunächst den Faktor des Besitzes der Technologie in den Händen dieser wenigen riesigen Unternehmen. Die Technologie, von der wir sprechen, zielt, wie bereits erwähnt, auf die Programmierung von Konversations- und Suchsystemen ab, die das tägliche Leben Aller erleichtern sollen. Anstatt im Internet nach einer Information zu suchen, gründlich zu recherchieren und verschiedene Quellen zu vergleichen, könnte man jede beliebige Information erhalten, indem man auf eine Schaltfläche klickt, eine einfache Frage stellt und eine artikulierte und scheinbar natürliche Antwort erhält. Es ist offensichtlich, dass dieses System die Fähigkeit des Einzelnen, Quellen zu suchen und zu vergleichen, verkümmern lässt und auch den Aufbau eines völlig oberflächlichen Wissens stark begünstigt, aber für den Durchschnittsbürger zählt nur eine einfache, schnelle, leicht zu findende, aber dennoch formal korrekte Antwort. Das ist auch der Grund, warum der revolutionäre Marxismus dort nicht verbreitet wird.[3]
Diese Technologie beruht nicht auf einer aussergewöhnlichen höheren Intelligenz, sondern einfach auf einem mathematischen Grundsystem: Wenn ich einer Maschine genügend Beispiele für Anfragen, Antworten und Behauptungen liefere, kann die Maschine, die über eine ausreichende Datenbank verfügt, die Anfragen realistisch beantworten. Die Maschine versteht jedoch nicht wirklich, was sie gefragt wird, sondern verarbeitet nur die Daten so, dass die Antwort realistisch ist. Kurz gesagt, es handelt sich nicht um einen bewussten Prozess, sondern um einen vollständig mechanischen und mathematischen Prozess, der aus relativ einfachen Gleichungen abgeleitet wird. Was diese Systeme ausserordentlich beeindruckend macht, ist die Natürlichkeit der Antworten, die so klingen, als würden sie von einer echten Person formuliert: Dies geschieht hauptsächlich, weil das Modell mit einer grossen Menge an Beispielgesprächen »trainiert« wurde, die es nachahmen soll.[4]
Das Problem bei der Entwicklung dieser Technologien ist, dass sie, um zu funktionieren, notwendigerweise über riesige Datenbanken mit digitalen Daten und nachzuahmenden Beispielen verfügen müssen, die angesichts ihres Umfangs in der Regel sehr schwer zu beschaffen und sehr teuer in der Wartung sind. Diese Datenbanken sind daher nur für sehr grosse Organisationen zugänglich, die bereit sind, Milliarden auszugeben, um einen funktionierenden Prototypen zu erhalten, der vermarktet werden kann. Eine Möglichkeit, dieses System zu vermarkten, besteht darin, den Zugang zu Abfragen zu beschränken, die kostenlos durchgeführt werden können, und für weitere Abfragen eine Gebühr zu verlangen.[5]
Wie dem auch sei, die aktuelle Situation ist folgende: Ein Unternehmen (Microsoft) hat das beste Unternehmen auf dem Markt, OpenAI, gekauft (das übrigens mit dem Ziel gegründet wurde, alle Projekte und Programmiercodes zu veröffentlichen, was Microsoft nach dem Kauf nicht einhielt), und das beste Sprachmodell, das heute im Umlauf ist, Chat-GPT, vermarktet. Als Gegenreaktion veröffentlichten andere Unternehmen (z. B. Google mit seinem Bard) schnell ihre eigenen proprietären Modelle, die zugegebenermassen noch lückenhaft sind. Trotzdem ist ein weltweiter Kampf um diesen neuen Markt und seine Anteile entbrannt. Nach Marx’ Gesetzen des Kapitalausgleichs hat jedes grosse Technologieunternehmen sein Kapital in diese noch unerforschte und gewinnträchtige Branche gesteckt, was zu einem harten Wettbewerb geführt hat.
Der Wettbewerb ist noch nicht abgeschlossen, aber einige bemerkenswerte Fakten sind bereits offensichtlich: Erstens ist klar, dass das ursprüngliche Projekt von OpenAI, »künstliche Intelligenz« der Öffentlichkeit kostenlos (oder fast kostenlos) und transparent zur Verfügung zu stellen, an der kapitalistischen Privatisierung gescheitert ist; zweitens ist klar, dass die alleinige Kontrolle über diese Werkzeuge durch riesige Unternehmen ihnen eine enorme Kontrolle über die Weltkultur und die Quellen, die die Menschen für ihre Bildung und Forschung nutzen, ermöglicht. Und das aus gutem Grund: Das Internet ist bereits zu einem wesentlichen und weit verbreiteten Werkzeug geworden, mit 1,16 Milliarden Nutzern seit seiner Kommerzialisierung, was mehr als einem Achtel der Weltbevölkerung entspricht. Wie viele andere Werkzeuge im Internet ist dieses Werkzeug, anstatt kostenlos und frei nutzbar durch einen öffentlich offengelegten Code zu sein, nun in den Händen skrupelloser Geschäftsleute, die daraus Profit schlagen wollen, indem sie die mathematischen Prozesse, die ihren Produkten zugrunde liegen, verheimlichen.[6]
Der zweite Aspekt des Problems, der eher politischer und weniger wirtschaftlicher Natur ist, ist der Einfluss, den dieses System auf Kultur und Gesellschaft haben kann. Es handelt sich um ein System, das darauf ausgelegt ist, dem Benutzer so wenig wie möglich zu widersprechen: Wenn er Fragen über erfundene Dinge stellt – wenn sie realistisch sind – wird das Programm so tun, als ob es diese Dinge kennt, und andere, ebenfalls erfundene Daten liefern. So kann z. B. eine Frage nach einer nicht existierenden historischen Person zu einer völlig erfundenen Biografie führen. Natürlich werden die echten Daten richtig verwendet (und liefern z. B. relativ genaue Biografien), aber wenn es um Erfindungen geht, tut das System alles, um dem Nutzer zu helfen.[7] Es ist klar, dass sich der Nutzer auf diese Weise, da er nicht mit Widersprüchen konfrontiert wird, sich in seiner Ideenwelt sicher glaubt, solange sie mit den bürgerlichen Werten von Freiheit und Demokratie übereinstimmen.
Tatsächlich ist das Modell so programmiert, dass es in jeder Diskussion und Argumentation immer die Werte der liberalen Gesellschaft verteidigt: Demokratie, die Souveränität der Volksabstimmung, die Verwendung gewaltfreier Mittel und die Legalität. Es handelt sich hierbei eindeutig um ein schlecht verborgenes System der Propaganda und der Meinungskontrolle. Je mehr sich solche KI-Systeme ausbreiten, je abhängiger die moderne Gesellschaft davon wird, desto mehr kann sich die demokratische und kapitalistische – bis in die Wurzeln verfaulte –Propaganda ausbreiten und sich unzweideutig als die einzig mögliche Interpretation der Welt darstellen. Im Falle spezifischer politischer Anfragen wird diese »künstliche Intelligenz« als unpolitisches Sprachmodell eine Antwort verweigern, aber die Demokratie wird ohnehin immer verteidigt. Tatsächlich nimmt sie sogar im Namen einer proklamierten Neutralität klare politische Positionen zugunsten der kapitalistischen Gesellschaft, in der wir leben, ein und versucht, alle vom selben zu überzeugen.[8]
Eine Partei wie die unsere, eine Partei, die sich den Fortschritt der Zivilisation auf die Fahne schreibt, kann nicht gegen den Fortschritt der Technologie sein, wenn sie der Menschheit hilft. Sie kann aber, wie es sich gehört, die räuberische Nutzung dieser Technologien durch skrupellose Kapitalisten anprangern, die im Namen der bürgerlichen Gesellschaft Instrumente, die der Menschheit helfen könnten, in Werkzeuge zur Verbreitung von Ideologien der Bosse und der bürgerlichen Demokratie verwandeln und darüber hinaus auch noch davon profitieren. Diese offene Schlacht im Bereich der »künstlichen Intelligenz« ist nichts anderes als ein weiterer Beweis für die Fäulnis, die das kapitalistische System in seinen Marktbeziehungen, in seinen kommerziellen Kämpfen um Kapital erreicht hat. Wir sind überzeugt, dass dieses System, wie so viele andere auch, nur mit dem Sieg des Sozialismus und der vollständigen Zerschlagung des Kapitalismus auf die effektivste, zivilisierteste und für die Menschheit vorteilhafteste Weise genutzt werden kann. Solange es Profit zu machen gibt, solange die Technologie der Logik des Kapitals unterworfen ist, wird es kein Instrument geben, das vollständig zum Wohle der Menschheit aufgebaut ist.
Anmerkungen (M&K):
[prev.] [content] [end]
siehe Friedrich Engels, »Dialektik der Natur«, MEW, Bd. 20, S. 444 [⤒]
Tatsächlich sind es nordamerikanische Unternehmen, die den Markt dominieren, aber auch in China wird erfolgreich an grossen Sprachmodellen gearbeitet. In Westeuropa hinkt man der globalen Entwicklung hinterher, investiert aber auch dort beträchtliche Summen in die Aufholjagd.[⤒]
In diesem Artikel werden nur die LLM’s angesprochen. Tatsächlich sind die Sprachmodelle nur ein kleiner aber mächtiger Teil der »künstlichen Intelligenz«. Andere Bereiche der KI konzentrieren sich auf Datenanalyse, Prozesssteuerung, Bild- Film- und Musikgenerierung und viele Anwendungsgebiete mehr.[⤒]
Dies ist eine sehr vereinfachte Form der Darstellung über die Funktionsweise der KI. Es gibt KI-Modelle die trainiert werden müssen – die Sprachmodelle z. B., es gibt aber auch viele »selbstlernende« KI-Modelle, die ohne Training auskommen. Tatsächlich lässt sich KI nicht auf »einen vollständig mechanischen und mathematischen Prozess« reduzieren, sondern basiert auf komplexen neuronalen Netzen nachempfundenen Algorithmen, deren genaue Funktionsweise bei der Datenprozessierung nicht wirklich nachvollzogen werden kann und die selbst schon Objekt wissenschaftlicher Forschung geworden ist – schon allein deshalb, um diese Systeme besser beherrschen zu können.[⤒]
Die KI-Sprachmodelle oder »large language models« sind an sich keine Datenbanken, sie werden aber aus Datenbanken mit Texten gefüttert, z. B. aus den im Internet zugänglichen textuellen Daten. Die LLM’s verarbeiten intern sogenannte »tokens«, Wortfetzen wenn man so will, die quasi statistisch innerhalb des Algorithmus gewichtet werden. Je mehr »tokens« ein solches System verarbeiten kann, um so mächtiger und genauer wirkt es. Und umso mehr Rechnerleistung muss für die Operationen aufgebracht werden.[⤒]
Natürlich gibt es auch frei verfügbare Sprachmodelle und die Programmierung von KI-Systemen ist generell kein Geheimnis. Da aber die Wirkmächtigkeit der Modelle von den verarbeiteten Datenmengen exponentiell abhängt sind nur Grossunternehmen zur Entwicklung entsprechender Modelle in der Lage.[⤒]
Dieses Problem der KI-Sprachmodelle ist als »Halluzinieren« bekannt. Die grossen Sprachmodelle versuchen dieses Verhalten der KI-Algorithmen zu kontrollieren, aber mit oft zweifelhaftem Erfolg. Aber auch die vermeintlich »richtigen« Daten sind oft fehlerhaft, nur 80 % der Antworten stimmen tatsächlich – werden aber meist ungefiltert vom technikgläubigen Nutzer übernommen. Die KI-ChatBots verhalten sich letztendlich wie der klassische »Klugscheisser«, der auf alles eine Antwort weiss, auch wenn er keine Ahnung hat.[⤒]
In der Tat, je mächtiger und trainierter die Sprachmodelle sind, um so stärker wirken politische Vorgaben auf das Antwortverhalten der Sprachmodelle – und die politischen Institutionen der Bourgeoisie erhöhen ebenso den Druck auf die Betreiber der ChatBots das Ganze in »verfassungsmässigen« Bahnen zu halten. Selbst die Form der Fragestellung wird bei den grossen Modellen inzwischen reglementiert – Stichwort: »political correctness«.[⤒]