Frau verschwindet

Es gibt zwei Arten von Träumen: die individuellen, die sich von Mensch zu Mensch und von Traum zu Traum unterscheiden. Und die übergreifenden großen Menschheitsträume. Was könnten solche Menschheitsträume sein? Fremde Planeten zu erkunden? Fliegen zu können wie ein Vogel? Allwissend zu sein?

Letzterem Menschheitstraum sind wir viel näher, als man bisher ahnen konnte – wobei er sogar ohne künstliche Intelligenz denkbar wäre, einfach deshalb, weil sich große Datenmengen mit Computern verarbeiten lassen. Erfolge moderner Statistik beruhen darauf. Aber ist alles wissen zu können, ein Menschheitstraum oder nicht eher eine Allmachtsfantasie?

Einzelerkenntnis: Was kann ich wissen?

Um das verstehen zu können, müsste man den Erlebnis- und Erkenntnis-Horizont eines einzelnen Menschen von dem eines denkbaren Welt-Horizontes trennen, in dem alles gesammelt wäre, was man wissen könnte. Das Wissen eines jeden Menschen ist begrenzt. Organisiert er sich aber in einem Kollektiv oder Schwarm, hat er als Einzelwesen die Chance, sich mit anderen Meinungen und Erkenntnissen zu konfrontieren und damit sein Wissen zu erweitern. Nehmen wir an, ich wäre Experte für Katzen: würde ich mich mit anderen Katzenexperten vernetzen und so versuchen, alle Fragen rund um die Spezies „Katze“ zu beantworten, dann könnte ich mein Wissen beträchtlich erweitern. Aber selbst wenn ich wissenschaftlich forschen und Kongresse veranstalten würde, um meinen Erkenntnisstand mit dem anderer abzugleichen, wie nahe käme ich der Katzen-Wirklichkeit tatsächlich?

Welterkenntnis: Was kann die KI im WWW wissen?

Nun eine andere Versuchsanordnung: Ich konfrontiere mein Wissen über Katzen mit allen Erkenntnissen aus Social-Media-Beiträgen, aus Fotos, Videos, Textbeiträgen und Konversationen über das Verhalten von Katzen aus Sicht ihrer sie begleitenden Menschen. Theoretisch könnte dies als Sammlung aller Beobachtungen ein interessantes Experiment sein. Nur stellt sich schnell die Begrenzung dieses Ansatzes heraus. Um die schiere Zahl an Katzenbeobachtungen aus Social-Media-Kanälen zu erfassen, bräuchte man ein Auswertungsschema und ein Computersystem, dass diese Milliarden Daten erfasst und weiterhin begleitet. Also ein System, das alle Äußerungen und Texte über Katzen, alle Medien in Echtzeit erfasst und analysiert. Ob und was das bringt, bleibt im Moment die Frage. Aber klar ist, dass sich schon rein quantitativ die Aufnahme und Katalogisierung einer solchen fortschreitenden und sich entwickelnden Datenmenge jedem Menschen und jeder Menschengruppe entziehen würde. Der beobachtende Mensch kann in Befragungen nicht mehr als Stichproben nehmen. Man mag einwenden, dass Erkenntnisgewinn nicht in der Quantität liegen muss sondern im Gegenteil in der Qualität von Daten, die über mathematisch berechnete Repräsentativitäts-Modelle mit kleinerem Aufwand gewährleistet wäre. Denn würde nicht sowieso jeder Erkenntnisgewinn in einer zu großen Fülle von Daten ersticken?

Viele Daten = fein aufgelöste Welterkenntnis?

Das mag richtig sein und dennoch reizt die Vorstellung einer umfassenden Weltsicht zu diesem Thema. Zu wissen, was alle Menschen in den unterschiedlichsten Situationen und damit an den unterschiedlichsten Erfahrungshorizonten über Katzen denken, hört sich datenmäßig nach einer interessanten Feinstauflösung des Materials an. Auch wenn es eine Frage der Maßgeblichkeit ist, ist der Gedanke deshalb so naheliegend und praktisch ein Menschheitstraum, weil kein einzelner Mensch auch nur annähernd wissen könnte, was die Menschheit in ihrer Gesamtheit zu einem noch so profanen Thema denken und von sich geben könnte. Gleichzeitig weiß man aber auch, dass wir in Zeiten des totalen Lauschangriffs leben, in denen Suchmaschinen und soziale Netzwerke uns oft besser kennen, als wir selbst. Und das lange Zeit selbst ganz ohne Künstliche Intelligenz.

Künstliche Intelligenz und Weltwissen

Jetzt aber, wo die KI seit ein paar Jahren tätig geworden ist und immer neue Wunderwerke ihrer Leistungsfähigkeit ausspuckt – in Form von Deep Dream, Chat GPT, Dall E, Midjourney oder Bard – erkennen wir die Möglichkeiten umfassender Beobachtung und Weltdurchdringung. Der bisherige kritische Ansatz war, zu befürchten, was alles online ausgespäht werden kann. Das heißt ausgespäht und überwacht, auf das individuelle Verhalten des Individuums bezogen. Nun zeichnen sich die Umrisse eines KI-generierten Weltbildes ab, das ganz andere Auswirkungen hat: Es geht nicht mehr um das Einzelne sondern um das Ganze, um praktisch alles. Darum, was Menschen zu allem denken und wie sie alles in der Welt handhaben, etwa wie alle Musiker auf der Welt Musik machen, wie alle Sachbuch- oder Romanautoren ihre Bücher schreiben, wie und was alle Fotografen fotografieren und wie und was alle Maler malen. Klingt das abwegig in seinem dimensionssprengenden Anspruch? Ja. Aber betrachtet man, dass offenbar Chat GPT mit den Daten der Welt gefüttert wurde, ohne jemals satt zu sein, dann klingt es nicht mehr ganz so verrückt.

Eine Datenbank menschlicher Weltbezüglichkeiten

Die Bilder und Texte der Welt wurden in eine gewaltige Datenbank eingepflegt. Man hat den Bildern Attribute zugeordnet. Nun weiß das System, wie ein Vogel aussieht, eine Wolke, ein Mensch, ein Gesicht. Alles, was es auf der Welt an Sichtbarem gibt, ist Bestandteil der Datenbank. Auch alles Nichtsichtbare, über das es Erkenntnisse gibt. Zugleich hat das System aber wie nebenbei zweierlei verinnerlicht:

  1. Wie Menschen in Text, Foto, Zeichnung und Malerei und allen anderen Künsten inkl. der Musik die von ihnen wahrgenommene Welt abbilden.
  2. Welche Filtermechanismen und Wahrnehmungsstrukturen dem Menschen innewohnen. Das heißt, nach welchen Prinzipien er für sich und aus seiner Existenz heraus einen Ausdruck findet.
  3. Welche Arten der Darstellung die Menschen im Detail dafür angewendet haben. Also ganz konkret: wie mit welcher Klarinette innerhalb welchem instrumentalen Arrangements gespielt wurde, mit welchem Pinsel gemalt, mit welchem Stift wie gezeichnet wurde.

Das Computer-KI-System als ausführendes Organ?

Nun kann man von dem System etwas verlangen, zu dem der einzelne Mensch so schnell nicht fähig wäre: „Male oder fotografiere mir virtuell einen Hund!“, „setze Ihm einen Hut auf!“, „lass ihn einen Purzelbaum schlagen“ usw. Das System, das also alle Motive und alle Darstellungsweisen kennt oder irgendwann kennen wird, hat damit eine quantitative Knowhow-Grundgesamtheit, die zu einer nie gekannten Qualität wird. Es ist dabei technisch hervorragend, schnell und kreativ. Als kommerziell verwertbares System ist es jedem Menschen und jeder Menschengruppe überlegen. Jetzt oder irgendwann.

Die Künstliche Intelligenz und ihre Spezialisierungen

Die Fähigkeiten heutiger KIs sind nicht allumfassend. Sie sind spezialisiert: ein System gewinnt im Schach, eines formuliert Texte, eines erschafft Bilder, und andere KIs werden unschlagbar in anderen Bereichen. Das sind Einzeldisziplinen, denkbar und angestrebt ist aber, dass die Einzelfähigkeiten zusammengefasst werden zu einer übergeordneten KI, die die Einzeldisziplinen bündelt, wie der Mensch seine Fähigkeiten bündelt. Gemeint ist keine Aneinanderreihung von Fähigkeiten, die nebeneinander existieren sondern deren Verschränkung und gegenseitige Durchdringung. Das bedeutet, dass sich die Fähigkeiten gegenseitig anreichern, sodass sie reifen. Irgendwann. Aber unter Umständen auch sehr bald. Denn zur Ermittlung der menschlichen Intelligenz mittels Intelligenztest zählen Faktoren wie

  • räumliches Denken,
  • Verbalisierungsvermögen,
  • Denkgeschwindigkeit und
  • Gedächtnisleistung.

Wer wollte behaupten, dass ein KI-System nicht von vornherein dem Menschen in Sachen Denkgeschwindigkeit und Gedächtnisleistung überlegen wäre? Am Leistungsvermögen und formulierungsstarken Stil von Chat GPT mag man ersehen, dass auch verbale Möglichkeiten für eine KI kein Buch mit sieben Siegeln sind.

Die KI, ein Ausdrucksträger?

Was die KI nicht kann, ist ein Ausdrucksmedium zu sein. Man vergisst bei der (kommerziellen) Nutzung, wie sie etwa „Midjourney“ als bilderschaffende KI repräsentiert, dass menschenerzeugte Kunst nicht nur ein beliebiges Ergebnis ist. Kunst hat für den Menschen, der sie erschafft, eine sich selbst abbildende Funktion. Der Mensch hat ein Bedürfnis, sich auszudrücken. Das ist etwas Persönliches. Es geht dem Künstler ursprünglich nicht darum, irgendein Bild zu erschaffen, es geht ihm darum, sich in einem Bild auszudrücken.
Das ist kein absolutes Muss, man kann auch ein Bild erschaffen, um es zu verkaufen. Dann ist das Werk kein Ausdrucksmedium, das als Manifestation eines mentalen Prozesses oder als eine Schleifspur der Psyche des Künstlers entstanden ist, sondern ein absichtsvolles Kommerzprodukt. Dieses kann einen Ausdruck haben, muss es aber nicht. Denn für den Verkauf muss vor allem seine Ästhetik funktionieren, das heißt, es muss ansprechend sein, zielgruppen- oder marktgerecht. Es könnte auch von beidem etwas haben, das heißt, zum Teil Ergebnis eines Ausdrucksprozesses sein, den sich der Künstler abgerungen hat, aber gleichzeitig intermittierend im Kopf behaltend, dass er die Miete zahlen und deshalb das Bild verkaufen muss. Hier könnte man behaupten, dass gerade die Ausdrucksstärke eines Bildes dessen künstlerische Kraft ausmacht, dass sich also ausdrucksstarke Kunst, die einen tatsächlichen Bezug zum Menschen hat, besser verkauft. Das ist bestimmt so, aber es wird nicht dem Umstand gerecht, dass bildgebende KIs bereits millionenfach Bilder generiert haben und das einen Unterschied macht.

Der Künstler als Brüderlein der KI

Denkbar ist zwar, dass ein Künstler der früher gemalt, gezeichnet, komponiert bzw. mit Formen und Farben herumexperimentiert hätte, nun am Computer sitzt und endlos Sätze eingibt, nach denen ein System merkwürdige Bilder formt. Vielleicht entwickelt er zusammen mit dem System nach hunderten oder tausenden Eingaben und Korrekturen einen unvergleichlichen visuellen Stil, der dann sein Ausdruck ist, also dem entspricht, was er fühlt oder vor Stunden, als er mit seiner Session begann, gefühlt hat. Vielleicht wäre diese völlige Loslösung davon, selbst derjenige sein zu müssen, der ein Bild mit seinen Händen auch technisch erschafft, eine völlige Abkehr vom Muss des eigenhändigen Erschaffens und von den manuellen Fähigkeiten der technischen Realisierung – und das das eigentlich Neue, das zukünftig Einmalige.
Vielleicht ist es überhaupt sehr überheblich, in die Zukunft blickend zu behaupten, diese einmalige visuelle Reise könne nicht ein Ausdruck sein. Das heißt ein Ausdruck, in dem sich der den Prozess initiierende Mensch spiegelt, tatsächlich abbildet, wiederentdeckt und wiederfindet. Denn man kann sich andere Prozesse vorstellen, in denen ein Mensch mit anderen Menschen zusammenarbeitet, etwa Leonardo Da Vinci oder Gustave Dore, die Assistenten oder Schüler in ihren Ateliers und Werkstätten beschäftigten, die umsetzten, was der Meister erreichen wollte. Es gibt auch immer schon Musikproduzenten wie Norman Whitfield, die Musik komponieren, arrangieren und produzieren und doch im Vordergrund eine Gruppe mit Sängern und Musikern haben, die diese Vision umsetzen. Die bildgebende KI kann also durchaus als Werkzeug, Kooperationspartner oder als etwas dazwischen angesehen werden – und das Ergebnis dieser Kooperation könnte für den Menschen einen identitätsstiftenden Ausdruck hervorbringen.

Zweifel an der Mensch-Maschine

Denkt man als Mensch diesen Gedanken zu Ende, regt sich an dieser Stelle etwas Menschliches: Zweifel an dem Gedanken, das Mensch-Maschine-Duo könnte ein tatsächliches Ausdrucksmedium sein.

Widerspruch 1: Entmenschlichung

Der erste Widerspruch liegt in der Virtualisierung selbst. „Virtualisierung“, das ist eine Entkörperung, eine Verflüchtigung des ehemals Vorhandenen und Begreifbaren. Dies führt zu einer Vorläufigkeit all dessen, was in der Virtualität existiert, und mündet in eine unbemerkte Orientierungslosigkeit. Der wahre Abgrund im Leben ist das Ende aller Bezüge und Bezugsrahmen. Man selbst als Einzelwesen existiert durch die Bezüge, die man hat. Die absolute Freiheit, im Web alles sein zu können, was man will, mündet ist eine Weltbezugslosigkeit. Denn die KI befreit alles, was man tut, per se von Stofflichkeit, von Vorhandensein, von Physischem. Alles, was sie generiert, ist virtuell. Das Original ist verschwunden. Der Druck, auch der 3D-Druck, ist nur die Kopie von der Kopie von der Kopie eines ewig kopierbaren Datensatzes. Was am Bildschirm real und vorhanden erscheint, ist in Wirklichkeit als etwas Begreifbares und Festgelegtes längst verschwunden.

Das Ende des Gegenständlichen?

Auf den Menschen und seine Existenz bezogen bedeutet dies auch das Verschwinden der menschlichen Physis. Das Verschwinden von Bargeld in einer finanziellen Digital-Transaktion ist eine Virtualisierung des ursprünglichen Tauschgutes, sagen wir eines echten Pferdes gegen Lebensmittel, eine Virtualisierung selbst der Geldmünzen und der Geldscheine, die ihrerseits längst nur noch Symbole mit abnehmendem Symbolgehalt geworden sind – also sich kurz vor der Nichtexistenz befinden. Der Mensch hat im World Wide Web einen Avatar, in dem er sich spiegeln will aber tatsächlich längst aufgelöst hat. Auf Dating-Plattformen ist er wenig mehr als ein geschönter Datensatz. Spätestens bei der persönlichen Begegnung merkt der eine oder andere, dass er seinem virtuellen Abbild nicht standhalten kann, dass seine virtualisierte Form ihm überlegen ist.

Widerspruch 2: Kooperationspartner oder Sklave?

Der zweite Widerspruch bezieht sich auf den Anteil am geistigen Eigentum. Denn in dem oben genannten Modell der Kooperation zwischen Ausdruckssuchendem – dem Menschen – und Ausdruckgebendem – dem System – würde man von einer echten Kooperation ausgehen. Tatsächlich ist diese denkbar. Vorstellbar ist ein Mensch, der in langen System-Sessions an Bildern feilt, die genau dem entsprechen, was er sucht. Früher hätte er vielleicht dutzende Skizzen und Vorzeichnungen für ein Gemälde angefertigt und später das Gemälde so lange übermalt, bis er jenen Ausdruck findet, den er angestrebt hat. In dieser Auslegung wäre die bildgebende KI nicht viel mehr als ein mächtiges Malwerkzeug, wie ein phantastischer Stift mit unendlich vielen verschiedenen Spitzen. Was aber momentan an der bilderzeugenden KI begeistert ist dreierlei:

  • Die Schnelligkeit des Resultates,
  • die technische Perfektion und
  • die Kreativität, die ungewöhnliche Kombinatorik von Elementen, auf die man nicht unbedingt selbst gekommen wäre.

Diese kreative Kombinatorik geht immer weiter: bei jedem neuen Anlauf, jeder Korrektur erhält man immer neue Ergebnisse in mehreren Varianten, wenn man will. Der Mensch als Initiator, als maßgeblicher Antrieb, als also derjenige, der absehen könnte, was als nächstes kommen wird, ist nicht vorstellbar. Es ist eher so, als würde Leonardo Da Vinci Picasso sagen, er solle ein Bild malen. Das Ergebnis entspricht aber nicht dem, was seine Ausdrucksmöglichkeiten hervorbringen würden.

Die KI als maßgeblicher Bilderzeuger

Man mag einwenden, dass jemand, der sich mit einem Stift in der Hand an ein Blatt Papier setzt, ebenfalls nicht unbedingt weiß, was dabei herauskommen wird. Der Zufall spielt hier eine beträchtliche Rolle. Selbst wenn als Motiv klar ist „es wird eine Person“, bleibt unklar und ist nicht absehbar, wie die Striche gesetzt sein werden, wie die Person dargestellt wird und um was für eine Person es sich handeln wird.
Also was? Das ist eine Parallele zum Werk der KI, deren Ergebnis auch nicht vorauszusehen ist. Mit einem Unterschied: Egal ob er es absehen kann oder nicht, was der Mensch zeichnet ist sein Ausdruck mit Bezug zu ihm als Einzelwesen und zum Leben dieses Einzelwesens. Kunst ist ein Bezugsrahmen für sein Sein. Die Nicht-Absehbarkeit im KI-erzeugten Bild ist aber mehr Ausdruck der KI als der des Menschen. Denn ohne die KI würde der Mensch nicht annähernd und wie am Fließband die Ergebnisse erzeugen, wie de KI das vermag. Sie braucht ihn nicht, zumindest nicht mehr. Denn sie hat die Bilder der Welt verinnerlicht und funktioniert ab jetzt als ein dimensionssprengender Generator neuer Bildwelten.