Banner Full-Size

Was ist Künstliche Intelligenz?

Untertitel
Musikalische Überlegungen zu einem der Themen unserer Zeit
Vorspann / Teaser

Kaum ein Phänomen hat unser Denken und unsere technologischen Möglichkeiten umfassender verändert als die so genannte Künstliche Intelligenz. Sie offeriert Fähigkeiten, die vor 20 Jahren nicht für möglich gehalten wurden. Es gab kaum einen vergleichbaren Quantensprung, seit sich digitale Computer als universale Werkzeuge in der Industrie, im Büro, in der Wissenschaft, in der visuellen Kunst und in der Musik etabliert haben. Künstliche Intelligenz ist als „Buzz Word“ in aller Munde, ermöglicht den Zugang zu Forschungsgeldern und ist in fast jedem Smart Phone, obwohl den meisten Menschen nicht klar sein wird, wo diese Technologie herkommt und wie sie funktioniert. Letztendlich ist selbst der Begriff ein Schwindel, da die künstliche Intelligenz weder intelligent ist, noch eine Intention oder ein Bewusstsein besitzt. Es ist schlichtweg Datenverarbeitung von mehr oder weniger „Big Data“.

Publikationsdatum
Paragraphs
Text

Es gibt verschiedene Antworten auf die Frage, worum es sich bei künstlicher Intelligenz überhaupt handelt. Zu allererst ist der Begriff Intelligenz sehr umstritten und wirft viele Fragen auf. Noch vor 50 Jahren verstand man hierunter die kognitiven Fähigkeiten des Menschen, wie etwa das Rechnen oder logisches Denken. Wie aber steht es um die sprachlichen Fähigkeiten, emotionale und soziale Intelligenz? Diese Aspekte sind teilweise erst seit der Diskussion um die künstliche Intelligenz wieder neu in den Fokus gerückt. Weiterhin unterscheidet man eine starke und eine schwache künstliche Intelligenz. Experten waren sich bis vor kurzem einig, dass es die starke, der menschlichen Intelligenz vergleichbare künstliche Intelligenz, in absehbarer Zeit nicht geben wird.

Der bekannte KI-Forscher und Entwickler Geoffrey Hinton ist der Ansicht, dass wir nicht in der Lage sind die Zukunft seriös zu prognostizieren, da sich die Entwicklungsgeschwindigkeit exponentiell beschleunigt. Vor einigen Jahren hätte man die Fähigkeiten einer KI, grammatikalisch korrekte Texte als Antworten auf beliebige Fragen zu geben, nicht für möglich gehalten.

Der Begriff Künstliche Intelligenz wird eher als Oberbegriff für verschiedene Bereiche komplexer Systeme wie Motion, Vision, Text to Speech, Natural Language Processing und Machine Learning sowie Deep Learning benutzt. Viele dieser Systeme verwenden neuronale Netze in den verschiedensten Konfigurationen. Je nach Aufgabe gibt es Architekturen in denen mehrere Netze miteinander im Wettbewerb stehen und sich gegenseitig korrigieren. Es werden auch rückgekoppelte Netze verwendet, mit denen eine größere Genauigkeit und schnellere Lerngeschwindigkeit erzielt wird.

Künstliche Intelligenz versus künstliche Kreativität

Wenngleich sich der Begriff künstliche Intelligenz etabliert hat, gibt es eine Alternative, die das Thema mit weniger Übertreibung angeht. Der Begriff der künstlichen Kreativität beschreibt diesen Bereich wesentlich neutraler, da er sich nicht mit dem menschlichen Begriff von Intelligenz zu messen versucht. Er beinhaltet ebenfalls Vorläufertechniken von KI wie Kybernetik, Markow-Ketten und Stochastik, die seit Mitte des 20. Jahrhunderts von Komponisten wie Iannis Xenakis oder David Cope in der Computermusik oder der computerunterstützten Komposition verwendet wurden.

Komponenten für Kreativität: Regeln und Zufall

Um die Wirkweise solch kreativer Systeme zu demonstrieren eignet sich insbesondere Musik mit ihrer stark regelbasierten Variantenbildung. Der Kontrapunkt oder die Harmonielehre sind solch wichtige Regelsysteme in der Musik der letzten Jahrhunderte. Der Kontrapunkt und viele andere Regelsysteme haben eine Besonderheit: Die meisten Regeln ermöglichen eine Vielzahl an Lösungsmöglichkeiten. Es gibt beispielsweise viele Wege, um Quintparallelen zu vermeiden, oder eine Gegenbewegung der Stimmen zu erfüllen. Die Einhaltung der Regel schafft einen grammatikalischen Hintergrund mit vielen Optionen.

Die zweite, mindestens ebenso wichtige Komponente für die künstliche Kreativität ist der Zufall. Repräsentiert die Regel die Gramantik, so übernimmt der Zufall die Rolle der Varianz und Kreativität. Zufall allein ist allerdings chaotisch und wenig zielgerichtet. Fügt man nun beide Elemente, Regeln und Zufall, zusammen, entstehen plötzlich interessante Informationen. Bestes Beispiel hierfür ist das bekannte, Mozart zugeschriebene Musikalische Würfelspiel von 1793. Mit Hilfe zweier Würfel und den vorkomponierten mehrtaktigen Gruppen können fast unendlich viele kleine Musikstücke aus der zufälligen Kombination der einzelnen Takte entstehen. Dabei gibt es bestimmte Takte für den Anfang, die Mitte und die Kadenz am Ende. In diesem einfachen Spiel sind die Wirkprinzipien der künstlichen Kreativität bereits vorhanden.

Einen weiteren Schritt in Richtung kreativer Systeme ging der 1922 gestorbene Mathematiker Andrei Andrejewitsch Markow. Er entwickelte eine mathematische Methode mit der man beispielsweise Variationen von Melodien oder beliebigen Daten erzeugen kann. Man kann durch die Quantität an Zufall Varianten von Melodien oder Rhythmen entwickeln, die identisch mit dem Original sind, oder sich immer weiter davon entfernen. Die in der Melodie enthaltenen Muster werden mit unterschiedlich genauen Analysen bestimmt und zur Erzeugung neuer Melodien verwendet. Die einfachste ist die Bestimmung der Häufigkeit einzelner Töne, danach folgt die Häufigkeit von Zweitonfolgen, dann die von Dreitonfolgen und so weiter.

Nun können die Ergebnisse dieser Analyse zur Reproduktion der Melodie angewendet werden.

 

Text

Abbildung 2 zeigt die Analyse der Melodie von „Happy Birthday to you“ in einer Markow Analyse 0-ter Ordnung. Man sieht, dass der Ton c4 mit einer Wahrscheinlichkeit von 32 Prozent vorkommt. Jeder Ton besitzt hier einen individuellen Häufigkeitsfaktor. Wird nun eine Melodie erzeugt, dessen Zufallsgenerator den Ton c4 mit einer Häufigkeit von 32 Prozent einsetzt, so wird die daraus folgende Melodie kaum oder nur für kurze Momente an das Original erinnern. Der nächste Schritt zeigt die Wahrscheinlichkeit von Tonfolgen in einer Markow-Analyse erster Ordnung. Von Links gelesen folgt nach dem c4 mit der Wahrscheinlichkeit von 37,5 Prozent das d4 und mit einer Wahrscheinlichkeit von 25 Prozent das f4 und so weiter. Führt man diese Tabelle aus, so entsteht eine Melodie von geringer Ähnlichkeit zum Original. Kurzzeitig tauchen Intervallfolgen auf, die man wiedererkennt.

Bild
Eine noch größere Tabelle, als Abbildung 1 oder 2. Auch der Sinn des Inhalts dieser Tabelle wird, so weit für den Text nötig, darin ausgeführt.

Abbildung 3

Text

Abbildung 3 zeigt die Auswertung der Dreitongruppen einer Markow-Analyse dritter Ordnung. Hier sieht man schon eine Menge 100-prozentige und einige 50-prozentige Wahrscheinlichkeiten. Diese Tabelle wird eine Melodie erzeugen, die eindeutige Assoziationen zum Original zulässt, jedoch nicht so viele Variationsmöglichkeiten beinhaltet.

Dieses Zusammenspiel von Zufall und Regel wird in der Markow-Kette deutlich nachvollziehbar dargestellt. Die Analyse stellt eine primitive Form von maschinellem Lernen dar. Die Anwendung der Tabellen sind ein Weg, die Mustererkennung mit Varianten zu erzeugen. Dies ist eine vereinfachte Form dessen, was in einem neuronalen Netz mit Machine Learning geschieht. Markow-Ketten sind eine auch heute noch verwendete Grundlage für Expertensysteme. Darauf baute der Computermusiker David Cope auf und entwickelt eine KI mit dem Namen EMI, die in der Lage war überzeugende Stilkopien zu generieren. Dieses System konnte schon Anfang der 90er Jahre Werke im Stile von Bach, Mozart und teilweise auch Beethoven herstellen. Berühmt wurden diese „Style Transfers“ genannte Technik erst später durch Softwares, die mit neuronalen Netzen selbstständig den Malstil von Bildern analysieren und diesen auf beliebige andere Bildinhalte übertragen konnten. Bekannt wurden auch die psychedelischen mit rekursiven neuronalen Netzen erzeugten Deepdream-Bilder.

Neuronale Netze

Mit der Anwendung neuronaler Netze entwickelte sich eine ganz neue Technik. Die Mustererkennung innerhalb der Daten musste nicht mehr von hoch spezialisierten Computerprogrammen durchgeführt werden. Diese Aufgabe wird jetzt von selbstlernenden Neuronalen Netzen eigenständig bewältigt. Damit entwickelte sich ein Bereich der Künstlichen Intelligenz, das Machine Learning, zu einer der wichtigsten Technologien. Wendet man das Verfahren auf Musik an, so würde das System mit einer großen Anzahl an Kompositionen von Mozart gefüttert, um aus dem Material eine Vielzahl an Mustern zu erkennen. Dieses Mustergedächtnis wird dazu verwendet, um neue Komposition im Stile von Mozart zu generieren. Genau solch ein Projekt setzte das Stuttgarter Kammerorchester 2023 nach verschiedenen Forschungsstudien zusammen mit dem ZKM | Hertz-Labor und dem Media Solution Center Stuttgart mit dem Programmierer Axel Berndt um. Inzwischen sind einige groß skalierte Projekte bekannt geworden, die neuronale Netze in ihrer Arbeitsweise zeigen.

Mathematische treffen auf biologische Neuronen

Anfang des 20. Jahrhunderts fingen Mathematiker an, mit dem Konzept von Neuronen zu experimentieren. In der zweiten Hälfte des 20. Jahrhunderts gingen Wissenschaftler der Frage nach, wie man Erkenntnisse aus der biologischen Funktionsweise des Gehirns mit Hilfe von künstlichen Neuronen simulieren könne. Hierzu benutzten sie die von Mathematikern entwickelten Neuronensysteme und übersetzten diese in komplexe Software. Die entstandenen Programme erforderten bei ihrer Anwendung allerdings so viel Rechenkapazität, dass es anfangs nicht möglich war, viele Neuronen mit einer großen Menge an Daten zu verwenden. Mit der exponentiellen Verdichtung von Schaltkreisen in digitalen Chips und mit der einhergehenden Sammlung großer Datenmengen änderte sich die Situation nach der Jahrtausendwende. Plötzlich waren Chips mit Milliarden von Transistoren und Festplatten mit Terabytes an Daten möglich und eine Vielzahl an Daten verfügbar. Zusätzlich erkannte die Industrie das Potential von Chips, die für das Prozessieren von neuronalen Netzen optimiert wurden und heutzutage ist solch ein KI-Chip bereits in fast jedem Smartphone.

Auf dieser Grundlage konnten neuronale Netze mit einer völlig neuen Leis­tungskapazität entstehen, die als Folge von intensiver Forschung zu Large Language Modellen wie ChatGPT führten. Die LLMs von ChatGPT, von Facebook und Google sind nicht nur in der Lage, grammatikalisch richtig zu schreiben, sondern können auf die Informationen aus einem ungeheuren Fundus von gelernten und verarbeiteten Daten zugreifen, indem Milliarden von Wörtern aus digitalisierten Büchern und Texten im Internet eingelernt wurden.

Das groteske an neuronalen Netzen ist, dass man erst langsam be­ginnt, die Vorgänge innerhalb der Netze zu verstehen. Bislang waren sie eine Black Box in die man weder hineinsehen noch eingreifen konnte. Ist ein Netz erstmal programmiert, kann man es nur noch mit Daten füttern. Stimmen die Resultate nicht, muss man von vorne anfangen. Hat sich beispielsweise in ein System zur Gesichtsreproduktion ein Fehler in Form einer eingedrückten Nase eingeschlichen, wie der Künstler Memo Akten berichtete, kann dieser Fehler nicht mehr beseitigt werden. Das System muss in diesem Fall ganz neu angelernt werden. Weiterhin reproduzieren solche Systeme den in den Daten enthaltenen Bias und damit Vorurteile und Verzerrungen.

Geoffrey Hinton sagte in dem auf Youtube verfügbaren einstündigen Interview, KI-Systeme könnten die erste Technologie werden, die der menschlichen Intelligenz überlegen sein wird. Sie können ihr Wissen schneller teilen als wir Menschen und sie sind unsterblich, da sich Hardware und Software trennen lässt.

Ausblick

Soeben wurden Nachrichten verbreitet, dass in San Francisco zwei Firmen mehrere hundert selbstfahrender Taxis verwenden, die mit einer App gerufen werden können. Solche selbstfahrenden Systeme verbinden Sensorik, Vision und Motion und Machine Learning miteinander und können so ein komplexes Verhalten ermöglichen.

In der Kombination sensorischer Systeme mit Machine Learning oder sogar emotionaler und sozialer Intelligenz liegen ungeahnte Möglichkeiten. In der Musik sind KI-gemachte Klänge und Kompositionen noch nicht so häufig hörbar. Noch sind die aus der KI entstandenen Artefakte interessant, aber im Bereich Pop, Muzak und Filmmusik wird es bereits im industriellen Maßstab verwendet. Noch sind es assistenzbasierte Systeme, die einen Menschen zur Qualitätskontrolle benötigen. Ob die Systeme experimentelle Komponisten in Zukunft ersetzen können wird man abwarten müssen, denn es fehlt etwas Entscheidendes: die Intention. Hätte solch ein KI-System Schönbergs Bruch mit der Tonalität realisieren können?

Auch hier hat Hinton die Antwort parat, dass weit fortgeschrittene Systeme Intentionen von Menschen erlernen können. Das ist Zukunftsmusik, die Copyright-Debatte ist allerdings schon da und benötigt völlig neue Denkweisen und Entscheidungen von Politik und Gesellschaft. Das Feld der künstlichen Intelligenz ist gegenwärtig so dynamisch, dass der Versuch, die Frage zu beantworten was künstliche Intelligenz ist, ständig veraltet.

Print-Rubriken
Unterrubrik