Ängste vor neuen Technologien gab es schon immer. In den 1980er-Jahren begrüßten Fachleute die vielfältigen Anwendungen des PC, während sich alle anderen fürchteten, die sich nicht damit auskannten. Gemäß der Studie „KI und Musik: Generative Künstliche Intelligenz in der Musikbranche“, die GEMA und SACEM Anfang 2024 veröffentlichten, ist es heute genau umgekehrt: immer mehr Menschen begeistern sich für KI-Tools wie ChatGPT, boomy, Udio, Suno, StableAudio, Avia, MusicML, Sounddraw, MusicGen, capella audio2score, lalal.ai, Moises, BandLap…, während professionell damit arbeitende Anwender befürchten, durch die von ihnen selbst eingesetzten Programme überflüssig zu werden. Dass menschliches Handeln und Denken auseinanderklaffen, offenbarte auch die Tagung „AI MusicCon – Musikleben und Künstliche Intelligenz“, die erstmalig im Rahmen des Festivals SoundTrack_Cologne in Kooperation mit dem Landesmusikrat NRW im Kölner „Comedia“ Theater stattfand und nächstes Jahr erneut veranstaltet werden soll.
Musikleben und Künstliche Intelligenz
Dies ist eine kürzere Print-Version des Artikels, der in größerem Umfang bereits hier auf nmz.de erschienen ist.
Kann KI Avantgarde?
Die zahlreichen Teilnehmenden waren sich einig, dass Künstliche Intelligenz die größte technologische Veränderung seit dreißig Jahren ist und sich gravierend auf die gesamte Kreativbranche auswirkt. Konsens bestand auch darüber, dass KI einstweilen jedoch noch nicht in der Lage ist, wirklich Neues zu schaffen, sondern lediglich die Masse an Klängen, Bildern, Texten, Daten neu arrangiert, mit denen sie trainiert und gespeist wurde. Der Leiter des Instituts für Musik und Akustik am ZKM Karlsruhe Ludger Brümmer leitete daraus einen „Turing Test der Musik“ ab, basierend auf der Frage, ob eine KI in der Lage sei, die Atonalität als Konsequenz der komplexen Tonalität zu erfinden. Weil einstweilen nur stark regelbasierte Musik reproduziert werde, sei den gegenwärtigen KIs Intelligenz und Kreativität abzusprechen.
Der Cellist, Produzent und Präsident des Composers Club Deutschland Anselm Kreuzer verwies auf die seit Jahrzehnten gängigen hybriden Work-Stations mit akustischen Instrumenten, Stimmen und digitalen Tools, um herauszustellen, dass Produktionsfirmen inzwischen mittels KI und Voice Cloning komplette Pop-Songs und Werbe-Jingles kreieren, die reale Producer dann mittels eines Bruchteils an Zeit und Honorar lediglich noch optimieren. In Genres wie Electro, Urban/Rap und Musik für TV, Film, Hörspiel, Werbung und Games sorgen sich Kreative daher berechtigterweise, verdrängt zu werden.
Tatbestand der Enteignung
Der Film- und Hörspielkomponist Matthias Hornschuh sieht den augenblicklich stattfindenden „größten Diebstahl in der Weltgeschichte“ schon seit Längerem systemisch verankert. Denn bereits Google, YouTube, Spotify sowie andere Intermediäre hätten anfangs Inhalte nicht honoriert. Ebenso würden jetzt die von Musikschaffenden erarbeiteten und urheberrechtlich geschützten Inhalte ohne deren Zustimmung durch in den USA oder China entwickelte KI vereinnahmt und als Anwendungen an die Bestohlenen zurückverkauft. Der dadurch entstehende volkswirtschaftliche Schaden sollte Politik und Gesetzgebung auffordern, gegebenenfalls Schutzzölle wie beim globalen Autohandel zu erheben.
Der im März 2024 von den Mitgliedstaaten der Europäischen Union verabschiedete „AI Act“ sieht unter anderem eine Kennzeichnungspflicht für den Einsatz von KI und Deep Fake vor, wovon nur künstlerische, satirische und fiktionale Arbeiten ausgenommen werden sollen. Bislang ist nach EU-Recht „Text-Data-Mining“ erlaubt, um im Internet gesellschaftliche Trends herauszufiltern, worauf sich auch Internetkonzerne berufen, wenn sie personenbezogene Daten und Suchprofile von Usern ermitteln, mit deren Nutzung und Verkauf sie Milliarden-Gewinne erzielen. Der Sprecher der Initiative Urheberrecht sieht darin den Tatbestand der Enteignung und fordert eine Gesetzesnovelle, die verhindert, dass Privatdaten weiterhin in solcher Weise kapitalisiert werden dürfen.
„Freeware“ versus Urheberrecht
Die Fachanwältin für Urheber- und Medienrecht Kerstin Bäcker brachte die Firmenpolitik von Microsoft und Meta auf den Punkt, dass für diese Konzerne alles im Internet „Freeware“ sei und wie ein Rohstoff nach Belieben ausgebeutet werden dürfe: „Data is the new oil!“ Mittlerweile komme es jedoch häufiger zu Prozessen von Rechteinhabern gegen Internet- und KI-Anbieter. Beispielsweise klagte die New York Times, dass Millionen ihrer Artikel ohne Lizenzierung von OpenAI und Microsoft genutzt wurden. Inzwischen schließen erste KI-Anbieter daher Verträge mit Unternehmen, die Inhalte generieren. So kam es Ende 2023 zur Partnerschaft von OpenAI beziehungsweise ChatGPT und dem Springer-Konzern mit all seinen Informationsmedien wie „Business Insider“, „Bild“ oder „Welt“.
Andere KI-Firmen wie boomy setzen dagegen auf Verschleierung durch Gaffer-Taps. Mittels gezielter Abwandlung von Suchergebnissen soll verhindert werden, dass urheberrechtlich geschützte Inhalte im Original erscheinen und dadurch bloßlegen, dass die KI unrechtmäßig damit trainiert und gespeist wurde. Die Allgemeinen Geschäftsbedingungen vieler KI-Anbieter verlangen, dass die Gratis- und oft auch Bezahlversionen alle Prompts der User und dadurch generierten Inhalte zur Optimierung der KI nutzen und anderen Usern bereitstellen dürfen. boomy verpflichtet die Nutzer vorsorglich dazu, das Unternehmen pauschal von allen möglichen Regressforderungen wegen verletzter Urheber- und Leistungsrechten loszusprechen.
KI im Musikschulunterricht
Der Musiker und Musikpädagoge Thomas Hanz zeigte praktische Anwendungen von „KI im Musikschulunterricht“. Der Referent für Digitalisierung des Landesverbands der Musikschulen in NRW vermittelte, wie sich mit ChatGPT und anderen Large Language Models effizient Programideen recherchieren, Kommentartexte schreiben und Plakate entwerfen lassen. Mit Cadenz Live Accompanist können einzelne Stimmen aus der Audiodatei eines Orchester- oder Kammermusikwerks entfernt werden, so dass die fehlende Partie von einer Schülerin gespielt werden kann. Im Gegensatz zu den Schallplatten „Music Minus One“ reagiert das Programm bei mehrmaligem Spielen immer genauer auf Tempo, Atempausen und Phrasierung des Mitspielenden. Zudem kann das gesamte Stück in beliebige Tonarten und Stimmlagen transponiert werden.
Mittels hookpad lassen sich einfache Melodien harmonisieren und mit Schlagzeug zu Bossa Nova, Dark Electro, Metal oder x-beliebigen Stilen erweitern sowie als Partitur und Einzelstimmen einrichten. Dadurch können auch stupide Einspiel-, Finger- und Ansatzübungen reizvoller gestaltet werden. Weitere Anwendungsmöglichkeiten sieht Hanz in Videomitschnitten von Unterrichtsstunden, deren wichtigste Inhalte die Lehrenden mit Markern versehen und eine KI automatisch zu einer Kurzfassung komprimiert, die man sich dann beim heimischen Üben als sicht- und hörbares Hologramm zum richtigen Nachmachen abrufen kann. Interaktive Videobrillen könnten auch im Raum agierenden Performern die Noten vor Augen projizieren.
SEO, Memes, Fake-Influencer
Marju Sokman zeigte in ihrer Präsentation „Adressing Target Groups and Marketing with AI“ Einsatzmöglichkeiten von KI-Tools zu Werbezwecken, Search Engine Optimization (SEO) und Steigerung von Klickzahlen. Um ein Konzert oder Musikfestival zu bewerben, solle man das vorhandene Programm in viele kleine Texte, Videos und Bilder filetiert auf möglichst verschiedene Kanäle verteilen. Beim Generieren von Headlines mit hoher Catchiness helfen Programme wie Claude.ai, gemini oder perplexity. OpusClip kann halbstündige Präsentationen häppchengerecht für ungeduldige User in leicht konsumierbare Zweiminuten-Sequenzen samt passenden Zwischenüberschriften zerlegen und zur Erhöhung der Trefferquote mit Suchbegriffen belegen. Mit Viggl.AI kreiert man Memes von sich selbst in der Rolle von Superstars, die in Stadien von zehntausenden Fans bejubelt werden. Mittels Bot-Farmen wie heygen „züchtet“ man am besten massenhaft Fake-Influencer und Avatare, die dann die eigene Person und Arbeit bewerben. Ohne jedes Problembewusstsein für die marktverzerrende und demokratiegefährdende Wirkung solcher Manipulationen begeisterte sich die Referentin für KI-generierte Avatare, weil diese laut aktueller Studien für viele Internetnutzer bereits natürlicher wirken als reale Menschen.
Zukunft? Hoffnung?
Der Geschäftsführer der Hamburger Hard- und Software-Firma Cognitone André Schnoor sah die Zukunft der Musikschaffenden indes nicht allzu düster. Die Performativität, Körperlichkeit, Räumlichkeit und Kommunikativität von Musik sei viel komplexer als durch KI leicht generierbare zweidimensionale Bilder, Filme, Grafiken und Texte. Womöglich mache sich die KI mit ihrem inflationär anschwellenden Output irgendwann selbst überflüssig, weil sie nicht wie lebende, denkende, fühlende, egoistische und empathische Menschen gezielt für andere Menschen etwas macht, sondern am laufenden Band nur statistische Beliebigkeit produziert, die sich an niemanden richtet und von der sich auch niemand angesprochen fühlt. Vielleicht werden die Menschen der anonymen Massenware dann überdrüssig und gehen wieder dazu über, für sich selbst und andere zu denken, schreiben, malen, filmen, spielen, singen…
Weiterlesen mit nmz+
Sie haben bereits ein Online Abo? Hier einloggen.
Testen Sie das Digital Abo drei Monate lang für nur € 4,50
oder upgraden Sie Ihr bestehendes Print-Abo für nur € 10,00.
Ihr Account wird sofort freigeschaltet!