Unzulässige Vervielfältigung durch Memorisierung von Werken im und durch KI-Sprachmodell
LG München I, Endurteil v. 11.11.2025 – 42 O 14139/24
Hier ist die Zusammenfassung des Gerichtsurteils des Landgerichts München I vom 11. November 2025.
Das Urteil befasst sich mit einem wichtigen Thema. Es geht um das Urheberrecht und Künstliche Intelligenz (KI). Konkret geht es um große Sprachmodelle (Large Language Models, LLMs). Diese Modelle sind die Basis für Chatbots wie beispielsweise ChatGPT.
🏛️ Worum geht es in dem Rechtsstreit?
Die Klägerin in diesem Fall ist eine Verwertungsgesellschaft. Sie vertritt die Rechte von Textdichtern und Komponisten. Sie hat die Betreiber der KI-Sprachmodelle (die Beklagten) verklagt.
Der Streit dreht sich um neun Liedtexte. Die Klägerin behauptet, die Betreiber hätten diese Texte unerlaubt genutzt. Dies geschah, als die Texte zum Trainieren der KI-Modelle verwendet wurden.
Die Klägerin fordert:
- Die Betreiber müssen die unerlaubte Nutzung unterlassen. Das bedeutet, sie sollen die Liedtexte nicht weiter in den Modellen verwenden und nicht als Output ausgeben.
- Die Betreiber müssen Auskunft darüber geben, wie oft sie die Texte genutzt und welche Einnahmen sie damit erzielt haben.
- Die Betreiber müssen den entstandenen Schaden ersetzen.
🧠 Was ist das Problem mit der KI-Nutzung?
Das Hauptproblem ist die sogenannte Memorisierung der Texte.
Was bedeutet Memorisierung?
Wenn ein KI-Sprachmodell trainiert wird, lernt es aus riesigen Textmengen. Die Liedtexte waren Teil dieser Trainingsdaten.
- Experten vermuten: Wenn ein Text mehrfach in den Trainingsdaten vorkommt, speichert das Modell den Text quasi.
- Diese Speicherung wird als Memorisierung bezeichnet.
- Die Folge der Memorisierung ist die Regurgitation. Das ist der Fachbegriff dafür, dass das Modell den gespeicherten Text später wieder ausgibt.
- Im Prozess konnte das Gericht feststellen, dass die Liedtexte im Modell memorisiert waren. Das Gericht konnte dies beweisen, indem es die Liedtexte mit den Outputs (den Antworten des Chatbots) verglich.
Unzulässige Vervielfältigung durch Memorisierung von Werken im und durch KI-Sprachmodell
Die Liedtexte im Modell: Eine Vervielfältigung
Das Gericht stuft die Memorisierung der Liedtexte im KI-Modell als Vervielfältigung ein.
- Eine Vervielfältigung (§ 16 UrhG) ist die unerlaubte körperliche Festlegung eines Werkes. Das bedeutet, das Werk wird auf einem Datenträger oder in einer technischen Form gespeichert.
- Das Gericht sagt: Die Liedtexte sind in den Parametern des Modells körperlich festgelegt (gespeichert). Parameter sind die Werte, die das Modell beim Training lernt.
- Obwohl die Texte zerlegt werden, können sie mit technischen Hilfsmitteln (dem Chatbot und einem Bildschirm) wieder wahrnehmbar gemacht werden.
- Das macht die Speicherung zu einer unerlaubten Vervielfältigung im Sinne des Urheberrechts.
⚖️ Die Entscheidung des Gerichts
Das Gericht gab der Klägerin in den meisten Punkten recht. Die Klage ist überwiegend begründet.
🛑 Unterlassungsanspruch (Verbot)
Die Betreiber müssen die Nutzung der Liedtexte unterlassen – und zwar aus zwei Gründen:
1. Verbot der Vervielfältigung im Modell
- Die Memorisierung der Liedtexte in den Modellen ist eine unerlaubte Vervielfältigung.
- Die Betreiber können sich nicht auf die Schrankenbestimmung des Urheberrechts (§ 44b UrhG) berufen.
- Diese Schranke erlaubt zwar die Vervielfältigung von Texten für Text- und Data-Mining. Text- und Data-Mining ist die automatisierte Analyse von Texten, um Informationen (Muster, Trends) zu gewinnen.
- Aber: Die dauerhafte Speicherung und Reproduktion ganzer Werke (die Memorisierung) geht über diese erlaubte Analyse hinaus. Sie dient nicht nur der Vorbereitung des Data-Mining.
- Daher fällt die Memorisierung nicht unter die erlaubte Ausnahme.
2. Verbot der Nutzung bei der Ausgabe (Outputs)
- Die Ausgabe der Liedtexte durch den Chatbot (die Outputs) verletzt ebenfalls das Urheberrecht.
- Die Outputs stellen eine öffentliche Zugänglichmachung (§ 19a UrhG) und eine Vervielfältigung (§ 16 UrhG) dar.
- Öffentliche Zugänglichmachung: Die Betreiber stellen die Liedtexte auf Abruf über den Chatbot bereit. Das geschieht für eine große und unbestimmte Zahl von Nutzern. Das ist eine Handlung der Wiedergabe.
- Vervielfältigung: Die Outputs werden auf den Geräten der Nutzer und in der Chat-Historie der Betreiber gespeichert. Das ist eine Vervielfältigung.
- Die Betreiber sind für diese Verletzungen verantwortlich (Täter). Sie haben die Modelle trainiert und deren Architektur bestimmt. Sie haben die Tatherrschaft.
- Die Outputs waren oft nur Umgestaltungen (veränderte Versionen, sogenannte Halluzinationen), aber die originellen Elemente der Liedtexte waren darin wiedererkennbar. Das reicht für eine Verletzung aus.
- Auch hier können die Betreiber keine Ausnahme (wie Zitatrecht oder Privatkopie) geltend machen.
💰 Auskunfts- und Schadensersatzanspruch
- Die Betreiber müssen Auskunft über den Umfang und die Einnahmen aus der Nutzung der Liedtexte geben.
- Die Betreiber sind zum Schadensersatz verpflichtet. Sie waren zumindest fahrlässig. Sie wussten seit 2021, dass ihre Modelle zur Memorisierung von Trainingsdaten neigen.
❌ Abgelehnte Ansprüche
- Das Gericht wies den Anspruch ab, zu verbieten, die veränderten Texte den ursprünglichen Textdichtern zuzuschreiben. Das ist ein Verstoß gegen das allgemeine Persönlichkeitsrecht der Textdichter. Das Gericht sah hier keinen ausreichenden Eingriff in die Persönlichkeitssphäre.
- Die Einwände der Beklagten, die Klage sei rechtsmissbräuchlich oder die geforderte Unterlassung sei unverhältnismäßig, wurden abgelehnt.
💡 Fazit
Das Urteil stärkt die Rechte von Urhebern im Zeitalter der KI.
- Die Speicherung urheberrechtlich geschützter Werke im KI-Modell (Memorisierung) ist eine unerlaubte Vervielfältigung.
- Die anschließende Ausgabe dieser Werke durch den Chatbot (Output) ist eine unerlaubte öffentliche Zugänglichmachung und Vervielfältigung.
- KI-Betreiber können sich für diese Handlungen nicht auf die Ausnahmen für Text- und Data-Mining berufen.
- Die Betreiber haften für diese Urheberrechtsverletzungen.
Dieses Urteil ist ein wichtiges Signal für die Entwicklung und den Betrieb von KI-Sprachmodellen. Es stellt klar, dass Urheberrechte auch in der digitalen Welt geschützt bleiben müssen.