
Das mit Spannung erwartete Urteil in dem vom Stockfotografen Robert K. gegen den LAION e.V. vor dem Landgericht Hamburg angestrengten Verfahren (LG Hamburg, Az. 310 O 227/23) ist am 27.9.2024 ergangen.
Die für Urheberrecht zuständige 10. Zivilkammer wies die Klage des Fotografen, der seine Urheberrechte dadurch verletzt sah, dass LAION Links auf seine Werke in den KI-Trainigsdatensatz “LAION 5B” aufgenommen hatte, in allen Punkten ab. Wie ich bereits u.a. auf diesem Blog, aber auch in einer thematisch einschlägigen Podcast-Session auf dem Barcamp Kiel im August 2024 dargestellt habe, ging es im Kern um zweieinhalb Fragen:
- Ist die Aufnahme von Links in einen KI-Trainigsdatensatz überhaupt als “Vervielfältigung” im Sinne von § 16 UrhG zu werten?
- Wenn ja: Ist dies ohne Einwilligung zulässig, weil es sich um eine nur vorübergehende Vervielfältigung (§ 44a UrhG) oder um Text und Data-Mining nach §§ 44b oder gar 60d UrhG handelt?
- Wenn ja: Wie sieht hier ggf. ein wirksamer, d.h. maschinenlesbarer Opt-Out (“Nutzungsvorbehalt”) nach § 44b Abs. 3 UrhG aus ?
Das Gericht beantwortete diese Fragen, kurz gesagt wie folgt:
- Im Rahmen des durchgeführten Downloads hat der Beklagte diese Fassung vervielfältigt i.S.d. § 16 Abs. 1 UrhG, ohne dafür eine Zustimmung des Klägers eingeholt zu haben. (Urteil, Rz. 55).
- Die Vervielfältigung war zwar nicht durch die Schrankenregelung des § 44a UrhG gedeckt (im Folgenden 1.), und ob sich der Beklagte auf die Schrankenregelung des § 44b UrhG berufen kann, erscheint als zweifelhaft (im Folgenden 2.). Letzteres bedarf aber vorliegend keiner abschließenden Entscheidung, da die Vervielfältigungshandlung jedenfalls durch die Schrankenregelung des § 60d UrhG gedeckt war. (Urteil, Rz. 56).
- Die Kammer neigt allerdings dazu, als “maschinenverständlich” auch einen allein in “natürlicher Sprache” verfassten Nutzungsvorbehalt anzusehen (Urteil, Rz. 102).
Etwas länger gesagt:
Das Landgericht geht erst einmal ohne viel Aufhebens von einer Vervielfältigungshandlung (§ 16 UrhG) aus, weil im Rahmen der Herstellung des KI-Trainigsdatensatzes eine Vervielfältigungshandlung des fraglichen Bildmaterials stattgefunden haben muss. Damit ist aber nicht gesagt, dass der Trainigsdatensatz, der schlussendlich nur Links zu den fraglichen, frei verfügbaren Fotos enthält, selbst eine Vervielfältigung der Fotografien enthält.
Diese Vervielfältigung wäre aber auch ohne Einwilligung des Urhebers zulässig, wenn sie nur vorübergehend gemäß § 44a UrhG wäre. Dies verneint das Gericht, denn die Vervielfältigung sei hier “weder flüchtig noch begleitend” gewesen.
Sodann widmet sich die Kammer den wirklich interessanten Fragen, nämlich insbesondere der danach, ob die Kopie von urheberrechtlich geschützten Werken zur Erstellung von KI-Trainigsdaten in ihrer konkreten Ausgestaltung unter die Urheberrechtsschranke von § 44b bzw. § 60d UrhG fällt. Dann müsste sie als Text und Data-Mining anzusehen sein.
Das bejaht das Gericht (für diesen konkreten Fall):
“Der Beklagte hat die Vervielfältigungshandlung zum Zwecke der Gewinnung von Informationen über “Korrelationen” im Wortsinn des § 44b Abs. 1 UrhG vorgenommen. Der Beklagte hat das streitgegenständliche Lichtbild von seinem ursprünglichen Speicherort heruntergeladen, um mittels einer bereits verfügbaren Software ‒ offenbar der Anwendung … von … ‒ den Bildinhalt mit der zu dem Text bereits hinterlegten Bildbeschreibung abzugleichen. Diese Analyse der Bilddatei zum Abgleich mit einer vorbestehenden Bildbeschreibung stellt ohne Weiteres eine Analyse zum Zwecke der Gewinnung von Informationen über “Korrelationen” (nämlich der Frage der Nicht-/Übereinstimmung von Bildern und Bildbeschreibungen) dar. Dass der Beklagte die in den Datensatz … aufgenommenen Bilder auf diese Art und Weise analysiert hat, wurde klägerseits als solches nicht bestritten.”
Allerdings: Im Rahmen von § 44b UrhG hat der Urheber das Recht, einen Nutzungsvorbehalt zu erklären (§ 44b Abs. 2 UrhG). Er kann also quasi mit einem Opt-Out rechtsverbindlich festlegen, dass ein “unbeschränktes” Text und Data Mining nach § 44b Abs. 1,2 UrhG nicht zulässig ist. Dieses “Opt Out” muss in maschinenlesbarer Form erklärt werden. Die Bildagentur, von deren Website die Vervielfältigung im vorliegenden Fall vorgenommen wurde, hatte dort nun auch einen entsprechenden Hinweis in Textform hinterlegt. Dieser lautete:
“RESTRICTIONS
YOU MAY NOT:
(…)
18. Use automated programs, applets, bots or the like to access the …com website or any content thereon for any purpose, including, by way of example only, downloading Content, indexing, scraping or caching any content on the website.”
OK – Reicht das nun für “maschinenlesbar” i.S.v. § 44b Abs. 3 UrhG aus?
Es werden für diese Frage verschiedene technische Ansätze diskutiert (hierzu nochmals der Hinweis auf Jurafunk Nr. 162, in dem wir diese auch besprechen). Das Gericht “neigt” hier aber dazu, “maschinenlesbar” im Sinne von “Maschinenverständlichkeit” und damit sehr weit zu verstehen.
Dann wäre diese Erklärung “wohl” ausreichend, um maschinenlesbar i.S.d. § 44b Abs. 2 UrhG zu gelten. Das ist erst einmal eine gute Nachricht, denn so werden die Hürden an einen wirksamen Opt-Out nicht unnötig hoch gehängt. Allerdings: Wirklich entschieden hat das Gericht hier nichts. Denn es kam, zumindest nach Ansicht des Landgerichts Hamburg, hierauf im Ergebnis gar nicht an.
Denn es bleibt noch ein kleiner Plott-Twist namens § 60d UrhG.
Auch hier geht es wieder um Text und Data Mining, das ja (Zumindest nach Ansicht des LG Hamburg) hier gegeben ist. Nach § 60a UhrG ist die Vervielfältigung zum Zwecke des Text und Data Mining nun sogar ohne Rücksicht auf einen erklärten Nutzungsvorbehalt zulässig, wenn das Text und Data Mining der wissenchaftlichen Forschung dient und nicht kommerzielle Zwecke verfolgt.
Dazu das Gericht:
Danach kann – entgegen der Auffassung des Klägers – auch bereits die Erstellung eines Datensatzes der streitgegenständlichen Art, der Grundlage für das Trainieren von KI-Systemen sein kann, durchaus als wissenschaftliche Forschung im vorstehenden Sinne anzusehen sein. Zwar mag die Erstellung des Datensatzes als solche noch nicht mit einem Erkenntnisgewinn verbunden sein; sie ist aber grundlegender Arbeitsschritt mit dem Ziel, den Datensatz zum Zwecke späteren Erkenntnisgewinns einzusetzen. Dass eine solche Zielsetzung auch im vorliegenden Fall bestand, kann bejaht werden. Dafür genügt es, dass der Datensatz – unstreitig – kostenfrei veröffentlicht und damit gerade (auch) auf dem Gebiet künstlicher neuronaler Netze Forschenden zur Verfügung gestellt wurde.
Zusammenfassend also folgende Erkenntnis:
Ein erstinstanzlicher Sieg auf ganzer Linie für den LAION e.V. und damit letzlich auch ein Sieg im Sinne der Informationsfreiheit. Die Lektüre des Urteils in Gänze lohnt sich im Übrigen sehr, da das Gericht sich sehr ausführlich mit dem derzeitigen Diskussionsstand zu den aufgeworfenen Fragen auseinandersetzt.
Allerdings: Das Urteil ist zum Zeitpunkt der Abfassung dieses Beitrages noch nicht rechtskräftig und es ist wohl nicht unwahrscheinlich, dass das letzte Wort hier noch nicht gesprochen ist.