Dürfen KI-Bildgeneratoren mit meinen Bildern trainiert werden?

Spätestens seitdem es über https://haveibeentrained.com/ möglich ist, herauszufinden, ob Bilder zum Gegenstand von Datasets gemacht wurden, die dazu dienen, KI-Bildgeneratoren wir Midjourney oder Stable Dissusion zu trainieren, macht sich in der Foto-Gemeinde Unmut breit.  

Doch worum geht es?  

KI-Bildgeneratoren, die über die gezielte Eingabe von Schlagworten teils fotorealistische Bilder erzeugen, treiben im Moment ohnehin schon vielen Fotografen Sorgenfalten auf die Stirn. Vielerorts wird befürchtet, dass hierdurch der Verkauf von realen Bildern einbrechen könnte, da potentielle Kunden sich ganz einfach ihre Fotos selbst erstellen können. Die Nutzungsrechte der meisten KI-Generatoren sind großzügig bis schrankenlos, sodass, die entsprechende Bildqualität vorausgesetzt, hier tatsächlich ein attraktives Bildangebot entsteht.  

Diese Bildgeneratoren, bzw. die dahinterstehenden Algorithmen, wollen trainiert werden. Und dafür benötigt man viele (viele) Bilder, die meist aus dem Netz genommen und in sogenannten Datasets zusammengestellt werden, um hieran den jeweiligen Algorithmus trainieren zu können.  

Genau hier liegt nun der Ansatzpunkt für Fotografen, deren Bilder zu solchen Trainingszwecken genutzt wurden. Das Zusammenstellen in einem Dataset dürfte aktuell er einzige verlässliche Punkt sein, an dem das Urheberrechtsgesetz einhaken kann und den Urhebern einen Anspruch an die Hand gibt. Werden die Bilder nämlich nicht direkt aus dem Netz gelesen, sondern in einem Dataset aufbereitet, erfolgt mit der dafür erforderlichen Kopie des Bildes eine Vervielfältigungshandlung nach § 16 UrhG, die grundsätzlich nur mit einem Nutzungsrecht seitens des Urhebers legal ist.  

Das würde bedeuten, dass man sich an das jeweilige Unternehmen wenden und eine Unterlassung der Verwendung der Bilder in Form des Datasets wie auch eine Zusicherung, dass dies künftig nicht mehr passieren wird, verlangen könnte.  

Mit der letzten Urheberrechtsnovelle haben nun aber zwei Schrankenbestimmungen Einzug ins UrhG gefunden, die gerade diese Art der Vervielfältigung (auch “Data Mining” genannt) erlauben sollen. 

 Die Vorschrift des § 44b UrhG erlaubt mit gewissen Einschränkungen jegliche Form des Data Mining. Also auch kommerzieller Natur: 

 

“§ 44b Text und Data Mining 

(1) Text und Data Mining ist die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen. 

(2) Zulässig sind Vervielfältigungen von rechtmäßig zugänglichen Werken für das Text und Data Mining. Die Vervielfältigungen sind zu löschen, wenn sie für das Text und Data Mining nicht mehr erforderlich sind. 

(3) Nutzungen nach Absatz 2 Satz 1 sind nur zulässig, wenn der Rechtsinhaber sich diese nicht vorbehalten hat. Ein Nutzungsvorbehalt bei online zugänglichen Werken ist nur dann wirksam, wenn er in maschinenlesbarer Form erfolgt.” 

 

Da alle Veröffentlichungen im Netz “rechtmäßig” im Sinne dieser Norm sein dürften, solange sich dem Betrachter nicht das Gegenteil aufdrängt, ist der Nutzungsvorbehalt wohl die einzige Möglichkeit, sich gegen die Vervielfältigung zum Zwecke des Date Mining zu wehren. Dieser muss ausreichend prominent auf der jeweiligen Website oder evtl. Auch in den Metadaten und in maschinenlesbarer Form vorliegen. Wann der Vorbehalt ausreicht, wird die Rechtsprechung klären müssen.  

Schließlich sieht § 60d UrhG vor, dass Data Mining zum Zwecke der wissenschaftlichen Forschung sogar im Falle eines solchen Nutzungsvorbehalts legal sein soll: 

 

“§ 60d Text und Data Mining für Zwecke der wissenschaftlichen Forschung 

(1) Vervielfältigungen für Text und Data Mining (§ 44b Absatz 1 und 2 Satz 1) sind für Zwecke der wissenschaftlichen Forschung nach Maßgabe der nachfolgenden Bestimmungen zulässig. 

(2) Zu Vervielfältigungen berechtigt sind Forschungsorganisationen. Forschungsorganisationen sind Hochschulen, Forschungsinstitute oder sonstige Einrichtungen, die wissenschaftliche Forschung betreiben, sofern sie  

(3) Zu Vervielfältigungen berechtigt sind ferner  

1.Bibliotheken und Museen, sofern sie öffentlich zugänglich sind, sowie Archive und Einrichtungen im Bereich des Film- oder Tonerbes (Kulturerbe-Einrichtungen), 

2.einzelne Forscher, sofern sie nicht kommerzielle Zwecke verfolgen. 

(4) Berechtigte nach den Absätzen 2 und 3, die nicht kommerzielle Zwecke verfolgen, dürfen Vervielfältigungen nach Absatz 1 folgenden Personen öffentlich zugänglich machen:  

1.einem bestimmt abgegrenzten Kreis von Personen für deren gemeinsame wissenschaftliche Forschung sowie 

2.einzelnen Dritten zur Überprüfung der Qualität wissenschaftlicher Forschung. 

Sobald die gemeinsame wissenschaftliche Forschung oder die Überprüfung der Qualität wissenschaftlicher Forschung abgeschlossen ist, ist die öffentliche Zugänglichmachung zu beenden. 

(5) Berechtigte nach den Absätzen 2 und 3 Nummer 1 dürfen Vervielfältigungen nach Absatz 1 mit angemessenen Sicherheitsvorkehrungen gegen unbefugte Benutzung aufbewahren, solange sie für Zwecke der wissenschaftlichen Forschung oder zur Überprüfung wissenschaftlicher Erkenntnisse erforderlich sind. 

(6) Rechtsinhaber sind befugt, erforderliche Maßnahmen zu ergreifen, um zu verhindern, dass die Sicherheit und Integrität ihrer Netze und Datenbanken durch Vervielfältigungen nach Absatz 1 gefährdet werden.” 

 

Im Moment scheinen sich Einrichtungen, welche Datasets zusammenstellen, eher auf § 60d UrhG zu berufen, sodass insbesondere in der Außenwirkung der Forschungszweck stark in den Vordergrund gestellt wird. Ob gerade die Weitergabe an die kommerziell tätigen Anbieter von Bildgeneratoren dazu führen wird, dass ihnen dieser wissenschaftliche Status abzuerkennen und die Zusammenstellung der Daten damit wieder nach § 44b UrhG zu betrachten ist, wird ebenfalls die Rechtsprechung klären müssen. Hiervon wird es im Ergebnis also abhängen, wir die Frage zu beantworten ist, ob KI-Bildgeneratoren an den Fotos einzelner Fotografen trainiert werden darf oder eben nicht.  

Zusammengefasst sind die Möglichkeiten für Fotografen im Moment aber leider eher dürftig. Bis auf das Setzen des oben genannten Nutzungsvorbehaltes, welcher bestenfalls dazu führen würde, dass die eigenen Bilder nicht mehr zu kommerziellen Trainingszwecken genutzt werden dürfen, bleibt im Wesentlichen nur das Abwarten mit dem Blick auf die Rechtsprechung, die angesichts des hochtechnischen und komplizierten Themas wohl auch nicht in den nächsten Wochen oder Monaten mit Konkretisierungen aufwarten wird.  


Der Text dieses Blogposts ist im Rahmen der rechtlichen Kolumne von Rechtsanwalt Sebastian Deubelli in der ProfiFoto erschienen.