Schlagwort-Archive: Have I Been Trained?

LAION-​Verein droht Urhebern, die ihre Daten aus KI-​Trainingssatz nehmen wollen mit Schadensersatzansprüchen

Letzten Monat hat­te ich in die­sem Artikel erklärt, wie die Künstliche Intelligenz am Beispiel von Stable Diffusion funktioniert.

Darin kam der Verein LAION e.V. zur Sprache, wel­cher etli­che rie­si­ge Datenpakete anbie­tet, mit wel­chen KIs trai­niert wer­den. Eines die­ser Pakete heißt z.B. LAION 5B, weil es ca. 5,85 Millarden („5,85 Billions“ im Englischen, daher 5B) Datensätze umfasst.

Ein Datensatz besteht zum Beispiel aus der URL zu einer Bilddatei, der dazu­ge­hö­ri­gen Bildbeschreibung, den Bildmaßen in Pixeln, der ver­wen­de­ten Sprache sowie eini­ger ande­rer Faktoren.

Anfangs war weni­gen Leuten bekannt, wel­che Bilder genau im Datenset ent­hal­ten waren. Aber die Künstler Mat Dryhurst, Holly Herndon und Jordan Meyer grün­de­ten die Firma Spawning, wel­che wie­der­um die Webseite „Have I Been Trained?“ ins Leben riefen.

Dort kön­nen Leute – ver­ein­facht erklärt – die oben genann­ten Bildbeschreibungen durch­su­chen, um zu sehen, wel­che Bilder in den KI-​Trainingssets ent­hal­ten sind.

Viele Urheber nutz­ten die Webseite und fan­den wenig über­ra­schend vie­le Treffer. Auch aus mei­nem Portfolio konn­te ich nach einer kur­zen Stichprobe hau­fen­wei­se Bilder fin­den, haupt­säch­lich mit Wasserzeichen aus den Bildagentur-​Portfolios, aber auch von Kundenseiten oder Webseiten, die selbst ille­gal Bildersammlungen anbieten:

Haufenweise Links zu mei­nen Fotos aus mei­nem Shutterstock-​Portfolio im LAION-Datensatz

In den Kommentaren eines mei­ner Social Media-​Profile las ich den Hinweis eines Fotografen, dass der den Verein LAION gebe­ten hat­te, sei­ne Werke aus den Trainingsdaten zu neh­men und als Antwort mit Schadensersatzansprüchen bedroht wur­de, soll­te er auf sei­nem Anliegen beharren.

Das kam mir wie eine wil­de Geschichte vor, bis ich die Fakten über­prüf­te. Ich nahm Einsicht in den Schriftsatz der Anwaltskanzlei und schick­te am 13.02.2023 selbst eine Anfrage an LAION e.V. per Email mit der Bitte, mei­ne Werke aus dem Trainingssatz zu entfernen.

Nur einen Tag spä­ter erhielt ich am 14.02.2023 tat­säch­lich Post („vor­ab per Email“) von der Hannover Anwaltskanzlei „Heidrich Rechtsanwälte“ im Auftrag von LAION e.V., übri­gens fast wort­gleich mit dem Schreiben, wel­ches ich von dem ande­ren Fotografen wei­ter­ge­lei­tet bekom­men habe.

In dem Schreiben heißt es:

Sehr geehr­ter Herr Kneschke,

hier­mit zei­gen wir an, dass wir die recht­li­chen Interessen des LAION e.V., Herman-​Lange-​Weg 6, 21035 Hamburg, ver­tre­ten. Die ord­nungs­ge­mä­ße Bevollmächtigung wird anwalt­lich versichert.

Grund unse­res Schreibens ist Ihre E‑Mail vom 13. Februar 2023 an unse­re Mandantin, wel­che uns die­se zur Beantwortung vor­ge­legt hat.

  1. Bei unse­rer Mandantin han­delt es sich um einen im Vereinsregister ein­ge­tra­ge­nen, nicht-​gewinnorientierten Verein, der es sich zur Aufgabe gemacht hat, selbst­ler­nen­de Algorithmen im Sinne künst­li­cher Intelligenz fort­zu­ent­wi­ckeln und der brei­ten Öffentlichkeit zur Verfügung zu stel­len. Die Vereinsmitglieder sowie der Vorstand sind im Rahmen der Vereinsarbeit ehren­amt­lich for­schend tätig.

    Unsere Mandantin hat bereits im Sommer 2022 umfang­reich Rechtsrat zu ver­schie­de­nen Problemstellungen – ins­be­son­de­re urhe­ber­recht­li­chen Implikationen – im Zusammenhang mit ihrer Tätigkeit auf dem Gebiet der Erforschung von Kl-​gestützten Bildgenerierungsmodellen ein­ge­holt. Unserer Mandantin war es von Anfang an wich­tig, dass im Rahmen ihrer Tätigkeit kei­ne Rechte Dritter ver­letzt wer­den. Unsere Mandantin hält sich aus­nahms­los an die bestehen­den gesetz­li­chen Vorgaben, ins­be­son­de­re aus dem Urheber- und Datenschutzrecht.
  2. Unsere Mandantin unter­hält ledig­lich eine Datenbank, die Links zu im Internet öffent­lich abruf­ba­ren Bilddateien ent­hält. Sie kann zwar nicht aus­schlie­ßen, dass in der Datenbank auch Links zu Bildern ent­hal­ten sind, deren Urheber Sie sind. Da unse­re Mandantin aber jeden­falls kei­ne der von Ihnen monier­ten Fotografien spei­chert, besteht Ihrerseits auch kein Anspruch auf Löschung. Es exis­tie­ren bei unse­rer Mandantin schlicht kei­ne Bilder, die gelöscht wer­den könn­ten.

    Das Bereitstellen von Links stellt nach der höchst­rich­ter­li­chen Rechtsprechung auch kei­ne Verletzung von Urheberrechten dar. Das Bereitstellen eines Links dient ledig­lich dem Auffinden eines ohne­hin im Internet abruf­ba­ren Inhalts. Der hin­ter einem Link ste­hen­de Inhalt kann auch nur an der ver­link­ten Stelle und nicht andern­orts abge­ru­fen wer­den, sodass ins­be­son­de­re kei­ne Vervielfältigung im Sinne des Urheberrechts vor­liegt. Unsere Mandantin trägt kei­ne Verantwortung für die Inhalte auf ande­ren Websites.
  3. Auf Nutzungen Ihrer Werke durch Dritte hat unse­re Mandantin natur­ge­mäß kei­nen Einfluss. Eine Nutzung durch Dritte wird aber ohne­hin auch nicht erst durch unse­re Mandantin ermög­licht. Die von unse­rer Mandantin ver­link­ten Bildinhalte sind frei im Internet abruf­bar. Sofern Sie eine rechts­ver­let­zen­de Nutzung durch Dritte fest­stel­len, müs­sen Sie sich an die­se Personen wenden.
  4. Ihre Fristsetzung betrach­ten wir daher als gegen­stands­los. Wir wei­sen außer­dem dar­auf hin, dass unse­re Mandantin gemäߧ 97a Abs. 4 UrhG Schadenersatzansprüche gel­tend machen kann, wenn die­se unbe­rech­tigt urhe­be­recht­lich in Anspruch genom­men wird.

    Wir hof­fen, dass wir Ihre Bedenken mit unse­ren Ausführungen aus­räu­men konn­ten und ste­hen Ihnen für Rückfragen gern zur Verfügung.“

Ja, ihr lest das voll­kom­men rich­tig. Urhebern, die nicht wol­len, dass ihr Werke für Trainingszwecke benutzt wer­den, wer­den Schadensersatzansprüche angedroht.

Die rest­li­chen Aussagen im Schreiben las­sen einen eben­falls etwas ver­wun­dert zurück. Die angeb­li­che Gemeinnützigkeit eines Vereins, wel­cher unter ande­rem von einer Firma wie Stability AI mit­fi­nan­ziert wird, wel­che wie­der­um von den Ergebnissen des Vereins kom­mer­zi­ell pro­fi­tiert, hat min­des­tens ein „Geschmäckle“, was mei­ner Meinung nach danach riecht, hier absicht­lich eine Konstruktion zu bau­en, wel­che Haftungsfragen aus­la­gern soll.

Auch das „ledig­li­che Unterhalten einer Datenbank“ ist hier mei­ner Meinung nach etwas zu kurz gegrif­fen, da neben den oben genann­ten Datenpunkten auch Daten wie „simi­la­ri­ty“, „pwa­ter­mark“ oder „punsafe“ ent­hal­ten, wel­che nicht ein­fach aus­ge­le­sen, son­dern erstellt wer­den müs­sen, was ver­mut­lich zumin­dest eine tem­po­ra­re Speicherung der Bilddaten erfor­dert haben wird. Das legt auch die­se Infografik nahe, in der erklärt wird, das die Bilder und Daten „her­un­ter­ge­la­den“ wurden:

Das sind im Detail aber auch Vermutungen, wel­che wahr­schein­lich bei einem Gerichtsprozess geklärt wer­den müssen.

Genau so einen Prozess wer­de ich nun anstre­ben, um die Frage rich­ter­lich klä­ren zu las­sen, ob das Vorgehen tat­säch­lich recht­lich so ein­wand­frei ist, wie die Anwaltskanzlei behauptet.

Falls ihr als Urheber eben­falls eini­ge eurer Werke im Datensatz von LAION fin­det und viel­leicht auch Post von obi­ger Anwaltskanzlei erhal­ten wollt, fin­det ihr die Emailadresse für eure Anfrage zur Datenlöschung hier im Impressum von LAION e.V..