Schlagwort-Archive: Urheberrecht

Das Geheimnis hinter dem Hype-​Text2Video KI-​Generator Sora von OpenAI

Seit Tagen ist in der KI-​Welt kaum von etwas ande­rem die Rede als den beein­dru­cken­den Ergebnissen von Sora.

Sora ist der Name des kürz­lich hier vor­ge­stell­ten Text2Video-​Generators der Firma OpenAI, wel­che auch schon den Text2Bild-​Generator Dall‑E und das Text2Text-​Generator ChatGPT ver­öf­fent­licht hat.

Standbild aus einem Sora-​Video [Montage]

Mit Sora kön­nen durch simp­le Texteingaben hoch­auf­lö­sen­de Videos von bis zu einer Minute Länge gene­riert werden.

Einen Überblick über die Ergebnisse fin­det ihr hau­fen­wei­se, ent­we­der auf der Sora-​Seite direkt oder bei YouTube, zum Beispiel in die­sem Video:

Ki-​Videos, mit­tels Sora von OpenAI generiert

Auf der offi­zi­el­len Webseite wird lang und breit über die Sicherheit des Tools gere­det und ger­ne erwähnt, dass geplant sei, den C2PA-Metadaten-​Standard zur Erkennung von KI-​generierten Inhalten zu unter­stüt­zen. Auffällig ist aber, dass ande­re Informationen fehlen.

Das Geheimnis der Trainingsdaten

Auffällig ist, dass an kei­ner Stelle der Vorstellung von Sora dar­auf ein­ge­gan­gen wird, wie genau das KI-​Tool trai­niert wur­de. Welche Daten wur­den dafür verwendet?

Im tech­ni­schen Report fin­det sich nur der lapi­da­re Satz:
“[…] we train text-​conditional dif­fu­si­on models joint­ly on vide­os and images of varia­ble dura­ti­ons, reso­lu­ti­ons and aspect ratios.“

Ach? Ja, das war uns allen klar, aber wel­che Videos und Bilder habt ihr dafür nun genau benutzt?

In der Vergangenheit hat sich OpenAI nicht mit Ruhm bekle­ckert, wenn es um Rücksicht auf Urheberrechte bei Trainingsdaten ging.

Das „Opt-​Out“, um zu ver­hin­dern, dass Bilder für Dall‑E trai­niert wer­den, ist berüch­tigt und wur­de auch viel zu spät ein­ge­führt. Dall‑E 2 wur­de laut die­ser GitHub-​Seite unter ande­rem auch mit Hilfe des Vereins LAION e.V. trai­niert, wel­chen ich selbst gera­de wegen Urheberrechtsverletzung ver­kla­ge.

Auch beim zwei­ten Produkt von OpenAI, ChatGPT, liegt die Sache ähn­lich. OpenAI wird gera­de von der Zeitung New York Times ver­klagt, weil urhe­ber­recht­lich geschütz­te Trainingsdaten der Zeitung für das KI-​Training von ChatGPT benutzt wor­den seien.

Bei einer Zeugenanhörung von OpenAI durch das Oberhaus des bri­ti­schen Parlaments fiel sei­tens OpenAI auch der fol­gen­schwe­re Satz:

Because copy­right today covers vir­tual­ly every sort of human expression–including blog posts, pho­to­graphs, forum posts, scraps of soft­ware code, and govern­ment documents–it would be impos­si­ble to train today’s lea­ding AI models wit­hout using copy­righ­ted mate­ri­als. Limiting trai­ning data to public domain books and dra­wings crea­ted more than a cen­tu­ry ago might yield an inte­res­t­ing expe­ri­ment, but would not pro­vi­de AI sys­tems that meet the needs of today’s citizens“

Frei über­setzt: Ohne den Zugriff auf urhe­ber­recht­lich geschütz­te Trainingsdaten könn­ten wir unse­re Tools nicht anbieten.

Genau wegen die­sem bis­her schon bekann­ten rück­sichts­lo­sen Umgang mit Urheberrechten muss eine Frage viel lau­ter gestellt werden:

Welche Videos und Bilder wur­den für das Training der Sora-​KI verwendet?

Die Wahrscheinlichkeit ist sehr hoch, dass auch hier – ähn­lich wie beim Training von Dall‑E und ChatGPT urhe­ber­recht­lich geschütz­te Videos (und Bilder) zum Einsatz kamen.

Selbst Wasserzeichen in Videos sind für KI-​Entwickler schon lan­ge kein Hindernis mehr. Schon 2017 hat Google selbst eine Technik vor­ge­stellt, mit der Wasserzeichen aus Bildern ent­fernt wer­den können.

Auch der LAION-​Verein bie­tet auf GitHub ein kos­ten­lo­ses Tool für die „Wasserzeichen-​Erkennung“ an. Von der Erkennung zur Entfernung ist es für geüb­te Programmierer dann nur noch ein klei­ner Schritt, über den aus recht­li­chen Gründen nicht so ger­ne öffent­lich gere­det wird.
Manchmal aber doch:

Aus dem #video-​generation Kanal des Discord-​Servers von LAION
Aus dem #video-​generation Kanal des Discord-​Servers von LAION

Bei LAION wird zwar an einem eige­nen Text2Video-​Generator namens phena­ki gear­bei­tet, die tech­ni­schen Details des Trainings sind denen von Sora aber sehr ähn­lich, soweit ich das beur­tei­len kann.

Die Wahrscheinlichkeit, dass OpenAI daher mit der glei­chen Rücksichtslosigkeit wie LAION gegen­über Urhebern beim KI-​Training vor­geht, hal­te ich für hoch, zumal die bis­he­ri­gen Aussagen und Handlungen von OpenAI lei­der nicht geeig­net sind, Zweifel zu zerstreuen.

Beim gan­zen Hype vom SORA und dem Staunen über die tol­len Ergebnisse soll­te nicht ver­ges­sen wer­den zu fra­gen, wel­che (Video-)Künstler beim Training betei­ligt waren.

Gerichtstermin im Verfahren gegen LAION e.V. wegen Urheberrechtsverletzung steht fest

Meine Klage gegen den deut­schen Verein LAION e.V., wel­cher unter ande­rem Trainingsdatensätze für KI-​Anwendungen bereit­stellt, hat welt­weit für viel Aufmerksamkeit gesorgt.

Da es auch regel­mä­ßig vie­le Anfragen zum aktu­el­len Stand des Verfahren gibt, hier ein kur­zes Update.

Den Hintergrund für das Einreichen mei­ner Klage könnt ihr hier und hier aus­führ­lich in mei­nen Blogartikeln nachlesen.

Kurz gefasst befin­den sich etli­che mei­ner Fotos im Datensatz „LAION 5B“. Anhand eines kon­kre­ten Fotos als Beispiel for­de­re ich Unterlassung und Auskunft über den Nutzungsumfang, da ich der Meinung bin, dass die Verwendung des Fotos für das Trainieren des Datensatzes eine urhe­ber­recht­lich rele­van­te Vervielfältigung darstellt.

Der Verein LAION e.V. sieht das natur­ge­mäß anders, wie in den bei­den zitier­ten Blogartikeln gut erkenn­bar ist. Daher blieb uns nur die Möglichkeit des Klagewegs.

Zeitlicher Ablauf der Klage:

  • 27.04.2023: Klage ein­ge­reicht beim Landgericht Hamburg
  • 28.06.2023: Verfügung des Landgericht Hamburg, der Verein kann Verteidigungsbereitschaft anzei­gen und Klage erwidern
  • 01.08.2023: LAION e.V. reicht Klageerwiderung ein
  • 20.09.2023: Stellungnahme mei­nes Anwalts zur Klageerwiderung
  • 25.04.2024 um 15:00 Uhr: Gerichtstermin vor dem Landgericht Hamburg

Das Landgericht Hamburg hat also in ca. einem hal­ben Jahr den Gerichtstermin ange­setzt, in dem dann münd­lich wei­ter über die Klage ver­han­delt wer­den wird. Das Verfahren ist öffent­lich. Hier die aktu­el­le Zusammenfassung des Falls durch die mich ver­tre­ten­de Kanzlei SLD.

Andere aktuelle Klagen im KI-Bereich

Ich bin jedoch nicht der ein­zi­ge, wel­cher sich dar­an stört, dass sei­ne urhe­ber­recht­lich geschütz­ten Werke ohne Nachfragen oder Entlohnung durch KI-​Firmen ver­wer­tet werden.

In den USA läuft aktu­ell die­se Sammeklage drei­er Künstlerinnen gegen Stability AI, Midjourney und DeviantArt.

Die US-​Komikerin Sarah Silverman klagt der­zeit zusam­men mit zwei ande­ren Autoren gegen den ChatGPT-​Betreiber OpenAI und den Facebook-​Mutterkonzern Meta wegen der Verwendung eini­ger ihrer Bücher in den KI-Trainingsdaten.

Auch gegen Google läuft die­se Klage wegen der uner­laub­ten Verwendung von Daten für das KI-Training.

Schon län­ger bekannt ist die Klage der Bildagentur Getty Images gegen Stability AI wegen deren Verwendung von Bildern im KI-Trainingsdatensatz.

Podcast eines Fotoproduzenten Folge 38 – Interview mit Heike Ollertz, Marco Urban und Julia Laatsch vom Berufsverband FREELENS

Am Rande mei­ner Auftritte auf der dies­jäh­ri­gen Fotomesse Photopia habe ich die Chance genutzt, mich näher über den größ­ten Fotografie-​Berufsverband in Deutschland zu infor­mie­ren: FREELENS.

Vertreten wur­de der Verband im Interview durch die Geschäftsführerin Heike Ollertz, den Vorstandsvorsitzenden Marco Urban sowie Julia Laatsch aus dem Beirat und als FREELENS-​Sprecherin im Deutschen Fotorat.

Fast eine Stunde lang spra­chen wir zusam­men über die Entstehung, die Aufgaben und Zielsetzung von FREELENS. Außerdem wid­me­ten wir uns Themen wie der Nachwuchsförderung, der „Initative Urheberrecht“, Plattformlizenzen, Presseausweisen und das hei­ße Eisen Künstliche Intelligenz durf­te natür­lich auch nicht fehlen.

Das Gespräch fand in der Presse-​Lounge der Messe Hamburg statt, wo im Hintergrund lei­der ab und zu Mittagsgeschirr abge­räumt wur­de. Als Bonus haben wir im Hintergrund auch das Geburtstagsständchen für einen Journalismus-​Kollegen ver­steckt, wer auf­merk­sam zuhört, wird es bestimmt ent­de­cken in der heu­ti­gen Folge vom „Podcast eines Fotoproduzenten“:

PORTFOLIO:
Statt eines Portfolios gibt es hier einen Auszug aus der Kampagne „#wiral­le­s­ind­free­lens“:

SHOWNOTES:

Webseite von FREELENS
Instagram-​Kanal von FREELENS
Facebook-​Seite von FREELENS
Webseite der Initiative Urheberrecht
Webseite vom Deutschen Fotorat

Podcast eines Fotoproduzenten Folge 36 – Interview mit dem Copytrack-​Gründer Marcus Schmitt

Neben den vie­len zah­len­den Kunden, die ihre Bilder legal erwer­ben, gibt es lei­der auch viel zu vie­le Leute, wel­che Bilder ohne die erfor­der­li­chen Nutzungsrechte ein­set­zen und damit Urheberrechtsverletzungen bege­hen.

Das Aufspüren und Nachverfolgen die­ser ille­ga­len Bildnutzungen kann zeit- und ner­ven­rau­bend sein, wes­halb es eini­ge Dienstleister gibt, wel­che damit wer­ben, dass sie auto­ma­ti­siert Bildnutzungen im Internet tra­cken und auch Bilderklau juris­tisch ver­fol­gen können.

Einer die­ser Anbieter ist die Berliner Firma Copytrack, wel­che von Marcus Schmitt gegrün­det und auch von ihm als CEO gelei­tet wird.

Wir haben aus­führ­lich über sei­ne Erfahrungen mit Rechtsverletzungen gere­det, in wel­chen Ländern am meis­ten und am wenigs­ten Chancen auf Erfolg bestehen, wel­cher Bilderdiebstahl bis­her am teu­ers­ten war, auf was Fotografen ach­ten soll­ten und eini­ges mehr:

PORTFOLIO:

Ein Portfolio in dem Sinne gibt es bei die­ser Folge logi­scher­wei­se nicht, daher statt­des­sen eini­ge anony­mi­sier­te Screenshots aus dem User-​Backend von Copytrack:

das Dashboard von Copytrack
die Inbox von Copytrack mit den Suchergebnissen
eini­ge System Tags, wel­che Copytrack auto­ma­tisch ver­ge­ben kann
die Systematik der ein­ge­reich­ten Fälle bei Copytrack

SHOWNOTES:

Robert Kneschke: Abmahnung erhalten wegen kritischem Blogbeitrag

Wer Journalismus nicht nur als Verlängerung der PR-​Abteilung von gro­ßen Firmen oder aus­ge­la­ger­te Marketing-​Abteilung sieht, wird über bran­chen­re­le­van­te Themen auch manch­mal kri­tisch berich­ten müssen.

So ver­su­che ich das auch hier im Blog. Leider führt das logi­scher­wei­se dazu, dass die Personen, wel­che kri­tisch beleuch­tet wer­den, das Licht der Öffentlichkeit scheu­en und ver­su­chen, die Berichterstattung zu behin­dern oder gar zu verhindern.

So auch beim Blogartikel „Rafael Classen, Abmahnungen, feh­len­de IPTC-​Daten und Wirestock: Der aktu­el­le Stand“ vom 5.8.2022. Die Anwaltskanzlei von Herrn Classen hat­te mir schon vor der Berichterstattung nahe­ge­legt, dass ich lie­ber „Abstand von dem geplan­ten Vorhaben“ neh­men solle.

Einige Wochen nach der Veröffentlichung flat­ter­te mir nun eine Abmahnung der glei­chen Anwaltskanzlei im Namen von Herr Classen ins Haus wegen angeb­li­cher „Verletzung des Wettbewerbs- und Persönlichkeitsrechts“.

Die Abmahnung umfasst gan­ze 24 Seiten mit einem Gegenstandswert von 80.000 Euro und der Forderung nach Abgabe einer Unterlassungserklärung bis zum 30.08.2022 mit etli­chen Unterpunkten, auf was ich alles ver­zich­ten solle.

Die Verletzung des Wettbewerbsrechts sol­le ent­stan­den sein, weil ich (als direk­ter Konkurrent) mit angeb­lich unwah­ren Aussagen im Blogbeitrag die Tätigkeiten und per­sön­li­chen sowie geschäft­li­chen Verhältnisse des Mandanten her­ab­set­zen und ver­un­glimp­fen würde.

Persönlichkeitsrechte wür­de ich des­halb ver­let­zen, weil ich den Mandanten angeb­lich anpran­gernd in der Überschrift nen­ne, ihn im Blog fort­wäh­rend auf­grei­fe und zum Gegenstand der Berichterstattung mache, obwohl das von mir kri­ti­sier­te Verhalten bran­chen­üb­lich und recht­lich zuläs­sig sei.

Ich habe im Rahmen der jour­na­lis­ti­schen Sorgfaltspflicht sowohl dar­auf geach­tet, alle genann­ten Fakten zu prü­fen sowie dem Betroffenen eine Gelegenheit zur Stellungnahme zu bieten.

Daher sehe ich der Auseinandersetzung gelas­sen ent­ge­gen und bin zuver­sicht­lich, dass ich einem Gericht schlüs­sig ver­mit­teln kann, war­um der Artikel so ver­öf­fent­licht wurde.