Schlagwort-Archive: Trainingsdaten

Das Geheimnis hinter dem Hype-​Text2Video KI-​Generator Sora von OpenAI

Seit Tagen ist in der KI-​Welt kaum von etwas ande­rem die Rede als den beein­dru­cken­den Ergebnissen von Sora.

Sora ist der Name des kürz­lich hier vor­ge­stell­ten Text2Video-​Generators der Firma OpenAI, wel­che auch schon den Text2Bild-​Generator Dall‑E und das Text2Text-​Generator ChatGPT ver­öf­fent­licht hat.

Standbild aus einem Sora-​Video [Montage]

Mit Sora kön­nen durch simp­le Texteingaben hoch­auf­lö­sen­de Videos von bis zu einer Minute Länge gene­riert werden.

Einen Überblick über die Ergebnisse fin­det ihr hau­fen­wei­se, ent­we­der auf der Sora-​Seite direkt oder bei YouTube, zum Beispiel in die­sem Video:

Ki-​Videos, mit­tels Sora von OpenAI generiert

Auf der offi­zi­el­len Webseite wird lang und breit über die Sicherheit des Tools gere­det und ger­ne erwähnt, dass geplant sei, den C2PA-Metadaten-​Standard zur Erkennung von KI-​generierten Inhalten zu unter­stüt­zen. Auffällig ist aber, dass ande­re Informationen fehlen.

Das Geheimnis der Trainingsdaten

Auffällig ist, dass an kei­ner Stelle der Vorstellung von Sora dar­auf ein­ge­gan­gen wird, wie genau das KI-​Tool trai­niert wur­de. Welche Daten wur­den dafür verwendet?

Im tech­ni­schen Report fin­det sich nur der lapi­da­re Satz:
“[…] we train text-​conditional dif­fu­si­on models joint­ly on vide­os and images of varia­ble dura­ti­ons, reso­lu­ti­ons and aspect ratios.“

Ach? Ja, das war uns allen klar, aber wel­che Videos und Bilder habt ihr dafür nun genau benutzt?

In der Vergangenheit hat sich OpenAI nicht mit Ruhm bekle­ckert, wenn es um Rücksicht auf Urheberrechte bei Trainingsdaten ging.

Das „Opt-​Out“, um zu ver­hin­dern, dass Bilder für Dall‑E trai­niert wer­den, ist berüch­tigt und wur­de auch viel zu spät ein­ge­führt. Dall‑E 2 wur­de laut die­ser GitHub-​Seite unter ande­rem auch mit Hilfe des Vereins LAION e.V. trai­niert, wel­chen ich selbst gera­de wegen Urheberrechtsverletzung ver­kla­ge.

Auch beim zwei­ten Produkt von OpenAI, ChatGPT, liegt die Sache ähn­lich. OpenAI wird gera­de von der Zeitung New York Times ver­klagt, weil urhe­ber­recht­lich geschütz­te Trainingsdaten der Zeitung für das KI-​Training von ChatGPT benutzt wor­den seien.

Bei einer Zeugenanhörung von OpenAI durch das Oberhaus des bri­ti­schen Parlaments fiel sei­tens OpenAI auch der fol­gen­schwe­re Satz:

Because copy­right today covers vir­tual­ly every sort of human expression–including blog posts, pho­to­graphs, forum posts, scraps of soft­ware code, and govern­ment documents–it would be impos­si­ble to train today’s lea­ding AI models wit­hout using copy­righ­ted mate­ri­als. Limiting trai­ning data to public domain books and dra­wings crea­ted more than a cen­tu­ry ago might yield an inte­res­t­ing expe­ri­ment, but would not pro­vi­de AI sys­tems that meet the needs of today’s citizens“

Frei über­setzt: Ohne den Zugriff auf urhe­ber­recht­lich geschütz­te Trainingsdaten könn­ten wir unse­re Tools nicht anbieten.

Genau wegen die­sem bis­her schon bekann­ten rück­sichts­lo­sen Umgang mit Urheberrechten muss eine Frage viel lau­ter gestellt werden:

Welche Videos und Bilder wur­den für das Training der Sora-​KI verwendet?

Die Wahrscheinlichkeit ist sehr hoch, dass auch hier – ähn­lich wie beim Training von Dall‑E und ChatGPT urhe­ber­recht­lich geschütz­te Videos (und Bilder) zum Einsatz kamen.

Selbst Wasserzeichen in Videos sind für KI-​Entwickler schon lan­ge kein Hindernis mehr. Schon 2017 hat Google selbst eine Technik vor­ge­stellt, mit der Wasserzeichen aus Bildern ent­fernt wer­den können.

Auch der LAION-​Verein bie­tet auf GitHub ein kos­ten­lo­ses Tool für die „Wasserzeichen-​Erkennung“ an. Von der Erkennung zur Entfernung ist es für geüb­te Programmierer dann nur noch ein klei­ner Schritt, über den aus recht­li­chen Gründen nicht so ger­ne öffent­lich gere­det wird.
Manchmal aber doch:

Aus dem #video-​generation Kanal des Discord-​Servers von LAION
Aus dem #video-​generation Kanal des Discord-​Servers von LAION

Bei LAION wird zwar an einem eige­nen Text2Video-​Generator namens phena­ki gear­bei­tet, die tech­ni­schen Details des Trainings sind denen von Sora aber sehr ähn­lich, soweit ich das beur­tei­len kann.

Die Wahrscheinlichkeit, dass OpenAI daher mit der glei­chen Rücksichtslosigkeit wie LAION gegen­über Urhebern beim KI-​Training vor­geht, hal­te ich für hoch, zumal die bis­he­ri­gen Aussagen und Handlungen von OpenAI lei­der nicht geeig­net sind, Zweifel zu zerstreuen.

Beim gan­zen Hype vom SORA und dem Staunen über die tol­len Ergebnisse soll­te nicht ver­ges­sen wer­den zu fra­gen, wel­che (Video-)Künstler beim Training betei­ligt waren.

Wirestock und die fehlenden Datendeals-​Auszahlungen: Reaktion von Wirestock

Vor eini­gen Wochen mel­de­te sich ein Fotograf bei mir, wel­cher über die Distributionsplattform Wirestock sei­ne Bilder bei ver­schie­de­nen Bildagenturen anbie­tet, dar­un­ter auch Shutterstock und Pond5.

Er wies mich dar­auf hin, dass die Einnahmen, wel­che Wirestock im Rahmen von „Dataset Earnings“ erhal­ten wür­de, bis­her nicht an die Fotografen aus­ge­zahlt habe.

Dataset Earnings“ sind Erlöse aus den Fotografen-​Portfolios, wenn die­se Bilder oder Videos zum Beispiel für KI-​Trainings benutzt wer­den. Mehr dazu fin­det ihr in die­sem Artikel von mir.

Bisher gab es drei Auszahlungsrunden für die­se Arten von Erlösen:

  • Shutterstock: Auszahlung Dezember 2022
  • Pond5: Auszahlung April 2023
  • Shutterstock: Auszahlung Anfang Mai 2023

Von die­sen drei Auszahlungen haben die Wirestock-​Fotografen bis­her kein Geld gesehen.

Da der Fotograf bei Wirestock nur sehr aus­wei­chen­de Antworten auf sei­ne Nachfragen erhal­ten hat, wand­te er sich an mich. Ich habe das mit ande­ren Wirestock-​Fotografen veri­fi­ziert und eben­falls eine Anfrage an Wirestock gestellt.

Wirestock ändert die AGB

Vorher noch änder­te Wirestock aber ein­sei­tig die Allgemeinen Geschäftsbedingungen (AGB): Statt der bis­her gül­ti­gen Aufteilung der Erlöse 85% an die Fotografen und 15% an Wirestock wur­de am 26. Mai 2023 von Wirestock beschlos­sen, dass für „Dataset Deals“ nur 50% aus­ge­zahlt wür­den. Fotografen kön­nen die­se Deals per Opt-​Out ver­wei­gern laut Wirestock:

Antwort von Wirestock

Auf mei­ne Nachfrage kam dann am 3.8.2023 von Wirestock end­lich eine Stellungnahme, die ich hier über­setzt wiedergebe:

Wir freu­en uns, Ihnen mit­tei­len zu kön­nen, dass wir die Einnahmen aus den Dataset-​Deals so bald wie mög­lich an unse­re Fotografen aus­schüt­ten wer­den. Wirestock ist der­zeit dabei, die Einnahmen aus allen Dataset-​Deals zu akku­mu­lie­ren und beab­sich­tigt, sie vor Ende des drit­ten Quartals 2023 auf die Konten der Fotografen zu über­tra­gen. Bezüglich des Provisionssatzes soll­te ich klar­stel­len, dass der in Ihrer E‑Mail genann­te Provisionssatz von 15 % für Foto‑, Video- und Vektorlizenzen gilt. Bis Anfang die­ses Jahres gab es bei Wirestock kein Dataset-​Deals-​Programm, und daher wur­de auch kein Provisionssatz für Dataset-​Deals festgelegt.

Mit der Einführung des Dataset Deals-​Programms haben wir einen Provisionssatz von 50 % für die­se spe­zi­el­len Geschäfte ein­ge­führt. Wir sind uns der Bedeutung von Transparenz und Fairness bewusst und glau­ben, dass der Provisionssatz von 50 % ein aus­ge­wo­ge­nes Verhältnis zwi­schen dem Nutzen für unse­re Teilnehmer und der Deckung der mit Dataset-​Transaktionen ver­bun­de­nen höhe­ren Bearbeitungskosten darstellt.“

Wenn wir den gan­zen Marketing-​Fluff weg­las­sen, ist die ein­zig kon­kre­te Aussage: Ja, bis­her wur­den die Datendeals-​Honorare nicht aus­ge­zahlt, wir wer­den das bis Ende September 2023 nach­ho­len. Mal sehen, ob das stimmt.

Ich bezweif­le auch, dass Wirestock „höhe­re Bearbeitungskosten“ hat, die mehr als das drei­fa­che des bis­he­ri­gen Honorars recht­fer­ti­gen. Die Argumentation, dass die 15% Kommission nur für Lizenzen gel­ten, hal­te ich für stark an den Haaren her­bei­ge­zo­gen, da auch beim oben gezeig­ten Screenshot davon die Rede ist, dass beim „Daten Deal“ Bilder lizen­ziert werden.

Weitere Änderungen bei Wirestock

Einen Tag vor Erhalt der Email von Wirestock gab es noch eine wei­te­re Nachricht. Wirestock kün­dig­te an, dass ab sofort min­des­tens ein kos­ten­pflich­ti­ger „Premium-​Account“ Pflicht sei für die Möglichkeit, sei­ne Bilder mit­tels Wirestock bei ver­schie­de­nen Bildagenturen anzu­bie­ten. Zusätzlich wird die monat­li­che Uploadmenge beschränkt. Kostenpunkt: Aktuell 12,99 USD pro Monat für den Upload von 100 Bildern im Monat. Die 15% Kommissionen (bzw. 50% bei Dataset Deals) will Wirestock aber natür­lich wei­ter­hin von den Honoraren abziehen.

Als Begründung wird die stark wach­sen­de Anzahl an Bildeinreichungen genannt, wel­che zu Verzögerungen bei der Überprüfung und Verarbeitung von Inhalten, zu stei­gen­den Kosten für deren Kennzeichnung, Überprüfung, Verarbeitung und Speicherung und zu
Schwierigkeiten bei der Aufdeckung von Urheberrechtsverletzungen und betrü­ge­ri­schen Aktivitäten führt.

Diese Änderung reiht sich damit ein in die län­ger wer­den­de Liste frag­wür­di­ger Business-​Entscheidungen wie die Einführung des „Instant Pay“-Programms in Zusammenarbeit mit Freepik.

Was sagt ihr zu die­sen Änderungen?

Analyse: Wie viel zahlt Shutterstock für KI-​Trainingsdaten an Anbieter?

Im Juli 2021 hat­te die Bildagentur Shutterstock ange­kün­digt, auch KI-​Datensätze anzu­bie­ten, mit denen kom­mer­zi­el­le Anbieter ihre KI-​Tools trai­nie­ren können.

Im Oktober 2022 führ­te Shutterstock dann in Zusammenarbeit mit den Firmen OpenAI und LG selbst die Möglichkeit ein, dass Kunden KI-​generierte Bilder auf deren Webseite erstel­len und lizen­zie­ren können.

Für sol­che KI-​Nutzungen des Bildmaterials sol­len die Anbieter ent­schä­digt werden.

Shutterstock selbst schreibt dazu im oben ver­link­ten FAQ:

Wir haben einen Shutterstock Anbieter-​Fonds ein­ge­rich­tet, der Shutterstock Anbieter direkt ver­gü­tet, wenn ihr geis­ti­ges Eigentum bei der Entwicklung von KI-​generativen Modellen wie dem OpenAI-​Modell ver­wen­det wur­de, indem Daten aus dem Shutterstock Archiv lizen­ziert wer­den. Darüber hin­aus wird Shutterstock die Anbieter wei­ter­hin für die zukünf­ti­ge Lizenzierung von KI-​generiertem Content über das Shutterstock AI-​Content-​Generierungstool ver­gü­ten.  Die Einnahmen aus den OpenAI-​Datensätzen, auch bekannt als Datendeals, wer­den im 4. Quartal 2022 ver­öf­fent­licht.
[…]

Dies ist eine neue Einnahmequelle für Anbieter, die über Downloads und die Lizenzierung ein­zel­ner Assets für kom­mer­zi­el­le oder redak­tio­nel­le Zwecke hin­aus­geht. Wir sind fest ent­schlos­sen, unse­re Anbieter als Partner auf die­sem Weg ein­zu­be­zie­hen und sicher­zu­stel­len, dass sie einen Anteil an den Erlösen aus Computer-​Vision-​Datensätzen (auch bekannt als Datendeals) und gene­ra­ti­ven KI-​Modellen erhal­ten, wenn ihre Inhalte bei der Erstellung die­ser Technologien ver­wen­det wer­den. Angesichts des kol­lek­ti­ven Charakters die­ses Produkts haben wir ein Vergütungsmodell für Umsatzbeteiligungen ent­wi­ckelt.
[…]

Die Anbieter erhal­ten einen Anteil am gesam­ten Vertragswert, der von den Plattform-​Partnern bezahlt wird. Der Anteil, den ein­zel­ne Anbieter erhal­ten, steht im Verhältnis zum Umfang ihrer Inhalte und Metadaten, die in den erwor­be­nen Datensätzen ent­hal­ten sind. Obwohl die Aufnahme in Datensätze nicht wie ande­re ein­zel­ne Downloads in der Ergebnisübersicht berück­sich­tigt wird, wie die Einnahmen aus ande­ren E‑Commerce-​Produkten, unter­hält Shutterstock eine inter­ne Datenbank aller Assets, die in allen Datensätzen ver­wen­det wer­den, die seit der Einführung die­ses Produkts erstellt wur­den, sodass wir unse­re Anbieter ent­spre­chend ver­gü­ten können.


Anbieter, deren Inhalte zum Trainieren eines der Modelle ver­wen­det wur­den, wer­den für die Rolle, die ihr geis­ti­ges Eigentum bei der Entwicklung der ursprüng­li­chen Modelle gespielt hat, sowie durch Lizenzgebührenzahlungen ver­gü­tet, die an zukünf­ti­ge gene­ra­ti­ve Lizenzierungsaktivitäten gebun­den sind. Wenn Ihre Inhalte in bei­den ver­wen­det wur­den, erhal­ten Sie eine Zahlung, die Sie für die Aufnahme Ihrer Inhalte in bei­de Datensätze (auch bekannt als Datendeals) ver­gü­tet, und Sie haben Zugang zu mehr zukünf­ti­gen Umsatzmöglichkeiten, da Sie Anspruch auf eine Vergütung aus unse­rem Anbieter-​Fonds für zukünf­ti­ge Lizenzierungsereignisse der gene­ra­ti­ven Content-​Entwicklung aus bei­den Modellen haben.
[…]“

Alle sechs Monate wer­den laut Shutterstock die gesam­mel­ten Einnahmen an die Fotografen aus­ge­schüt­tet und in der Umsatzübersicht im Bereich „Anbieterfonds“ (auf eng­lisch „Contributor Funds“) angezeigt. 

So ganz scheint das nicht zu stim­men, da ich erst­ma­lig eine sol­che Auszahlung Ende Dezember 2022 erhal­ten hat­te und nun – wie vie­le ande­re Fotografen auch – Anfang Mai 2023 noch mal. Aber viel­leicht pen­delt sich das noch ein.

Analyse der Anbieterfonds-Umsätze

Da das eine ganz neue Einnahmekategorie für Fotografen ist, habe ich in auf mei­ner Facebook-​Seite dar­um gebe­ten, dass mei­ne Leser*innen ihre Umsätze aus den Anbieterfonds sowie ihre Portfolio-​Größe nen­nen, damit ich die Durchschnitts- und Maximalwerte berech­nen kann.

Es haben sich mit mir 58 Leute betei­ligt, was die Ergebnisse ganz aus­sa­ge­kräf­tig macht, wie ich fin­de. Hier die visu­el­le Darstellung:

Im Durchschnitt betrug die Portfolio-​Größe der Teilnehmer*innen 6343 Bilder. Da der Durchschnitt durch eini­ge extre­me Werte schnell ver­zehrt wer­den kann, ist der Median in der Regel aus­sa­ge­kräf­ti­ger. Dieser betrug 2112 Bilder.

Der durch­schnitt­li­che Erlös aus den Anbieterfonds pro Bild lag gerun­det bei 0,0078 USD/​Bild. Der Median lag bei 0,0069 USD/​Bild. Mein eige­ner Wert lag übri­gens zwi­schen die­sen bei­den Werten.

Als span­nen­de Fußnote: Der höchs­te Wert betrug 0,0378 USD/​Bild (bei einem eher klei­nen Portfolio mit 1480 Bildern).

Die gesam­te Auszahlung pro Portfolio der Teilnehmer*innen lag durch­schnitt­lich bei 45,97 USD, der Median bei 18,49 USD.

Hochrechnung auf das gesamte Shutterstock-Portfolio

Für das ers­te Quartal 2023 hat das bör­sen­no­tier­te Unternehmen Shutterstock 615 Mio. Bilder im Portfolio gemeldet.

Auszug aus den Shutterstock-Quartalszahlen für das 1. Quartal 2023

Wenn wir nun grob den Median von 0,0069 USD pro Bild auf die 615 Mio. Bilder im gesam­ten Portfolio umrech­nen, erhal­ten wir einen Wert von ca. 4,24 Mio. USD an Auszahlungen als Schätzung für die Anbieterfonds allein für die Mai-Auszahlung.

Angesichts des gemel­de­ten Umsatzes von über 215 Mio. USD sowie einem Nettogewinn von über 32 Mio. USD ist das durch­aus ein Wert, der nicht so ins Gewicht fällt für Shutterstock.

Perspektive

Sind ca. zwei Drittel eines US-​Cents pro Bild im Portfolio zwei Mal im Jahr aus­rei­chend und fair, um die KI-​Nutzung der eige­nen Bilder aus­rei­chend zu kom­pen­sie­ren? Ich leh­ne mich mal weit aus dem Fenster und behaup­te: Nein.

Allein mein Einnahmeverlust bei Shutterstock im letz­ten Monat war höher als ein Jahres-​KI-​Anbieterfonds-​Erlös bei Shutterstock, wes­halb mei­ne Zweifel groß sind, dass die­se Beträge moti­vie­rend genug für die Fotograf*innen sind, um wei­ter­hin qua­li­ta­tiv hoch­wer­ti­ge Inhalte zu produzieren.

Wie seht ihr das?