Schlagwort-Archive: Trainingsdaten

Das Geheimnis hinter dem Hype-Text2Video KI-Generator Sora von OpenAI

16. Februar 2024 Robert Kneschke 4 Kommentare

Seit Tagen ist in der KI-Welt kaum von etwas anderem die Rede als den beeindruckenden Ergebnissen von Sora.

Sora ist der Name des kürzlich hier vorgestellten Text2Video-Generators der Firma OpenAI, welche auch schon den Text2Bild-Generator Dall‑E und das Text2Text-Generator ChatGPT veröffentlicht hat.

Standbild aus einem Sora-Video [Montage]

Mit Sora können durch simple Texteingaben hochauflösende Videos von bis zu einer Minute Länge generiert werden.

Einen Überblick über die Ergebnisse findet ihr haufenweise, entweder auf der Sora-Seite direkt oder bei YouTube, zum Beispiel in diesem Video:

Ki-Videos, mittels Sora von OpenAI generiert

Auf der offiziellen Webseite wird lang und breit über die Sicherheit des Tools geredet und gerne erwähnt, dass geplant sei, den C2PA-Metadaten-Standard zur Erkennung von KI-generierten Inhalten zu unterstützen. Auffällig ist aber, dass andere Informationen fehlen.

Das Geheimnis der Trainingsdaten

Auffällig ist, dass an keiner Stelle der Vorstellung von Sora darauf eingegangen wird, wie genau das KI-Tool trainiert wurde. Welche Daten wurden dafür verwendet?

Im technischen Report findet sich nur der lapidare Satz:
“[…] we train text-conditional diffusion models jointly on videos and images of variable durations, resolutions and aspect ratios.“

Ach? Ja, das war uns allen klar, aber welche Videos und Bilder habt ihr dafür nun genau benutzt?

In der Vergangenheit hat sich OpenAI nicht mit Ruhm bekleckert, wenn es um Rücksicht auf Urheberrechte bei Trainingsdaten ging.

Das „Opt-Out“, um zu verhindern, dass Bilder für Dall‑E trainiert werden, ist berüchtigt und wurde auch viel zu spät eingeführt. Dall‑E 2 wurde laut dieser GitHub-Seite unter anderem auch mit Hilfe des Vereins LAION e.V. trainiert, welchen ich selbst gerade wegen Urheberrechtsverletzung verklage.

Auch beim zweiten Produkt von OpenAI, ChatGPT, liegt die Sache ähnlich. OpenAI wird gerade von der Zeitung New York Times verklagt, weil urheberrechtlich geschützte Trainingsdaten der Zeitung für das KI-Training von ChatGPT benutzt worden seien.

Bei einer Zeugenanhörung von OpenAI durch das Oberhaus des britischen Parlaments fiel seitens OpenAI auch der folgenschwere Satz:

„Because copyright today covers virtually every sort of human expression–including blog posts, photographs, forum posts, scraps of software code, and government documents–it would be impossible to train today’s leading AI models without using copyrighted materials. Limiting training data to public domain books and drawings created more than a century ago might yield an interesting experiment, but would not provide AI systems that meet the needs of today’s citizens“

Frei übersetzt: Ohne den Zugriff auf urheberrechtlich geschützte Trainingsdaten könnten wir unsere Tools nicht anbieten.

Genau wegen diesem bisher schon bekannten rücksichtslosen Umgang mit Urheberrechten muss eine Frage viel lauter gestellt werden:

Welche Videos und Bilder wurden für das Training der Sora-KI verwendet?

Die Wahrscheinlichkeit ist sehr hoch, dass auch hier – ähnlich wie beim Training von Dall‑E und ChatGPT urheberrechtlich geschützte Videos (und Bilder) zum Einsatz kamen.

Selbst Wasserzeichen in Videos sind für KI-Entwickler schon lange kein Hindernis mehr. Schon 2017 hat Google selbst eine Technik vorgestellt, mit der Wasserzeichen aus Bildern entfernt werden können.

Auch der LAION-Verein bietet auf GitHub ein kostenloses Tool für die „Wasserzeichen-Erkennung“ an. Von der Erkennung zur Entfernung ist es für geübte Programmierer dann nur noch ein kleiner Schritt, über den aus rechtlichen Gründen nicht so gerne öffentlich geredet wird.
Manchmal aber doch:

Aus dem #video-generation Kanal des Discord-Servers von LAION

Bei LAION wird zwar an einem eigenen Text2Video-Generator namens phenaki gearbeitet, die technischen Details des Trainings sind denen von Sora aber sehr ähnlich, soweit ich das beurteilen kann.

Die Wahrscheinlichkeit, dass OpenAI daher mit der gleichen Rücksichtslosigkeit wie LAION gegenüber Urhebern beim KI-Training vorgeht, halte ich für hoch, zumal die bisherigen Aussagen und Handlungen von OpenAI leider nicht geeignet sind, Zweifel zu zerstreuen.

Beim ganzen Hype vom SORA und dem Staunen über die tollen Ergebnisse sollte nicht vergessen werden zu fragen, welche (Video-)Künstler beim Training beteiligt waren.

Bildagenturen

Wirestock und die fehlenden Datendeals-Auszahlungen: Reaktion von Wirestock

17. August 2023 Robert Kneschke

Vor einigen Wochen meldete sich ein Fotograf bei mir, welcher über die Distributionsplattform Wirestock seine Bilder bei verschiedenen Bildagenturen anbietet, darunter auch Shutterstock und Pond5.

Er wies mich darauf hin, dass die Einnahmen, welche Wirestock im Rahmen von „Dataset Earnings“ erhalten würde, bisher nicht an die Fotografen ausgezahlt habe.

„Dataset Earnings“ sind Erlöse aus den Fotografen-Portfolios, wenn diese Bilder oder Videos zum Beispiel für KI-Trainings benutzt werden. Mehr dazu findet ihr in diesem Artikel von mir.

Bisher gab es drei Auszahlungsrunden für diese Arten von Erlösen:

Shutterstock: Auszahlung Dezember 2022
Pond5: Auszahlung April 2023
Shutterstock: Auszahlung Anfang Mai 2023

Von diesen drei Auszahlungen haben die Wirestock-Fotografen bisher kein Geld gesehen.

Da der Fotograf bei Wirestock nur sehr ausweichende Antworten auf seine Nachfragen erhalten hat, wandte er sich an mich. Ich habe das mit anderen Wirestock-Fotografen verifiziert und ebenfalls eine Anfrage an Wirestock gestellt.

Wirestock ändert die AGB

Vorher noch änderte Wirestock aber einseitig die Allgemeinen Geschäftsbedingungen (AGB): Statt der bisher gültigen Aufteilung der Erlöse 85% an die Fotografen und 15% an Wirestock wurde am 26. Mai 2023 von Wirestock beschlossen, dass für „Dataset Deals“ nur 50% ausgezahlt würden. Fotografen können diese Deals per Opt-Out verweigern laut Wirestock:

Antwort von Wirestock

Auf meine Nachfrage kam dann am 3.8.2023 von Wirestock endlich eine Stellungnahme, die ich hier übersetzt wiedergebe:

„Wir freuen uns, Ihnen mitteilen zu können, dass wir die Einnahmen aus den Dataset-Deals so bald wie möglich an unsere Fotografen ausschütten werden. Wirestock ist derzeit dabei, die Einnahmen aus allen Dataset-Deals zu akkumulieren und beabsichtigt, sie vor Ende des dritten Quartals 2023 auf die Konten der Fotografen zu übertragen. Bezüglich des Provisionssatzes sollte ich klarstellen, dass der in Ihrer E‑Mail genannte Provisionssatz von 15 % für Foto‑, Video- und Vektorlizenzen gilt. Bis Anfang dieses Jahres gab es bei Wirestock kein Dataset-Deals-Programm, und daher wurde auch kein Provisionssatz für Dataset-Deals festgelegt.

Mit der Einführung des Dataset Deals-Programms haben wir einen Provisionssatz von 50 % für diese speziellen Geschäfte eingeführt. Wir sind uns der Bedeutung von Transparenz und Fairness bewusst und glauben, dass der Provisionssatz von 50 % ein ausgewogenes Verhältnis zwischen dem Nutzen für unsere Teilnehmer und der Deckung der mit Dataset-Transaktionen verbundenen höheren Bearbeitungskosten darstellt.“

Wenn wir den ganzen Marketing-Fluff weglassen, ist die einzig konkrete Aussage: Ja, bisher wurden die Datendeals-Honorare nicht ausgezahlt, wir werden das bis Ende September 2023 nachholen. Mal sehen, ob das stimmt.

Ich bezweifle auch, dass Wirestock „höhere Bearbeitungskosten“ hat, die mehr als das dreifache des bisherigen Honorars rechtfertigen. Die Argumentation, dass die 15% Kommission nur für Lizenzen gelten, halte ich für stark an den Haaren herbeigezogen, da auch beim oben gezeigten Screenshot davon die Rede ist, dass beim „Daten Deal“ Bilder lizenziert werden.

Weitere Änderungen bei Wirestock

Einen Tag vor Erhalt der Email von Wirestock gab es noch eine weitere Nachricht. Wirestock kündigte an, dass ab sofort mindestens ein kostenpflichtiger „Premium-Account“ Pflicht sei für die Möglichkeit, seine Bilder mittels Wirestock bei verschiedenen Bildagenturen anzubieten. Zusätzlich wird die monatliche Uploadmenge beschränkt. Kostenpunkt: Aktuell 12,99 USD pro Monat für den Upload von 100 Bildern im Monat. Die 15% Kommissionen (bzw. 50% bei Dataset Deals) will Wirestock aber natürlich weiterhin von den Honoraren abziehen.

Als Begründung wird die stark wachsende Anzahl an Bildeinreichungen genannt, welche zu Verzögerungen bei der Überprüfung und Verarbeitung von Inhalten, zu steigenden Kosten für deren Kennzeichnung, Überprüfung, Verarbeitung und Speicherung und zu
Schwierigkeiten bei der Aufdeckung von Urheberrechtsverletzungen und betrügerischen Aktivitäten führt.

Diese Änderung reiht sich damit ein in die länger werdende Liste fragwürdiger Business-Entscheidungen wie die Einführung des „Instant Pay“-Programms in Zusammenarbeit mit Freepik.

Was sagt ihr zu diesen Änderungen?

Bildagenturen, Künstliche Intelligenz, Statistik

Analyse: Wie viel zahlt Shutterstock für KI-Trainingsdaten an Anbieter?

8. Mai 2023 Robert Kneschke 2 Kommentare

Im Juli 2021 hatte die Bildagentur Shutterstock angekündigt, auch KI-Datensätze anzubieten, mit denen kommerzielle Anbieter ihre KI-Tools trainieren können.

Im Oktober 2022 führte Shutterstock dann in Zusammenarbeit mit den Firmen OpenAI und LG selbst die Möglichkeit ein, dass Kunden KI-generierte Bilder auf deren Webseite erstellen und lizenzieren können.

Für solche KI-Nutzungen des Bildmaterials sollen die Anbieter entschädigt werden.

Shutterstock selbst schreibt dazu im oben verlinkten FAQ:

„Wir haben einen Shutterstock Anbieter-Fonds eingerichtet, der Shutterstock Anbieter direkt vergütet, wenn ihr geistiges Eigentum bei der Entwicklung von KI-generativen Modellen wie dem OpenAI-Modell verwendet wurde, indem Daten aus dem Shutterstock Archiv lizenziert werden. Darüber hinaus wird Shutterstock die Anbieter weiterhin für die zukünftige Lizenzierung von KI-generiertem Content über das Shutterstock AI-Content-Generierungstool vergüten. Die Einnahmen aus den OpenAI-Datensätzen, auch bekannt als Datendeals, werden im 4. Quartal 2022 veröffentlicht.
[…]

Dies ist eine neue Einnahmequelle für Anbieter, die über Downloads und die Lizenzierung einzelner Assets für kommerzielle oder redaktionelle Zwecke hinausgeht. Wir sind fest entschlossen, unsere Anbieter als Partner auf diesem Weg einzubeziehen und sicherzustellen, dass sie einen Anteil an den Erlösen aus Computer-Vision-Datensätzen (auch bekannt als Datendeals) und generativen KI-Modellen erhalten, wenn ihre Inhalte bei der Erstellung dieser Technologien verwendet werden. Angesichts des kollektiven Charakters dieses Produkts haben wir ein Vergütungsmodell für Umsatzbeteiligungen entwickelt.
[…]

Die Anbieter erhalten einen Anteil am gesamten Vertragswert, der von den Plattform-Partnern bezahlt wird. Der Anteil, den einzelne Anbieter erhalten, steht im Verhältnis zum Umfang ihrer Inhalte und Metadaten, die in den erworbenen Datensätzen enthalten sind. Obwohl die Aufnahme in Datensätze nicht wie andere einzelne Downloads in der Ergebnisübersicht berücksichtigt wird, wie die Einnahmen aus anderen E‑Commerce-Produkten, unterhält Shutterstock eine interne Datenbank aller Assets, die in allen Datensätzen verwendet werden, die seit der Einführung dieses Produkts erstellt wurden, sodass wir unsere Anbieter entsprechend vergüten können.

Anbieter, deren Inhalte zum Trainieren eines der Modelle verwendet wurden, werden für die Rolle, die ihr geistiges Eigentum bei der Entwicklung der ursprünglichen Modelle gespielt hat, sowie durch Lizenzgebührenzahlungen vergütet, die an zukünftige generative Lizenzierungsaktivitäten gebunden sind. Wenn Ihre Inhalte in beiden verwendet wurden, erhalten Sie eine Zahlung, die Sie für die Aufnahme Ihrer Inhalte in beide Datensätze (auch bekannt als Datendeals) vergütet, und Sie haben Zugang zu mehr zukünftigen Umsatzmöglichkeiten, da Sie Anspruch auf eine Vergütung aus unserem Anbieter-Fonds für zukünftige Lizenzierungsereignisse der generativen Content-Entwicklung aus beiden Modellen haben.
[…]“
Alle sechs Monate werden laut Shutterstock die gesammelten Einnahmen an die Fotografen ausgeschüttet und in der Umsatzübersicht im Bereich „Anbieterfonds“ (auf englisch „Contributor Funds“) angezeigt.

So ganz scheint das nicht zu stimmen, da ich erstmalig eine solche Auszahlung Ende Dezember 2022 erhalten hatte und nun – wie viele andere Fotografen auch – Anfang Mai 2023 noch mal. Aber vielleicht pendelt sich das noch ein.

Analyse der Anbieterfonds-Umsätze

Da das eine ganz neue Einnahmekategorie für Fotografen ist, habe ich in auf meiner Facebook-Seite darum gebeten, dass meine Leser*innen ihre Umsätze aus den Anbieterfonds sowie ihre Portfolio-Größe nennen, damit ich die Durchschnitts- und Maximalwerte berechnen kann.

Es haben sich mit mir 58 Leute beteiligt, was die Ergebnisse ganz aussagekräftig macht, wie ich finde. Hier die visuelle Darstellung:

Im Durchschnitt betrug die Portfolio-Größe der Teilnehmer*innen 6343 Bilder. Da der Durchschnitt durch einige extreme Werte schnell verzehrt werden kann, ist der Median in der Regel aussagekräftiger. Dieser betrug 2112 Bilder.

Der durchschnittliche Erlös aus den Anbieterfonds pro Bild lag gerundet bei 0,0078 USD/Bild. Der Median lag bei 0,0069 USD/Bild. Mein eigener Wert lag übrigens zwischen diesen beiden Werten.

Als spannende Fußnote: Der höchste Wert betrug 0,0378 USD/Bild (bei einem eher kleinen Portfolio mit 1480 Bildern).

Die gesamte Auszahlung pro Portfolio der Teilnehmer*innen lag durchschnittlich bei 45,97 USD, der Median bei 18,49 USD.

Hochrechnung auf das gesamte Shutterstock-Portfolio

Für das erste Quartal 2023 hat das börsennotierte Unternehmen Shutterstock 615 Mio. Bilder im Portfolio gemeldet.

Auszug aus den Shutterstock-Quartalszahlen für das 1. Quartal 2023

Wenn wir nun grob den Median von 0,0069 USD pro Bild auf die 615 Mio. Bilder im gesamten Portfolio umrechnen, erhalten wir einen Wert von ca. 4,24 Mio. USD an Auszahlungen als Schätzung für die Anbieterfonds allein für die Mai-Auszahlung.

Angesichts des gemeldeten Umsatzes von über 215 Mio. USD sowie einem Nettogewinn von über 32 Mio. USD ist das durchaus ein Wert, der nicht so ins Gewicht fällt für Shutterstock.

Perspektive

Sind ca. zwei Drittel eines US-Cents pro Bild im Portfolio zwei Mal im Jahr ausreichend und fair, um die KI-Nutzung der eigenen Bilder ausreichend zu kompensieren? Ich lehne mich mal weit aus dem Fenster und behaupte: Nein.

Allein mein Einnahmeverlust bei Shutterstock im letzten Monat war höher als ein Jahres-KI-Anbieterfonds-Erlös bei Shutterstock, weshalb meine Zweifel groß sind, dass diese Beträge motivierend genug für die Fotograf*innen sind, um weiterhin qualitativ hochwertige Inhalte zu produzieren.

Wie seht ihr das?