Schlagwort-Archive: Künstliche Intelligenz

Shutterstock verbietet Upload von KI-​Bildern und will gleichzeitig selbst KI-​Bilder anbieten

Meine geplan­ten Artikel zu den neus­ten KI-​Entwicklungen sind noch nicht mal fer­tig, da plat­zen stän­dig auf­re­gen­de Neuigkeiten her­ein. Die Nachricht vom 25.10.2022 von Shutterstock kann ich hier aber nicht igno­rie­ren, da sie einen wil­den Mix von Konsequenzen nach sich zieht, den ich hier ver­mut­lich nur ansatz­wei­se beleuch­ten kann.

Aber ver­su­chen wir es der Reihe nach: Shutterstock hat vor weni­gen Tagen die­se Pressemitteilung ver­öf­fent­licht, in der die Firma die Partnerschaft mit dem Unternehmen OpenAI ver­kün­det, wel­che hin­ter dem KI-​Tool DALL‑E ste­cken. Hinter OpenAI ste­cken übri­gens u.a. Elon Musk als Gründer und Microsoft als Investor.

Bild von DALL‑E 2 gene­riert mit der Beschreibung „A tor­na­do made of cash hit­ting a govern­ment building“

Zeitgleich gab es eine Rundmail an alle Shutterstock-​Anbieter, in der zusätz­lich zur obi­gen Information eine eben­so wich­ti­ge wei­te­re Nachricht steck­te: Shutterstock will kei­ne KI-​generierten Inhalte mehr auf ihrem Marktplatz anbie­ten, mit der Begründung, dass „die Urheberschaft nicht einer ein­zel­nen Person zuge­ord­net wer­den kann, wie es für die Lizenzierung von Rechten erfor­der­lich ist“.

Oder hier im Hilfebereich von Shutterstock noch aus­führ­li­cher begrün­det: „KI-​generierte Inhalte dür­fen nicht auf Shutterstock hoch­ge­la­den wer­den, da KI-​Inhaltsgenerierungsmodelle das geis­ti­ge Eigentum vie­ler Künstler und ihrer Inhalte nut­zen, was bedeu­tet, dass das Eigentum an KI-​generierten Inhalten nicht einer Einzelperson zuge­wie­sen wer­den kann und statt­des­sen alle Künstler ent­schä­digt wer­den müs­sen, die an der Erstellung jedes neu­en Inhalts betei­ligt waren“.

Diese Kombination von Aussagen wirft so vie­le Fragen auf, dass ich gar nicht weiß, wo ich anfan­gen soll.

Gehen wir mal in der Zeit etwas zurück: Shutterstock koope­riert schon seit 2021 mit der Firma OpenAI, indem OpenAI Shutterstock-​Bilder lizen­ziert hat, um das Tool DALL‑E zu trai­nie­ren. Der CEO von OpenAI, Sam Altman, sagt dazu in der Pressemitteilung:

Die Daten, die wir von Shutterstock lizen­ziert haben, waren ent­schei­dend für das Training von DALL‑E. Wir freu­en uns, dass Shutterstock sei­nen Kunden die DALL-​E-​Bilder als eine der ers­ten Anwendungen über unse­re API zur Verfügung stellt, und wir freu­en uns auf künf­ti­ge Kooperationen, wenn künst­li­che Intelligenz ein inte­gra­ler Bestandteil der krea­ti­ven Arbeitsabläufe von Künstlern wird.“

In weni­gen Monaten sol­len Shutterstock-​Kunden in der Lage sein, mit Hilfe von OpenAI direkt auf der Shutterstock-​Webseite durch Texteingabe Bilder selbst gene­rie­ren zu können.

Im Gegenzug dafür sol­len die Shutterstock-​Anbieter für die Rolle, die ihre Inhalte bei der Entwicklung die­ser Technologie gespielt haben, ent­schä­digt werden.

Die ers­te Frage hier ist doch: Wurden die Shutterstock-​Anbieter auch für die Trainingsdaten, die seit 2021 von OpenAI lizen­ziert wur­den, entschädigt?

Die zwei­te Frage ist: Haben die Künstler, auf deren Eigentum Shutterstock angeb­lich so viel Wert lege, damals über­haupt zuge­stimmt, dass ihre Bilder für Trainingszwecke genutzt wer­den dürfen?

Die drit­te Frage ist logi­scher­wei­se: Wie vie­le Bruchteile von US-​Cents sol­len die Anbieter als „Entschädigung“ erhal­ten?

Ich könn­te jetzt eine Weile mit sol­chen Fragen wei­ter­ma­chen, aber betrach­ten wir erst mal ande­re Perspektiven.

Die Kunden-​Sicht

Aus Kundensicht erschließt sich nicht sofort, war­um sie KI-​Bilder bei Shutterstock – sehr ver­mut­lich gegen Geld – gene­rie­ren soll­ten, wenn sie es bei OpenAI auch kos­ten­los machen kön­nen. Jeden Monat gibt es bei DALL‑E 2 kos­ten­los 15 Credits für je Bilderstellungen (1 Credit pro Bild), 115 wei­te­re Credits kos­ten dann 15 USD, also ca. 13 US-​Cent pro Bild.

Es könn­te auch sein, dass Shutterstock die­sen Preis noch mal unter­bie­ten will.

Darüber hin­aus gibt es aber gänz­lich kos­ten­lo­se KI-​Tools wie Stable Diffusion (und pas­sen­de GUIs), mit der Nutzer ihre Bilder kom­plett gra­tis erstel­len können.

Der Vorteil wäre maxi­mal, wenn Kunden mit Shutterstock eine Firma haben, die für even­tu­el­le (recht­li­che?) Probleme haf­ten könn­te. Ansonsten spe­ku­liert Shutterstock viel­leicht dar­auf, dass es genug Bestandskunden gibt, wel­che sich nicht die Mühe machen (wol­len), sich bei einer Plattform wie Dall‑E 2 zu regis­trie­ren, um dort die Gratis-​KI-​Bilder zu nutzen.

Die Agentur-​Sicht

Aus Sicht von Shutterstock ist es natür­lich cle­ver: Warum soll­ten sie die­se ner­vi­gen Bildlieferanten bezah­len müs­sen, wenn sie den Kunden auch ohne den Umweg über die Fotografen Bilder ver­kau­fen können?

Das geht natür­lich nur, wenn gleich­zei­tig den Anbietern ver­bo­ten wird, KI-​generierte Bilder selbst zum Verkauf anzu­bie­ten, denn immer­hin will das ja die Agentur über­neh­men. Warum die angeb­li­chen recht­li­chen Risiken, wel­che als Grund für das Upload-​Verbot vor­ge­scho­ben wer­den, plötz­lich nicht mehr gege­ben sind, wenn Shutterstock die KI-​Bilder gene­riert, erschließt sich nicht ganz. Dazu spä­ter mehr.

Das Verbot ist augen­schein­lich vor allem dazu da, um mehr Kunden zur agen­tur­ei­ge­nen KI-​Generierung zu bewegen.

Zwar hat Shutterstock schon „Entschädigungen“ für die Shutterstock-​Künstler ange­bo­ten, deren Werke zum Training der KI benutzt wer­den, aber machen wir uns nichts vor: Das wer­den pro Bild maxi­mal etli­che Stellen hin­ter dem Komma sein und auch in der Summe deut­lich weni­ger sein als die Verluste, wel­che die Anbieter erlei­den wer­den, weil Kunden kei­ne Bilder aus dem Portfolio kau­fen, son­dern sich wel­che gene­rie­ren las­sen und die Fotografen auch selbst kei­ne KI-​Bilder ver­kau­fen dürfen.

Zur Erinnerung: Als Getty Images 2013 einen Deal mit Pinterest mach­te, um die Getty-​Fotografen für deren Bildnutzungen auf Pinterest zu ent­schä­di­gen, erhiel­ten die­se zum Beispiel 0,00062 USD für das „welt­wei­te Recht, Metadaten ihres Bildes auf Pinterest anzu­zei­gen und zu nut­zen“, wäh­rend Getty selbst sich immer­hin noch 0,00411 USD in die Tasche steck­te. Anders gerech­net: Bei 1000 Bildnutzungen waren das für den Fotografen 62 Cent und für Getty Images aber 4,11 USD.

Die Konkurrenz ist zudem groß: Auch Microsoft will DALL‑E in deren Suchmaschine Bing inte­grie­ren und hat eine neue App namens „Designer“, die Produkt- oder Firmennamen und die dazu pas­sen­den Bilder oder Logos gene­rie­ren kön­nen soll.

Bild von Stable Diffusion gene­riert mit der Beschreibung „A tor­na­do made of cash hit­ting a govern­ment building“

Die Anbieter-​Sicht

Für Shutterstock-​Anbieter sind die­se Nachrichten aus­nahms­los schlecht. Die „Entschädigung“ ist ein arm­se­li­ges Feigenblatt, hin­ter dem Shutterstock die Marginalisierung ihrer Lieferanten ver­steckt. In der Pressemitteilung wird stän­dig von „Ethik“ und „Verantwortung“ gere­det, aber damit ist nicht die Rücksicht auf die Anbieter gemeint, son­dern auf die der Shutterstock-Aktionäre.

Shutterstock hat halt end­lich einen Weg gefun­den, die läs­ti­gen 20% Fotografen-​Kommissionen auch noch los­zu­wer­den, um es lapi­dar zu formulieren.

Die genann­te „Entschädigung“ soll aus einem „Contributor Fund“ kom­men und alle sechs Monate aus­ge­zahlt wer­den. Als Einnahmen dafür sol­len sowohl die Lizenzgebühren für die KI-​Inhalte als auch Einnahmen aus Datenverkäufen gezählt wer­den. Der Anteil für die Anbieter soll pro­por­tio­nal sein zum Volumen ihrer Inhalte in den Datensätzen.

Wie das kon­trol­liert oder über­prüft wer­den soll, ist auch völ­lig schlei­er­haft und ver­mut­lich unmög­lich ohne die Offenlegung des kom­plet­ten Datensatzes.

Wenn Shutterstock und Getty Images kei­ne KI-​Bilder haben wol­len, wird es aber wei­ter­hin genug ande­re Agenturen geben, wel­che die­se mit Kusshand anneh­men. Es drän­gen jetzt schon die ers­ten Bildagenturen auf den Markt wie StockAI, wel­che nur KI-​Bilder anbie­ten und die­se natür­lich auch gene­rie­ren können.

Die Künstler-​Sicht

In der o.g. Pressemitteilung heißt es zum Schluss:

Und in einem wich­ti­gen Bestreben, die IP-​Rechte sei­ner Künstler, Fotografen und Schöpfer zu schüt­zen, ist Shutterstock wei­ter­hin füh­rend in der Entwicklung von Richtlinien und Verfahren und setzt Methoden ein, um sicher­zu­stel­len, dass Nutzungsrechte und ord­nungs­ge­mä­ße Lizenzen für alle vor­ge­stell­ten Inhalte – ein­schließ­lich KI-​generierter Inhalte – gesi­chert sind.“

DALL‑E wur­de mit über 12 Milliarden Text/​Bild-​Kombinationen trai­niert, wäh­rend Shutterstock gera­de mal 424 Millionen Bilder online hat. Das heißt im Umkehrschluss, der größ­te Teil des Trainings wur­den mit Bildern von Künstlern gemacht, die nicht bei Shutterstock sind. Das gan­ze Gerede vom „Schützen von IP-​Rechten“ bezieht sich aber nur auf die Shutterstock-​Anbieter, der gro­ße Rest kann zuse­hen, wie für die KI-​Trainings „ent­schä­digt“ wird.

Das zeigt auch gut die Heuchelei von Shutterstock. Angeblich weil bei KI-​Inhalten alle Künstler ent­schä­digt wer­den müss­ten, dür­fen Anbieter kei­ne KI-​Inhalte hoch­la­den, aber wenn Shutterstock selbst via API einen Zugang zu OpenAI’s DALL‑E anbie­tet, wer­den eben­falls nicht alle Künstler entschädigt.

Die rechtliche Sicht

Ist die Entschädigung von Künstlern, deren Werke für das KI-​Training benutzt wur­den, recht­lich gese­hen über­haupt not­wen­dig? Ich weiß es ehr­lich gesagt nicht. Einige mei­nen, das sei eine klas­si­sche „fair use“-Nutzung, ande­re sehen es nicht so.

Mal ange­nom­men, recht­lich wäre eine Entschädigung nicht not­wen­dig: Dann fal­len Shutterstocks Argumente, war­um sie kei­ne KI-​Bilder anneh­men wol­len, in sich zusammen.

Wenn eine Entschädigung recht­lich aber doch not­wen­dig wäre: Dann ist voll­kom­men unbe­greif­lich, war­um sich die­se ers­tens nur auf Shutterstock-​Künstler beschrän­ken soll­te (und nicht z.B. auf Künstler wie Greg Rutkowski) und zwei­tens war­um die­se nicht statt­fin­det, wenn Bilder direkt bei DALL‑E gene­riert wer­den statt über deren API zu Shutterstock.

Es ist also so oder so ein gro­ßes unlo­gi­sches Konstrukt, wel­ches sich am bes­ten dadurch erklärt, dass es Shutterstock eben nicht um die Belange der Künstler, son­dern nur um den eige­nen Profit geht.

Spannend auch, dass der Getty Images-CEO Craig Peters KI-​Bilder u.a. des­halb in sei­ner Agentur ver­bie­tet, weil sie recht­li­che Probleme für die Kunden mit sich brin­gen könn­ten. Warum das anders sein soll, wenn Shutterstock Kunden KI-​Bilder gene­rie­ren lässt, ist ein gro­ßes Rätsel.

Eine mög­li­che Lösung wäre, dass die OpenAI-​KI aus­schließ­lich auf Shutterstock-​Bildern trai­niert wur­de, für die sowohl Shutterstock die Einwilligung aller Rechteinhaber zum Training hat­te als auch OpenAI die­se Rechte lizen­ziert habe. In den aktu­el­len Shutterstock-​AGB von 2020 steht bei­spiels­wei­se, dass Shutterstock das Recht zur Bildanalyse unter­li­zen­zie­ren darf. Aber selbst wenn OpenAI jedes ein­zel­ne Bild aus der Shutterstock-​Datenbank lizen­ziert habe, wür­de das bei ver­mut­lich wei­tem nicht aus­rei­chen, um als allei­ni­ge Datenbasis für das KI-​Training zu dienen.

Aber viel­leicht lie­ge ich damit auch falsch und es ist sogar ein Vorteil, weil die Shutterstock-​Bilder alle eine hohe Auflösung haben und im Vergleich zu ande­ren Bildern meist recht gut ver­schlag­wor­tet sind.

Auch die EU hat im Blick, dass die Künstliche Intelligenz gefähr­lich sein könn­te und arbei­tet an einer „KI-​Verordnung“. Ob sol­che Verordnungen aber den aktu­el­len Graubereich der Legalität von urhe­ber­recht­lich geschütz­ten Werken für KI-​Trainingszwecke regu­lie­ren wer­den, bleibt abzuwarten.

Bild von Midjourney gene­riert mit der Beschreibung „A tor­na­do made of cash hit­ting a govern­ment building“

Die politische Sicht

Shutterstock wur­de 2019 von den eige­nen Mitarbeitern kri­ti­siert, dass die Agentur in China Suchbegriffe wie „Flagge Taiwans“, „Diktator“, „Präsident Xi“ oder „Regenschirm“ gesperrt habe.

Sehr span­nend ist hier jetzt die Frage, ob die­se Begriffe dann auch bei der KI-​Generierung in China gesperrt sein wer­den oder nicht.

Auch ande­re Begriffe, zum Beispiel sexu­el­ler oder gewalt­ver­herr­li­chen­der Natur, könn­ten gesperrt wer­den, um sich weni­ger Haftungsfragen aus­set­zen zu müssen.

Die technische Sicht

Viele der genann­ten Tools sind aktu­ell noch im Beta-​Stadium und sie ent­wi­ckeln sie unglaub­lich rasant. Es ist ver­mut­lich nur eine Frage der Zeit, bis Methoden wie das In- und Outpainting von DALL‑E 2 auch in Grafikprogramm wie Adobe Photoshop Einzug hal­ten wer­den oder es WordPress-Plugins geben wird, wel­che auf Knopfdruck zum Artikeltext pas­sen­de Bilder generieren.

Auch das Trainieren der KI zum Generieren vom eige­nen Gesicht (oder das von Kundengesichtern) ist jetzt schon mög­lich und wird bald sicher noch ein­fa­cher mach­bar sein.

Was noch?

Ganz wil­de Zeiten also mit viel Unsicherheit, Abwehrreaktionen eta­blier­ter Künstler, recht­li­chen Grauzonen, dem Zusammenbruch bestehen­der und Aufbau neu­er Geschäftsmodelle und mit­ten­drin Bildagenturen, Fotografen und KI-Anbieter.

Es gibt noch etli­che Aspekte, die hier nicht unter­ge­bracht wer­den konn­te, das kommt bestimmt bald in einem wei­te­ren Artikel. 

Was denkt ihr darüber?

Bildagenturen wie Shutterstock und Getty Images verbannen KI-​Bilder aus ihrem Portfolio

Kurz hin­ter­ein­an­der haben sowohl Shutterstock als auch Getty Images mit deren Tochter-​Agentur iStock ange­kün­digt, kei­ne KI-​Bilder mehr anneh­men zu wollen.

Ki-​Bild (Dall‑E 2) von einem Roboter, der ein Bild malt

Angesichts der stei­gen­den Popularität von KI-​Software zur Bild-​Generierung wie Dall‑E 2, Stable Diffusion, Midjourney und Konsorten sowie der ver­bes­ser­ten Bildqualität die­ser Tools gab es in den letz­ten Monaten einen star­ken Anstieg von KI-​Bildern im Portfolio von Bildagenturen.

Email, die an iStock/​Getty-​Fotografen ging

Nun haben zumin­dest die bei­den gro­ßen Platzhirsche Shutterstock und Getty Images die Reißleine gezo­gen und ange­kün­digt, kei­ne KI-​Bilder mehr anneh­men zu wollen.

Als Grund wer­den in einer Email von Getty Images „unadres­sier­te recht­li­che Fragen mit Hinblick auf die zugrun­de lie­gen­den Bilder und Metadaten, die zum Training der KI genutzt wor­den sind“ ange­ge­ben.

Auch Shutterstock for­mu­liert in einer Email an aus­ge­wähl­te Kontributoren ähn­li­che Bedenken:

Email von Shutterstock an eini­ge Kontributoren

Hier wer­den „recht­li­che Implikationen“ als Grund dafür genannt, dass etli­che KI-​Bilder der ange­schrie­be­nen Personen gelöscht wur­den und es wird geschrie­ben, dass Shutterstock „kei­ne maschi­nen­ge­ne­rier­ten Inhalte akzep­tie­ren“ wür­de gemäß Sektion 13.d/f ihrer Nutzungsbedingungen.

Ich bin mir zwar nicht ganz sicher, ob sie da wirk­lich die rich­ti­gen Absätze raus­ge­sucht haben, aber grund­sätz­lich steht es Shutterstock natür­lich frei, sol­che Regeln auf­zu­stel­len, wenn sie der Meinung sind, dass sie hilf­reich seien.

Zeitgleich expe­ri­men­tiert Shutterstock aber selbst schon mit künst­li­cher Intelligenz. So bie­tet deren neu­es Projekt „Predict“ Kunden die Möglichkeit, mit­tels KI erken­nen zu kön­nen, wel­che Bilder für wel­che Zwecke am pas­sends­ten sein sol­len. Shutterstock schreibt:

Was per­formt bes­ser?
Diese wie­der­keh­ren­de Frage ist mit Predict viel ein­fa­cher zu beant­wor­ten. Die App nutzt KI, um die Stärken und Schwächen indi­vi­du­el­ler Assets spe­zi­ell für Ihre Anforderungen zu ana­ly­sie­ren. Predict sagt Ihnen, WARUM ein emp­foh­le­ner Inhalt vor­aus­sicht­lich gut per­formt, damit Sie selbst­be­wusst krea­tiv wer­den können.“

Nach einer kos­ten­lo­sen Testphase wol­len sie sich die­se Informationen natür­lich bezah­len lassen.

Getty Images ver­sucht eben­falls seit Januar 2022, die Vorteile der KI für sich auf eine ande­re Weise zu nut­zen. So ver­öf­fent­lich­te die Agentur einen neu­en Modelvertrag, der jetzt unter ande­rem einen neu­en Passus ent­hält, mit dem sich das Model bereit erklärt, dass die Bilder zum Trainieren von Künstlicher Intelligenz genutzt wer­den dürfen:

Ich erklä­re mich fer­ner damit ein­ver­stan­den, dass der Inhalt mit ande­ren Bildern, Texten, Grafiken, Filmen, Audio- und audio­vi­su­el­len Werken kom­bi­niert und zur Entwicklung und Verbesserung von maschi­nel­len Lernalgorithmen, künst­li­cher Intelligenz und ande­ren Technologien bear­bei­tet und genutzt wer­den darf.“

Auch bei der deut­schen Bildagentur Westend61 wer­den die KI-​Bilder als hoch pro­ble­ma­tisch ange­se­hen und aus recht­li­chen Gründen soll­ten die­se momen­tan nicht akzep­tiert wer­den. Mehr Informationen dazu sol­len folgen.

Einige Online-​Kunst-​Communities wie Newgrounds, Inkblot Art und Fur Affinity haben eben­falls das Hochladen von KI-​Werken unter­sagt oder ein­ge­schränkt.

Währenddessen arbei­tet die bri­ti­sche Gesetzgebung schon an Änderungen, um den neu­en KI-​Entwicklungen Rechnung zu tragen.

Diese Bildlöschungen fol­gen eini­ge Wochen nach der Veröffentlichung eines Teils des KI-​Trainings-​Datensatzes mit rund 12 Mio. Bildern von den ins­ge­samt über 2,3 Milliarden Trainingsbildern. Dieser Trainingsdatensatz der Organisation LAION wur­de zum Beispiel für das Anlernen der KI von NightCafe, Midjourney und Stable Diffusion genutzt.

In der Veröffentlichung wur­de unter ande­rem deut­lich, dass zum Lernen auch gro­ße Bildbestände der Bildagenturen benutzt wur­den. So waren von den aus­ge­wer­te­ten 12 Mio. Bildern min­des­tens 497.000 von 123rf, 171.000 von Adobe Stock/​Fotolia, 117.000 von PhotoShelter, 35.000 von Dreamstime, 23.000 von iStock, 22.000 von Unsplash, 15.000 von Getty Images, 10.000 von VectorStock, 10.000 von Shutterstock und so wei­ter. Die Dunkelziffer dürf­te hier weit höher sein, da vie­le dort gekauf­te Bilder auf Kundenwebseiten nicht immer als von einer Agentur kom­mend erkenn­bar sind.

Ich bin unsi­cher, ob die­se Entscheidung so klug ist. Denn sol­che Verbote könn­ten dazu füh­ren, dass sich die KI-​Szene ande­re „Ökosysteme“ auf­baut. So gibt es bei­spiels­wei­se mit PromptBase schon eine Webseite, wo Anbieter auf einem Marktplatz „Prompts“ für KI-​Systeme ver­kau­fen kön­nen. Prompts sind die Texteingaben, die zur Bilderstellung (noch) nötig sind und die Anbieter garan­tie­ren mit ihren Prompts ähn­li­che Ergebnisse wie die, die sie im Marktplatz vor­zei­gen. Im Kern ist das schon eine Art neu­er Bildagentur, bei der die Leute nicht die Bilder direkt kau­fen, son­dern die Option, sich sehr ähn­li­che Bilder selbst gra­tis gene­rie­ren zu können.

Außerdem erhö­hen sol­che Einschränkungen wie das Verbot von KI-​Bildern in den bestehen­den Bildagenturen nur die Wahrscheinlichkeit, dass ein neu­es Start-​Up eine neue Bildagentur auf­macht, wel­che offen­siv ein­fach nur noch KI-​generiertes Material verkauft.

Mit der Webseite Lexica gibt es auch schon eine Art „Open Source“-Community für KI-​Bilder, wo Nutzer sich meh­re­re Millionen mit Stable Diffusion erstell­te Bilder anschau­en, durch­su­chen und sehen kön­nen, wel­che Prompts zur Erstellung genutzt wur­den. Von der Möglichkeit, die­se Bilder direkt zur Lizenzierung anzu­bie­ten, ist es dann nur noch ein klei­ner Schritt.

Während die gro­ßen Bildagenturen einen Abwehrkampf gegen die KI-​Bilder begin­nen, fan­gen ande­re Start-​Ups längst an, mit­tels KI aus Text-​Prompts gan­ze Video-​Sequenzen zu erstel­len.

Was die­se KI-​Entwicklung für die (Stock-)Fotografen selbst bedeu­tet, wer­de ich hof­fent­lich bald in einem eige­nen Artikel beleuchten.

Wie seht ihr das?
Bringen Verbote von KI-​Bildern etwas?

Welchen Einfluss wird künstliche Intelligenz auf die Produktion von Stock-​Videos haben?

Künstliche Intelligenz (KI) ist die Simulation mensch­li­cher Intelligenz in pro­gram­mier­ten Maschinen, die wie Menschen den­ken und ihre Handlungen imi­tie­ren. KI umfasst auch Geräte, die mensch­li­che Züge wie Problemlösung, Lernen, Spracherkennung und Planung auf­wei­sen. KI ist zwei­fel­los eine genia­le tech­ni­sche Erfindung, die die Welt im Sturm erobert hat. Wenn wir an KI und ihre Anwendungen den­ken, brin­gen wir sie fast immer mit Technik und Wissenschaft in Verbindung. Aber das ist nicht alles – KI wur­de nähm­lich auch in der krea­ti­ven Sphäre effek­tiv eingesetzt!

Die Frage ist: Kann KI ler­nen, krea­tiv zu sein? Nun, ja. Es gibt vie­le Beispiele, die die gro­ßen Fortschritte der KI in der Welt der Kreativität bele­gen. Auf dem Sonar-​Musikfestival in Barcelona im letz­ten Herbst begann der Künstler Mat Dryhurst auf der Bühne zu sin­gen, und das Publikum war fas­sungs­los, als es statt­des­sen die Stimme sei­ner Frau hör­te! Dryhursts Auftritt war Teil eines KI-​Experiments, bei dem er sei­ne Stimme aus­tausch­te – und es war natür­lich ein gro­ßer Erfolg!

Nicht nur in der Musik, auch in der Verlagswelt ver­än­dern KI-​Tools die Welt. Um die Erstellung von Inhalten auf­recht­zu­er­hal­ten, ist es wich­tig, stän­dig neue Inhalte und Ideen zu pro­du­zie­ren. Irgendwann gehen uns Menschen viel­leicht die Ideen aus. Aber dank der KI haben wir jetzt einen end­lo­sen Vorrat an Ideen, die uns hel­fen, wei­ter­zu­ma­chen! Wir haben nicht nur KI-​Schreibwerkzeuge, um Ideen zu gene­rie­ren, son­dern auch KI-​unterstütztes Schreiben. Die KI-​Schreibassistenten ler­nen, wie Profis zu schrei­ben und ent­wi­ckeln auch inter­es­san­te Inhalte!

Auch in der Filmindustrie ist KI mitt­ler­wei­le ein fes­ter Bestandteil. Das liegt dar­an, dass sie in ver­schie­de­ne Aspekte des Filmprozesses inte­griert wur­de und den sonst so müh­sa­men Prozess weni­ger kom­pli­ziert und naht­los macht. Werfen wir einen Blick dar­auf, wie KI das Filmemachen im Detail revo­lu­tio­niert hat:

Wie wird KI beim Filmemachen und bei der Erstellung von Videos eingesetzt?

Der kom­ple­xe Prozess des Filmemachens umfasst vie­le krea­ti­ve Köpfe – vom Schreiben des Drehbuchs bis zur Promotion des Films. Wir sind uns sicher, dass es noch viel mehr Feinheiten gibt, aber weißt du was? KI kann bei all die­sen ver­schie­de­nen Aspekten ein­ge­setzt werden!

Es ist nicht ein­fach, ein ein­zig­ar­ti­ges, beein­dru­cken­des Drehbuch zu schrei­ben, das die Zuschauer fes­selt. Aber mit KI ist es für Filmemacher jetzt ein­fa­cher gewor­den, Drehbücher zu erstel­len. Wenn sie mit rie­si­gen Datenmengen von Drehbüchern gefüt­tert wer­den, kön­nen maschi­nel­le Lernalgorithmen völ­lig neue Drehbücher erstel­len. Filmemacher ver­wen­den die KI-​generierten Drehbücher als Entwürfe und ver­bes­sern sie dann, um ein end­gül­ti­ges Drehbuch zu erstel­len. Der gesam­te Prozess der Drehbucherstellung ist jetzt mühe­los und weni­ger zeit­auf­wän­dig, dank der KI-Drehbuch-Tools!

Das Casting ist ein wei­te­rer wich­ti­ger Aspekt eines Films – ein tol­les Drehbuch kann ein Reinfall sein, wenn die Besetzung nicht stimmt. Das Casting ist ein lang­wie­ri­ger Prozess, der viel Zeit und Mühe erfor­dert, um die Schauspieler in meh­re­ren Castings zu prü­fen und die per­fek­te Besetzung für einen Film zu fin­den. KI-​Tools kön­nen mit Daten gefüt­tert wer­den, die Merkmale von Schauspielern in ver­schie­de­nen Emotionen beschrei­ben, und die­se Tools kön­nen dann nach den rich­ti­gen Schauspielern suchen. Die Tools kön­nen auch das digi­ta­le Gesicht eines Schauspielers/​einer Schauspielerin über ein Körperdouble legen, wenn dies in bestimm­ten Szenen erfor­der­lich ist. KI kann auch ein­ge­setzt wer­den, um Schauspieler in Filmen digi­tal hin­zu­zu­fü­gen oder sogar ihre Gesichtszüge zu ver­än­dern, um sie jün­ger dar­zu­stel­len, als sie sind.  Außerdem kann sie Greenscreen-​Videos auto­ma­tisch durch die beab­sich­tig­ten Aufnahmen erset­zen und müh­sa­mes Chromakeying auto­ma­tisch erledigen.

Abgesehen davon hel­fen KI-​Tools auch dabei, den Erfolg eines Films vor­her­zu­sa­gen und die Einnahmen abzu­schät­zen, die er ein­spie­len kann. Top-​Filmemacher wie Warner Bros. nut­zen zum Beispiel die KI-​basierte Plattform Cinelytic, um den Erfolg ihrer Filme an der Kinokasse vorherzusagen.

Einfluss der KI auf die Produktion von Stock-Videos 

KI hat vie­le müh­sa­me, sich wie­der­ho­len­de Aufgaben ein­fa­cher gemacht – und die Produktion von Stockvideos ist da kei­ne Ausnahme! Genau wie bei den genann­ten krea­ti­ven Beispielen muss die KI auch bei der Erstellung von Stock-​Videos mit gro­ßen Datenmengen gefüt­tert wer­den (rele­van­tes Filmmaterial, Vorlagen, Übergangseffekte, Überblendungen usw.). Nach der Verarbeitung die­ser Daten kön­nen die KI-​Tools ein ein­zig­ar­ti­ges, völ­lig ande­res Stockvideo erstel­len, das es so noch nie gege­ben hat.

Wie kann dir das hel­fen? Erstens sparst du dir die Zeit, den Aufwand und das Geld, die du sonst für den Dreh eines neu­en Videos auf­wen­den müss­test. Auch wenn die künst­li­che Intelligenz ein Standardvideo für dich erstellt, hast du die Möglichkeit, es zu bear­bei­ten und krea­ti­ve Elemente hin­zu­zu­fü­gen, um es noch bes­ser zu machen. Außerdem „weiß“ KI, wel­che Funktionen zu einem Stockvideo hin­zu­ge­fügt wer­den müs­sen, um es nicht nur ein­zig­ar­tig, son­dern auch optisch anspre­chend zu machen.

Resümee

Auch wenn die Erstellung von Stock-​Videos und ande­ren krea­ti­ven Elementen mit­hil­fe von Künstlicher Intelligenz ein­fach ist, kön­nen wir nicht leug­nen, dass algo­rith­mi­sche Verzerrungen ein erheb­li­ches Problem dar­stel­len. Wenn die KI nur mit unvoll­stän­di­gen oder schlech­ten Daten gefüt­tert wird, führt das zu ver­zerr­ten Ergebnissen. Aus die­sem Grund müs­sen wir auch in der Stock-​Video-​Branche mit ras­sis­ti­schen oder geschlechts­spe­zi­fi­schen Verzerrungen rech­nen. Schließlich wird die KI von Menschen ent­wi­ckelt, und Menschen sind in Bezug auf Geschlecht und Rasse voreingenommen.

Die Automatisierung und die Erleichterung der Durchführung sich wie­der­ho­len­der, zeit­auf­wän­di­ger Tests durch KI haben auch die Arbeitswelt erfasst. Obwohl sie Zeit und Mühe spart, kön­nen wir nicht leug­nen, dass die KI den Wert der mensch­li­chen Kreativität nega­tiv beein­flusst hat. Eine Regulierung der KI und ihre ethi­sche Umsetzung kön­nen hel­fen, die­se Probleme zu bewäl­ti­gen; bis dahin müs­sen wir uns auf die­se Probleme ein­stel­len und ent­spre­chen­de Lösungen finden.

Panthermedia stellt erste Kollektion computergenerierter Personenbilder vor

Vor weni­gen Tagen prä­sen­tier­te die deut­sche Bildagentur Panthermedia in Zusammenarbeit mit dem Unternehmen vAIsual die „syn­the­ti­sche Portrait Kollektion“, das heißt, eine Sammlung von Portraitbildern, wel­che durch einen Computer erzeugt wurden.

Über die dahin­ter lie­gen­de Technik hat­te ich im September 2019 etwas aus­führ­li­cher in dem Artikel „100.000 kos­ten­lo­se com­pu­ter­ge­nerier­te Portraits: Das Ende der Model-​Fotografie?“ berich­tet. Gut zwei Jahre spä­ter schei­nen also eini­ge mei­ner dama­li­gen Gedankenspiele Realität zu werden.

Aktuell umfasst die Kollektion ca. 400 Bilder, es sol­len aber bei 1000 Bilder sein. Die Auswahl der durch eine KI (Künstliche Intelligenz) erzeug­ten Bilder muss noch manu­ell vor­ge­nom­men wer­den, „da nicht alle gene­rier­ten Bilder markt­fä­hig sind“, wie Panthermedia-​Geschäftsführer Tomas Speight sagt. Wer durch die Kollektion stö­bern will, kann auf der Panthermedia-​Webseite in der Kopfzeile auf „Synths“ kli­cken.

Drei Beispiele der syn­the­tisch erstell­ten Portraits bei Panthermedia

Die Portraits wer­den wahl­wei­se vor einem wei­ßen oder einem grü­nen Hintergrund ange­bo­ten. Später sol­len auch Bilder aus ande­ren Themenbereichen fol­gen. Mit aktiv in der KI-​Firma vAIsual sind übri­gens die Stock-​Veteranen und Branchenkenner Mark Milstein und Lee Torrens.

Die Bilder sind aktu­ell nicht in Abonnements oder Bildpaketen erhält­lich. Sie sind in zwei Größen erhält­lich, die Web-​Größe kos­tet zur Zeit 29,90 Euro, die Größe XXL 69,90 Euro, wobei XXL hier auch nur gut 2 Megapixel bedeu­tet, was die Nutzungen im Print-​Bereich noch etwas einschränkt.

Das Hauptkriterium für die Entscheidung, ein künst­li­ches Bild zu nut­zen, soll laut Panthermedia der nicht mehr not­wen­di­ge Modelvertrag sein:

Neben dem fas­zi­nie­ren­den Kunstaspekt ist der Hauptvorteil von KI-​generierten Bilder, dass kei­ne Model-​Releases erfor­der­lich sind. Die gezeig­ten Personen exis­tie­ren in der Realität gar nicht. Die Fotos haben somit kei­ne der Einschränkungen wie sie in Bezug auf die Abbildung von rea­len mensch­li­chen Modellen bestehen. Dies eröff­net ganz neue Möglichkeiten für eine siche­re Nutzung bei sen­si­blen Inhalten, bei­spiels­wei­se aus den Bereichen Pharma, Medizin und ande­re sen­si­ti­ven Themen, die tra­di­tio­nell nicht von Model-​Release-​Bildern abge­deckt wer­den.
Auch bei redak­tio­nel­len Themen ist dies ein gro­ßer Vorteil im Hinblick auf die Rechte abge­bil­de­ten Personen nach der DSGVO. Ein wei­te­rer wich­ti­ger Punkt in die­sem Zusammenhang ist, dass die­se KI-​generierten Bilder als Set für das Training ande­rer KI-​Anwendungen lizen­ziert wer­den können.“

Daher gel­ten für die Bildnutzung auch die aktu­el­len Panthermedia-​Nutzungsbedingungen mit der Ausnahme, dass eine Bandbreite an „Sensitive Issues“ zuge­las­sen ist.

Offene Fragen

Mit die­sem Quantensprung tau­chen nun auch neue recht­li­che und mora­li­sche Fragen auf, die sich ver­mut­lich erst nach einer Weile klä­ren las­sen werden.

Wie schon in mei­nem Artikel von vor zwei Jahren erwähnt, sind hier vor allem das Persönlichkeitsrecht und das Missbrauchspotential zu erwäh­nen.

Selbst wenn die Portraits digi­tal erstellt wur­den, kön­nen sie trotz­dem Bilder gene­rie­ren, die ech­ten, real exis­tie­ren­den Personen sehr ähn­lich sehen. Auch wird es mit sol­chen Bildern für Betrüger und Scammer leich­ter, sich einen per­sön­li­chen Anstrich zu geben, aber trotz­dem anonym zu bleiben.

Und wer hat das Urheberrecht, wenn die Bilder digi­tal von einer Maschine erzeugt wur­den? Was pas­siert also, wenn jemand die­se Bilder ohne Bezahlung benut­zen wür­de? Kann die Agentur Nutzungshonorare einklagen?

Gefahr für Fotografen?

Vor zwei Jahren war ich ent­spannt, dass der aktu­el­le Stand der Technik Stockfotografen nicht gefähr­lich wäre. Das gilt mitt­ler­wei­le nur noch mit Einschränkungen. Zum einen hat sich die Bildauflösung von 1 auf 2 Megapixel ver­dop­pelt. Das ist abso­lut gese­hen zwar immer noch recht wenig, aber schon eine deut­li­che Steigerung.

Weggefallen ist nun jedoch offen­sicht­lich die Einschränkung, dass die gene­rier­ten Portraits nicht kom­mer­zi­ell genutzt wer­den dür­fen, was die Bedrohung für Portraitfotografen mas­siv steigert.

Für Stockfotografen blei­ben auch im Portraitbereich zwar noch sehr vie­le Bereiche, wel­che die KI aktu­ell nicht abde­cken kann, aber ich ver­mu­te, dass die­se Bereiche im Laufe der Zeit wei­ter schrump­fen werden.

Ein klei­ner Hoffnungsschimmer ist aktu­ell, dass die Verschlagwortung momen­tan mehr als dürf­tig ist: So ent­hält das obi­ge Bild nur die neun Suchbegriffe:

adult, fema­le, girl, half length, model, release, requi­red, woman, young“

Diese wider­spre­chen sich einer­seits (girl/​adult) und sind auch nicht sehr akku­rat (young) und wich­ti­ge ande­re Schlagwörter wie die Ethnie, der Gefühlsausdruck und so wei­ter feh­len völ­lig. Das kann sich mit etwas Motivation sei­tens der Bildagentur jedoch schnell ändern.

Was sagt ihr zu der neu­en Kollektion?

100.000 kostenlose computergenerierte Portraits: Das Ende der Model-Fotografie?

Die Firma icons8 hat gera­de etwas Bahnbrechendes gemacht: Sie hat 100.000 durch künst­li­che Intelligenz erstell­te Portraits kos­ten­frei zur Nutzung bereit gestellt.

Die künst­li­che Intelligenz brauch­te etwas zum „Trainieren“, um zu erken­nen, wann ein Ergebnis mensch­lich genug aus­sah und wann nicht. Dafür hat die Firma nach eige­nen Angaben inner­halb von drei Jahren 29.000 Portraits von 69 Models aufgenommen.

Die fer­ti­gen com­pu­ter­ge­nerier­ten Fotos wer­den auf der Webseite https://generated.photos/ kos­ten­frei zum Download und zur Nutzung ange­bo­ten im Format 1024x1024 Pixel, also 1 Megapixel. Bei den 100.000 Bildern sind eini­ge dabei, die erkenn­bar „fake“ sind, weil der Computer selt­sa­me Artefakte an komi­schen Stellen gene­riert hat und oft sind bei lan­gen Haaren die Enden falsch, wie wenn man wild in Photoshop mit dem Klonstempel Amok gelau­fen wäre oder das Verflüssigen-​Tool nicht rich­tig beherrscht.

Alles AI-​basierte künst­li­che Gesichter von generated.photos

Das soll aber nicht dar­über hin­weg täu­schen, dass vie­le der Bilder nicht mehr von einem ech­ten Foto zu unter­schei­den sind. Geplant ist in Zukunft sogar eine Art Tool, mit der Nutzer (ver­mut­lich gegen Gebühr) auf Knopfdruck sich selbst Portraits gene­rie­ren und dabei Kriterien wie Geschlecht, Alter, Stimmung, Blickwinkel etc. selbst beein­flus­sen können.

In die­sem Video stellt sich das Projekt kurz selbst vor:

Hier als Beispiel eini­ge Bilder von https://generated.photos, die tat­säch­lich so rea­lis­tisch sind, dass kaum vor­stell­bar ist, dass sie kei­ne Fotos sind (Klicken zum Vergrößern):

Wer eben­falls mal stö­bern will, kann die Webseite https://100k-faces.glitch.me/ auf­ru­fen. Bei jedem neu­en Laden der Seite wird zufäl­lig eins der 100.000 Gesichter gezeigt.

Wie dürfen die Bilder genutzt werden?

Laut der Webseite dür­fen die Bilder für jeg­li­che („wha­te­ver“) Nutzung ver­wen­det wer­den, zum Beispiel für Präsentationen, Projekte, Mock-​Ups, Avatare auf Webseiten, Newsletter, Arbeitsblätter etc., vor­aus­ge­setzt, es wird ein Link auf deren Webseite gesetzt. Konkreter erklärt es der Chefdesigner bei icons8, Konstantin Zhabinskiy hier:

If you plan to use pho­to on your web­site, set a link to Generated Photos on all pages whe­re you use our con­tent. If you use it on most pages, a link in your foo­ter is fine. Desktop and Mobile apps should have a link in the About dia­log or Settings. Also, plea­se cre­dit our work in your App Store or Google Play descrip­ti­on (some­thing like „Photos by Generated Photos“ is fine).“

In den klein­ge­druck­ten Nutzungsbedingungen auf der Seite steht unter Punkt 3.2 jedoch, dass kei­ne „kom­mer­zi­el­le Nutzung“ erlaubt sei und gene­rell vie­le Einschränkungen gel­ten, wie zum Beispiel dass die Lizenz sei­tens der Betreiber jeder­zeit ent­zo­gen wer­den kann und dann jedes Material, egal ob digi­tal oder gedruckt, zer­stört wer­den muss:

Das wider­spricht sich jedoch mit den öffent­li­chen Äußerungen der Firma, wes­halb ich per Email um eine Stellungnahme gebe­ten habe, auf die ich lei­der noch kei­ne Antwort habe.

In deren FAQ wird dar­auf hin­ge­wie­sen, dass das Verfassen von Nutzungsrechten für Produkte künst­li­cher Intelligenz eine Neuheit ist, wes­halb sie sich das Ändern die­ser Nutzungsbedingungen jeder­zeit vor­be­hal­ten. Wenn man kurz dar­über nach­denkt, ist es logisch: Mit wel­chem Recht soll­te jemand das Urheberrecht an Werken bean­spru­chen, die er nicht selbst geschaf­fen hat? Das wird noch Stoff für juris­ti­sche Auseinandersetzungen liefern.

Andere Projekte mit künstlichen Personenbildern

Die Webseite generated.photo ist weder die ein­zi­ge noch die ers­te Seite, die künst­lich erzeug­te Gesichter prä­sen­tiert. So gibt es seit einer Weile die Seite www.thispersondoesnotexist.com, wel­che das glei­che GAN („Generative Adversarial Network“)-Modell als Grundlage wie generated.photo nutzt. Hier eine sehr aus­führ­li­che Erklärung, wie die­se GAN funktionieren.

Eine ande­re Webseite ist www.artificialtalent.co, bei der Modefotos gegen Bezahlung mit künst­lich erzeug­ten Gesichtern „auf­ge­hübscht“ wer­den kön­nen, um mehr Kleidung zu verkaufen.

Eine gro­ße Sammlung sol­cher AI-​basierten Webseiten, nicht nur für Personenbilder, lie­fert die­se Webseite.

Was bedeuten diese Projekt für die Stockfotografie?

Kurzfristig sind sie noch kei­ne Bedrohung für Stockfotografen. Erstens funk­tio­niert die­se Technik aktu­ell nur bei Portraits und die Auflösung ist mit 1 MP etwas beschränkt. Der Ausschuss ist, wie man beim Durchblättern der 100.000 Bilder sehen kann, noch ziem­lich groß, auch wenn erstaun­li­che Ergebnisse dar­un­ter sind. Außerdem ist nur eine pri­va­te Nutzung erlaubt, wes­halb Werbetreibende wei­ter­hin auf Stockmaterial zurück­grei­fen müssen.

Mittelfristig sehe ich jedoch durch­aus die Möglichkeit, dass ein Teil der Nutzung zu den com­pu­ter­ge­nerier­ten Bildern abwan­dert. Erstens sind die­se künst­li­chen Intelligenzen schnell lern­fä­hig, was zu expo­nen­ti­ell bes­ser wer­den­den Ergebnissen und stei­gen­den Bildauflösungen füh­ren soll­te. Die Technik wur­de immer­hin erst 2014 vor­ge­stellt und kann nun schon glaub­wür­di­ge Gesichter generieren.

Außerdem funk­tio­niert die Technik nicht nur bei Menschen, auch Landschaften las­sen sich so digi­tal erzeu­gen, wie die­se inter­ak­ti­ve Demo von Nvidia zeigt. Selbst für Inneneinrichtungen gibt es schon eine Webseite, bei der Leute ein Foto ihrer Wohnung hoch­la­den kön­nen und die AI rich­tet die­se vir­tu­ell neu ein.

Die Gefahr für Stockfotografen besteht dar­in, dass ihre Bilder oft sehr gene­risch und aus­tausch­bar sind, bei­des also Attribute, wel­che per­fekt für com­pu­ter­ge­nerier­te Ansätze sind.

No Model Release, no problem?

Wie bei etli­chen neu­en Technologien zei­gen sich Gefahren lei­der erst, wenn die­se eine Weile im Einsatz sind. Deshalb beto­nen eini­ge Forscher aus die­sem Gebiet, dass die ethi­sche Komponente nicht unter­schätzt wer­den darf. Das heißt im Klartext: Die erzeug­ten Bilder basie­ren auf ech­ten Fotos: Wird die AI nur mit schö­nen, kau­ka­si­schen jun­gen Gesichtern trai­niert, wer­den auch die Ergebnisse schön, jung und weiß sein. Nur wer genü­gend Diversität im Ausgangsmaterial hat, kann die­se auch vom Computer erzeu­gen lassen.

Eine wei­te­re, bis­her nicht erwähn­te Gefahr, sehe ich in den Persönlichkeitsrechten. Klar, die abge­bil­de­ten Personen haben kei­ne Persönlichkeitsrechte. Wer sich eine Weile durch die Beispiele klickt, wird jedoch mer­ken, dass ihm etli­che Gesichter irgend­wie bekannt und ver­traut vor­kom­men. Es kann ja sein, dass der Computer Gesichter gene­riert, die in echt leben­den Menschen wie aus dem Gesicht geschnit­ten aus­se­hen. Sollten die­se Menschen dann nicht das Persönlichkeitsrecht an den AI-​Bildern haben, wenn sie mit denen ver­wech­selt wer­den kön­nen?
Man könn­te den Vergleich zu ein­ei­igen Zwillingen zie­hen: Hat der eine das Recht, dem ande­ren abzu­spre­chen, für bestimm­te Produkte oder Meinungen zu werben?

Generell ist das Missbrauchspotential die­ser Technik sehr hoch, man den­ke nur an aus­ge­dach­te Testimonials, gefälsch­te Social Media Accounts und so wei­ter. Vor allem in Kombination mit ande­ren Techniken wie „Deep Fakes“, bei der Videos Gesichter ande­rer Personen erhal­ten oder Adobe #VoCo, wo Stimmen ande­rer Personen mani­pu­liert wer­den kön­nen, erge­ben sich vie­le Möglichkeiten, die sehr dazu geeig­net sind, das Vertrauen von Menschen in digi­ta­le Inhalte zu unter­gra­ben. Wie so oft sind Pornos Vorreiter die­ser neu­en Technologie: Schon heu­te gibt es eini­ge Webseiten, auf der Gesichter von Berühmtheiten in Pornofilme mon­tiert werden.

Was sagt ihr zu die­ser Entwicklung?