Schlagwort-Archive: Beta

Generatives Füllen in Adobe Photoshop – Erste Erfahrungen mit der Beta

Seit eini­gen Wochen gibt es in der Beta-​Version von Adobe Photoshop die Möglichkeit, den neu­en „Generative Füllung“-Befehl aus­zu­pro­bie­ren. Das ist qua­si die Integration der Adobe Firefly-KI direkt als Tool in Photoshop, mit der ihr belie­bi­ge Elemente direkt in eure Bilder gene­rie­ren las­sen könnt – durch künst­li­che Intelligenz.

In den letz­ten Wochen habe ich eini­ge Beispiele der neu­en KI-​Fähigkeiten auf mei­ner Facebook-​Seite gezeigt (also folgt mir dort, falls ihr schnel­ler infor­miert wer­den wollt), aber je mehr ich die Funktion nut­ze, des­to mehr bekam ich das Gefühl, dass ich damit den neu­en Möglichkeiten nicht gerecht würde.

Deshalb will ich heu­te eini­ge mei­ner Experimente im Blog vor­stel­len, damit ihr eine Ahnung davon bekommt, was alles – nicht in Zukunft – son­dern ab sofort in Photoshop mög­lich ist.

Was ist der „Generative Fill“-Befehl in Photoshop?

Seit der neus­ten Photoshop-​Version wer­den je nach Werkzeug und Aktion im Bild häu­fig genutz­te Befehle in einer Shortcut-​Leiste ein­ge­blen­det. Wenn eine Markierung, also so eine gestri­chel­te Linie, aktiv ist, ist der ers­te Befehl in der Beta-​Version von Photoshop der „Generative Fill“.

Wer dar­auf klickt, kann ent­we­der Text in ein Bedienfeld ein­tip­pen oder ein­fach direkt auf „Generieren“ kli­cken. Wer Text ein­gibt, gibt damit den „Prompt“ an (ver­gleich­bar mit der Texteingabe bei KI-​Tools wie Midjourney, Stable Diffusion oder Dall‑E 2), wel­chen die KI zu einem Bildinhalt umwan­deln soll. Wer dar­auf ver­zich­tet, gibt der KI freie Hand bei der Motivauswahl und die KI ver­sucht dann, den mar­kier­ten Bereich so zu fül­len, dass er sich naht­los ins vor­han­de­ne Bild einpasst.

Damit han­delt die KI qua­si wie beim Befehl „Inhaltsbasiertes Füllen“, nur in deut­lich bes­se­rer Qualität und mit dem Unterschied, dass die Füllung nicht aus dem bestehen­den Bild genom­men wird, son­dern aus den Trainingsdaten der KI. Das hat den Vorteil, dass deut­lich grö­ße­re Bereiche gefüllt wer­den kön­nen und kei­ne unna­tür­li­chen Wiederholungsmuster ent­ste­hen, wie das beim „inhalt­ba­sier­ten Füllen“ manch­mal der Fall war.

Möglichkeiten in der Beta-Version

Die Adobe-​eigene KI „Firefly“ befin­det sich aktu­ell in der Betaphase zum Testen für die nicht-​kommerzielle Nutzung und auch das „Generative Füllen“ in der Beta-​Version von Photoshop ist aktu­ell nur für nicht-​kommerzielle Anwendungen freigegeben.

In den letz­ten Tagen habe ich ver­stärkt bewusst nur mit der Beta-​Version gear­bei­tet und pro­biert, an wel­chen Stellen die KI mich bei der Arbeit unter­stüt­ze könn­te. Okay, manch­mal habe ich auch ein­fach nur rum­ge­al­bert und aus­pro­biert, ob die KI mei­ne lus­ti­gen Ideen glaub­haft umset­zen könnte.

Schauen wir uns eini­ge der Ergebnisse an:

Das männ­li­che Model hat ver­ges­sen Bescheid zu geben, dass er sich seit dem Sedcard-​Shooting ver­än­dert hat und taucht am Set mit einem Schnauzbart auf? Kein Problem, ein­fach mar­kie­ren und weg ist der Bart.

Das Model trägt nur ein Hemd, soll aber wie die ande­ren Personen im Bild einen dunk­len Anzug tra­gen? Oder einen roten? Oder ein T‑Shirt? Oder einen Neoprenanzug? Oder doch lie­ber eine Lederjacke?
Auch hier kein Problem, den Körper mar­kie­ren und in das Feld für die gene­ra­ti­ve Füllung das gewünsch­te Kleidungsstück auswählen.

Im KI-​Bild ist die Smartwatch am Handgelenk nur mat­schi­ger Brei? Dann halt mit der zwei­ten KI, also hier Firefly, ein pas­sen­des Display für die Uhr generieren.

Beim Gruppen-​Businessfoto will der Kunde mehr Diversität im Bild haben? Einfach paar Köpfe im Hintergrund mar­kie­ren und gegen ande­re austauschen.

Diesen Trick nen­ne ich „den Trotzki machen“: Eine Person auf dem Foto soll ver­schwin­den, wie auf dem Lenin-​Foto von Grigori Goldstein im Jahr 1920? Einfach mar­kie­ren und auf „gene­ra­ti­ve Füllung“ kli­cken. Wer ins Textfeld statt­des­sen eine ande­re Personenbeschreibung ein­fügt, kann die Person auch austauschen.

Ihr habt eine Aufnahme und wollt „raus­zoo­men“? Geht jetzt ein­fach, indem ihr die Leinwand ver­grö­ßert und den nun lee­ren Teil mar­kiert und gene­ra­tiv fül­len lasst. Der schwar­ze Rahmen dient hier als Markierung, alles außer­halb davon ist KI-​generiert, inner­halb ist eine Drohnenaufnahme.

Aerial view of rural land­scape in Ellenberg, Germany in summer

Die Karre vor eurer Haustür ist zu klein? Einfach mar­kie­ren und zack, wird ein Panzer draus.
Hier wird auch erkenn­bar, wie pro­ble­ma­tisch die­se Technik für die Erstellung von „Fake News“ sein kann.

Das Generative Füllen funk­tio­niert nicht nur mit Teilen vom Bild. Auch eine kom­plett lee­re Leinwand kann mar­kiert und gefüllt wer­den, wie hier in mei­nem Beispiel mit einem Dschungel. Im nächs­ten Schritt habe ich den Dschungel mit etli­chen Tieren bevölkert.

Erkenntnisse des Beta-Tests

Es ist leicht erkenn­bar, wie mäch­tig und nütz­lich das neue KI-​Tool in Photoshop sein kann. Bei den meis­ten Fällen lie­fert die Generative Füllung gan­ze Arbeit. Nur bei eini­gen Prompts ver­steht Photoshop (bis­her) ein­fach nicht, was gemeint ist. Beim obi­gen Beispiel, wo ich zuerst die Person ent­fernt und danach mit einer Frau ersetzt habe, woll­te ich eigent­lich „Batman“ sehen, aber da hat wohl ein inter­ner „Intellectual Property“-Filter ange­schla­gen und das Ergebnis in eine ande­re Richtung gelenkt.

Mehrmals stieß ich aber auch bei mei­ner Meinung nach unver­fäng­li­chen Bearbeitungen auf die Fehlermeldung „Die erzeug­ten Bilder wur­den ent­fernt, da sie gegen Benutzerrichtlinien ver­sto­ßen“ und Photoshop lie­fer­te ein­fach kei­ne oder weni­ger als drei Ergebnisse. Das pas­sier­te zum Beispiel manch­mal, wenn ich schie­fe, krum­me Zähne von KI-​Portraits mar­kiert hat­te und – ohne kon­kre­ten Prompt – schö­ne­re Zähne haben woll­te. Aber auch, wenn ich Gebäudefassaden auf­hüb­schen oder repa­rie­ren woll­te, erhielt ich ab und zu Meldung, was nach einer Weile den Workflow unschön unterbrach.

Die KI in Photoshop lie­fert gene­rell knack­schar­fe Ergebnisse, aber vor allem bei grö­ße­ren Auflösungen kommt die KI manch­mal an ihre Grenzen und die KI-​Füllungen wer­den unscharf. Das liegt dann meist dar­an, dass der mar­kier­te Bereich grö­ßer als ein Megapixel (1024x1024 Pixel) ist. Bis zu die­ser Größe arbei­tet die KI bis­her nativ, alles was grö­ßer ist, wird künst­lich hoch­ska­liert, was eben zur Unschärfe füh­ren kann. Eine mög­li­che Abhilfe ist hier, bei gro­ßen Aufträgen die Fläche in klei­ne­re Bereiche zu unter­tei­len und die „Generative Füllung“ mehr­mals lau­fen zu lassen.

Die Vergütung der Urheber an den Trainingsdaten

Adobe wirbt damit, dass deren KI im Gegensatz zu gewis­sen ande­ren Anbietern recht­lich und ethisch „sau­ber“ sein soll, weil die Trainingsdaten alle legal genutzt wor­den seien.

Adobe beruft sich hier vor allem dar­auf, dass sie die Bilder aus ihrem Adobe Stock-​Portfolio für Trainingszwecke ver­wen­det haben. Das ist in den Nutzungsbedingungen für Adobe Stock-​Anbieter vom 15. April 2022 gere­gelt, wo es plötz­lich heißt: 

You grant us a non-​exclusive, world­wi­de, per­pe­tu­al, fully-​paid, and royalty-​free licen­se to use, repro­du­ce, publicly dis­play, publicly per­form, dis­tri­bu­te, index, trans­la­te, and modi­fy the Work for the pur­po­ses of ope­ra­ting the Website; pre­sen­ting, dis­tri­bu­ting, mar­ke­ting, pro­mo­ting, and licen­sing the Work to users; deve­lo­ping new fea­tures and ser­vices; archi­ving the Work; and pro­tec­ting the Work.“

(Hervorhebung durch mich)

Bezahlt wur­den die Adobe Stock-​Anbieter bis­her für ihre Trainingsdaten noch nicht, was das „ethisch“ etwas grau­er wer­den lässt. Zurecht sind daher eini­ge Adobe Stock-​Anbieter etwas sau­er, dass sie weder bezahlt noch rich­tig gefragt wur­den. Die Änderung der Nutzungsbedingungen geschah wie üblich ohne gro­ße Ankündigung oder gar Verweise auf geplan­te KI-Trainings.

Immerhin schreibt Adobe eher neben­bei auf Twitter, dass eine Kompensation der Urheber geplant sei, wenn die Firefly-​KI die Betaphase verlasse:

Was habt ihr bis­her mit dem Tool umset­zen kön­nen?
Was ist eure Meinung zu dem Werkzeug?
Schreibt es ger­ne in die Kommentare.

Die Bildershop-​Software Pixtacy 4 braucht Beta-​Tester (Gastartikel)

Der Fotograf Thomas Gade aus Berlin vom medienarchiv.com schick­te mir die­sen Gastartikel, weil er um Mithilfe bei der Verbesserung der von ihm genutz­ten Bildershop-​Software Pixtacy bit­ten möchte:

Fotografen, die ihre Bilder im Internet prä­sen­tie­ren und ver­kau­fen, nut­zen ver­schie­de­ne Möglichkeiten. Sie unter­schei­den sich im Wesentlichen dadurch, dass sie ent­we­der im eige­nen Webspace indi­vi­du­ell auf­ge­setzt und gema­nagt wer­den oder von ande­ren nach deren Regeln betrie­ben werden.

Welche Gründe spre­chen für die eige­ne Bilddatenbank? Stockagenturen neh­men vie­le Bilder gar nicht an, die vom Urheber als prä­sen­ta­ti­ons­wür­dig erach­tet wer­den. Eventfotografen brau­chen Präsentations- und Vermarktungsplattformen, die zu ihrem Geschäft pas­sen. Archive prä­sen­tie­ren ihre Bestände im Rahmen einer musea­len Philosophie, bei­spiels­wei­se Ausschnitte aus foto­gra­fi­schen Nachlässen von Menschen, die regio­na­le Zeitgeschichte doku­men­tiert haben. Im kom­mer­zi­el­len Sektor fin­den sol­che Bestände kei­ne ange­mes­se­ne Präsentation.

Beispiel für Pixtacy-Frontend
Beispiel für Pixtacy-Frontend

Es gibt gute kos­ten­lo­se Lösungen wie Coppermine, Piwigo und Gallery 3. Nach der unver­meid­li­chen Lernphase las­sen sich damit anspre­chen­de Bildergalerien auf­bau­en. Das Urgestein Coppermine hat ein reges Forum, mit des­sen Hilfe sich vie­le Fragen rasch klä­ren las­sen. Unter den kos­ten­lo­sen Bilddatenbanken ist es aus mei­ner Sicht die inter­es­san­tes­te, zumal Gallery 3 nicht mehr gepflegt wird.

Seit 2009 gibt es das in Bremen ent­wi­ckel­te Pixtacy, ein ‚Shopsystem für Fotografen‘. Es basiert auf dem Content Management System (CMS) Virthos, das mir neben Pixtacy noch nie begeg­net ist und wird von Martin Wandelt, einem mit den kauf­män­ni­schen Interessen der Fotografen bes­tens bewan­der­ten Programmierer, betreut.

Pixtacy hat die übli­chen Elemente von Bilddatenbanken. Es gibt eine Eingangsseite mit Login- und Suchfunktion gefolgt von einer Übersichtsseite in Form einer Liste oder mit Thumbnails und dazu­ge­hö­ri­gen Bezeichnungen. Dies sind über­ge­ord­ne­te Themen, anders­wo Kategorien genannt, zu denen belie­big vie­le Alben gehö­ren kön­nen. Sie wer­den eben­falls als Thumbnails ange­zeigt und nach dem Öffnen eines Albums sieht man die dar­in befind­li­chen Bilder in der glei­chen Form. Jedoch ist beim Mouse-​over auf einem der klei­nen Bildchen eine grö­ße­re Darstellung zu sehen und nach einem Klick dar­auf erscheint eine Einzeldarstellung mit detail­lier­ten Informationen und, falls ein­ge­rich­tet, Lizenzierung-​und Erwerbsmöglichkeiten, Leuchtkastenfunktion und mehr. Martin Wandelt hat das tech­nisch gut gelöst und selbst eine aus­ge­wach­se­ne kom­mer­zi­el­le Abwicklung inte­griert, wie die Rechnungslegung und Dokumentation. Letzteres bie­tet kei­ne Freeware.

Hier ist ein Link zu vie­len Pixtacy Installationen, dort kann man diver­se Designs ansehen.

Hat man lokal sei­ne eige­nen Bilder im Griff, also ordent­lich beschrif­tet, struk­tu­riert und benannt, ist der Aufbau eines Onlinearchivs rela­tiv sim­pel. Man lädt eine Kopie sei­nes gesam­ten Archivs mit all sei­nen Verzeichnissen und Unterordnern in ein Zielverzeichnis. Anschließend wird Pixtacy beauf­tragt, die Bilder zu impor­tie­ren und Thumbnails nebst Previews mit oder ohne Wasserzeichen anzufertigen.

Das Einrichten der indi­vi­du­ell gewünsch­ten Verkaufsoptionen ist kniff­li­ger, doch am Ende kön­nen die Bilder in ver­schie­de­nen Auflösungen gegen Honorar lizen­ziert wer­den oder als Abzüge bis hin zum Druck auf einem Kaffeepott bestellt wer­den. Die ent­spre­chen­den Dienstleister wer­den ein­ge­bun­den und der gesam­te Vorgang läuft anschlie­ßend auto­ma­tisch ab.

Das klingt fast zu gut, um wahr zu sein, zumal die Free-​Edition für maxi­mal 250 Fotos kos­ten­los ist und die Lizenzgebühr für eine Professional-​Edition fai­re 349 € kos­tet. Der Anbieter gewährt zu ver­schie­de­nen Anlässen Rabatte. Mit einem kos­ten­pflich­ti­gen Zusatzmodul ist Pixtacy sogar an Picturemaxx anzu­bin­den, dem Recherche- und Bestelltool der Redakteure schlechthin.

Jedoch gibt es eine Achillesferse. Das Design von Pixtacy bewegt sich auf einem Niveau, das längst nicht mehr zeit­ge­mäß ist. Der Benutzer kann durch Veränderungen an ver­schie­de­nen CSS- und ande­ren Dateien eige­ne Gestaltungsideen rea­li­sie­ren. Seltsamerweise lie­gen die rele­van­ten Dateien nicht in einem indi­vi­du­ell benenn­ba­ren Themeverzeichnis, son­dern in meh­re­ren Ordnern. Der Entwickler setzt einen hohen Kenntnisstand bezüg­lich der Webseitentechnologie vor­aus, um anspre­chen­de indi­vi­du­el­le Installationen einzurichten.

Teil des Backends von Pixtacy
Teil des Backends von Pixtacy

Eine seit lan­gem vor­herr­schen­de Kritik an dem Projekt ist der Umstand, dass durch Updates müh­sam erstell­te Veränderungen außer Kraft gesetzt wer­den. Die Benutzer kön­nen sich nach einer gewis­sen Pause nicht mehr im ein­zel­nen dar­an erin­nern, wo und was sie geän­dert haben. Die betref­fen­den Dateien wer­den durch Updates über­schrie­ben und es gibt kein benut­zer­freund­li­ches Verfahren, um dies zu verhindern.

Vor eini­gen Wochen wur­de auf der Pixtacy-​Website zum Betatest der in Kürze erschei­nen­den Version 4 auf­ge­ru­fen. Die Teilnahme am Betatest ist kos­ten­los. Bislang ist die Resonanz mau. Abgesehen von eini­gen weni­gen Stimmen, die begrü­ßen, dass sich end­lich etwas tut, kommt nur aus einer Ecke kon­struk­ti­ve Kritik. Eventuell an die­sem System Interessierte las­sen die Chance ver­strei­chen, Einfluss zu neh­men auf den Entwickler, der Hinweise und Vorschläge ernst nimmt, wenn sie von meh­re­ren geäu­ßert werden.

Die neue Version bie­tet end­lich die Möglichkeit, Thumbnail- und Previewabmessungen fle­xi­bel ein­zu­stel­len und sie adap­tiv zu prä­sen­tie­ren. Doch die für ein eige­nes Design rele­van­ten Dateien befin­den sich in drei ver­schie­de­nen Ordnern. Damit bleibt jedes Erscheinungsbild durch jedes Update gefähr­det. Um dies zu ver­mei­den, gehö­ren die­se Dateien in einen ein­zi­gen Ordner, der vom Benutzer im Themeverzeichnis ange­legt wird und einen Namen bekommt, den kein ande­res Verzeichnis in der Pixtacyinstallation trägt. So kann er bei Updates nicht über­schrie­ben werden.

Programmiertechnisch ist es sicher­lich kei­ne gro­ße Angelegenheit, die ent­spre­chen­den Pfade zu den CSS- und HTML-​Dateien so zu bestim­men, dass die­se Dateien in einem ein­zi­gen Ordner sind und nicht über die gesam­te Installation ver­teilt. Dann gäbe es die Möglichkeit, Themes zu ent­wi­ckeln, die leicht mit ande­ren zu tei­len sind.

Wenn euch das Thema inter­es­siert, betei­ligt euch am Betatest und wir­ken wir gemein­sam dar­auf hin, dass das oben beschrie­be­ne Problem ver­nünf­tig gelöst wird.

Hilfe bei der Bildersuche. Oder: Bilderdiebe aufgepasst!

Wo bleibt mein Geld? In Zeiten von gerin­ge­ren Umsätzen pro Bild im Bildermarkt, der von vie­len durch mehr Bilder ver­sucht wird aus­zu­glei­chen, ist es schwer, einen Überblick zu behal­ten, wo Fotos von einem ver­wen­det wer­den. Zum einen, um es den Models zu zei­gen, zum ande­ren, um Referenzen zu bekommen.

Eine drit­te Möglichkeit ist es, zu über­prü­fen, ob Fotos nicht sogar unrecht­mä­ßig oder ent­ge­gen den Lizenzbestimmungen genutzt wur­den. Einige Firmen wie Attributor oder Idée Inc. bie­ten des­halb den Service an, das Internet und Printmedien auto­ma­ti­siert nach Fotos (oder ande­ren Medieninhalten) zu durch­su­chen. Selbst Beschnitt, Textzugabe, Spiegelung oder Farbveränderungen an Fotos wird dabei erkannt.

Bisher waren die­se Services nur für gro­ße Industriekunden wie Nachrichtenagenturen ver­füg­bar. Beide Firmen arbei­ten jedoch an Systemen für Privatkunden oder Kleinunternehmen. Idée Inc. bie­tet nun den Service „TinEye“ in der Beta-​Phase zum Testen an. Damit kön­nen eige­ne Fotos im Internet gesucht werden.

Ich habe mal einen Test mit ca. 40 mei­ner meist­ver­kauf­ten Fotos gemacht. Bei einem der Fotos habe ich auf einer unga­ri­schen Webseite eine uner­laub­te Nutzung gefun­den. Vom Agenturfoto mit Wasserzeichen wur­de der Beschnitt so gewählt, dass das Wasserzeichen nicht zu sehen ist.

Danach habe ich mal einen Test mit popu­lä­ren Microstock-​Bestseller-​Fotos gemacht (z.B. dem hier) und 58 Webseiten gefun­den, die das Foto nut­zen. Darunter auch Blogs, bei denen das istockphoto-​Wasserzeichen noch zu sehen ist.

Angesichts des­sen, dass bis­her nur ein Bruchteil der Fotos im Internet vom Service erfasst wer­den, eine ganz gute Trefferquote, die es Fotografen in Zukunft hof­fent­lich ermög­licht, Bilderdieben leich­ter auf die Spur zu kommen.