Schlagwort-Archive: Beta

Generatives Füllen in Adobe Photoshop – Erste Erfahrungen mit der Beta

26. Juni 2023 Robert Kneschke Ein Kommentar

Seit einigen Wochen gibt es in der Beta-Version von Adobe Photoshop die Möglichkeit, den neuen „Generative Füllung“-Befehl auszuprobieren. Das ist quasi die Integration der Adobe Firefly-KI direkt als Tool in Photoshop, mit der ihr beliebige Elemente direkt in eure Bilder generieren lassen könnt – durch künstliche Intelligenz.

In den letzten Wochen habe ich einige Beispiele der neuen KI-Fähigkeiten auf meiner Facebook-Seite gezeigt (also folgt mir dort, falls ihr schneller informiert werden wollt), aber je mehr ich die Funktion nutze, desto mehr bekam ich das Gefühl, dass ich damit den neuen Möglichkeiten nicht gerecht würde.

Deshalb will ich heute einige meiner Experimente im Blog vorstellen, damit ihr eine Ahnung davon bekommt, was alles – nicht in Zukunft – sondern ab sofort in Photoshop möglich ist.

Was ist der „Generative Fill“-Befehl in Photoshop?

Seit der neusten Photoshop-Version werden je nach Werkzeug und Aktion im Bild häufig genutzte Befehle in einer Shortcut-Leiste eingeblendet. Wenn eine Markierung, also so eine gestrichelte Linie, aktiv ist, ist der erste Befehl in der Beta-Version von Photoshop der „Generative Fill“.

Wer darauf klickt, kann entweder Text in ein Bedienfeld eintippen oder einfach direkt auf „Generieren“ klicken. Wer Text eingibt, gibt damit den „Prompt“ an (vergleichbar mit der Texteingabe bei KI-Tools wie Midjourney, Stable Diffusion oder Dall‑E 2), welchen die KI zu einem Bildinhalt umwandeln soll. Wer darauf verzichtet, gibt der KI freie Hand bei der Motivauswahl und die KI versucht dann, den markierten Bereich so zu füllen, dass er sich nahtlos ins vorhandene Bild einpasst.

Damit handelt die KI quasi wie beim Befehl „Inhaltsbasiertes Füllen“, nur in deutlich besserer Qualität und mit dem Unterschied, dass die Füllung nicht aus dem bestehenden Bild genommen wird, sondern aus den Trainingsdaten der KI. Das hat den Vorteil, dass deutlich größere Bereiche gefüllt werden können und keine unnatürlichen Wiederholungsmuster entstehen, wie das beim „inhaltbasierten Füllen“ manchmal der Fall war.

Möglichkeiten in der Beta-Version

Die Adobe-eigene KI „Firefly“ befindet sich aktuell in der Betaphase zum Testen für die nicht-kommerzielle Nutzung und auch das „Generative Füllen“ in der Beta-Version von Photoshop ist aktuell nur für nicht-kommerzielle Anwendungen freigegeben.

In den letzten Tagen habe ich verstärkt bewusst nur mit der Beta-Version gearbeitet und probiert, an welchen Stellen die KI mich bei der Arbeit unterstütze könnte. Okay, manchmal habe ich auch einfach nur rumgealbert und ausprobiert, ob die KI meine lustigen Ideen glaubhaft umsetzen könnte.

Schauen wir uns einige der Ergebnisse an:

Das männliche Model hat vergessen Bescheid zu geben, dass er sich seit dem Sedcard-Shooting verändert hat und taucht am Set mit einem Schnauzbart auf? Kein Problem, einfach markieren und weg ist der Bart.

Das Model trägt nur ein Hemd, soll aber wie die anderen Personen im Bild einen dunklen Anzug tragen? Oder einen roten? Oder ein T‑Shirt? Oder einen Neoprenanzug? Oder doch lieber eine Lederjacke?
Auch hier kein Problem, den Körper markieren und in das Feld für die generative Füllung das gewünschte Kleidungsstück auswählen.

Im KI-Bild ist die Smartwatch am Handgelenk nur matschiger Brei? Dann halt mit der zweiten KI, also hier Firefly, ein passendes Display für die Uhr generieren.

Beim Gruppen-Businessfoto will der Kunde mehr Diversität im Bild haben? Einfach paar Köpfe im Hintergrund markieren und gegen andere austauschen.

Diesen Trick nenne ich „den Trotzki machen“: Eine Person auf dem Foto soll verschwinden, wie auf dem Lenin-Foto von Grigori Goldstein im Jahr 1920? Einfach markieren und auf „generative Füllung“ klicken. Wer ins Textfeld stattdessen eine andere Personenbeschreibung einfügt, kann die Person auch austauschen.

Ihr habt eine Aufnahme und wollt „rauszoomen“? Geht jetzt einfach, indem ihr die Leinwand vergrößert und den nun leeren Teil markiert und generativ füllen lasst. Der schwarze Rahmen dient hier als Markierung, alles außerhalb davon ist KI-generiert, innerhalb ist eine Drohnenaufnahme.

Aerial view of rural landscape in Ellenberg, Germany in summer

Die Karre vor eurer Haustür ist zu klein? Einfach markieren und zack, wird ein Panzer draus.
Hier wird auch erkennbar, wie problematisch diese Technik für die Erstellung von „Fake News“ sein kann.

Das Generative Füllen funktioniert nicht nur mit Teilen vom Bild. Auch eine komplett leere Leinwand kann markiert und gefüllt werden, wie hier in meinem Beispiel mit einem Dschungel. Im nächsten Schritt habe ich den Dschungel mit etlichen Tieren bevölkert.

Erkenntnisse des Beta-Tests

Es ist leicht erkennbar, wie mächtig und nützlich das neue KI-Tool in Photoshop sein kann. Bei den meisten Fällen liefert die Generative Füllung ganze Arbeit. Nur bei einigen Prompts versteht Photoshop (bisher) einfach nicht, was gemeint ist. Beim obigen Beispiel, wo ich zuerst die Person entfernt und danach mit einer Frau ersetzt habe, wollte ich eigentlich „Batman“ sehen, aber da hat wohl ein interner „Intellectual Property“-Filter angeschlagen und das Ergebnis in eine andere Richtung gelenkt.

Mehrmals stieß ich aber auch bei meiner Meinung nach unverfänglichen Bearbeitungen auf die Fehlermeldung „Die erzeugten Bilder wurden entfernt, da sie gegen Benutzerrichtlinien verstoßen“ und Photoshop lieferte einfach keine oder weniger als drei Ergebnisse. Das passierte zum Beispiel manchmal, wenn ich schiefe, krumme Zähne von KI-Portraits markiert hatte und – ohne konkreten Prompt – schönere Zähne haben wollte. Aber auch, wenn ich Gebäudefassaden aufhübschen oder reparieren wollte, erhielt ich ab und zu Meldung, was nach einer Weile den Workflow unschön unterbrach.

Die KI in Photoshop liefert generell knackscharfe Ergebnisse, aber vor allem bei größeren Auflösungen kommt die KI manchmal an ihre Grenzen und die KI-Füllungen werden unscharf. Das liegt dann meist daran, dass der markierte Bereich größer als ein Megapixel (1024x1024 Pixel) ist. Bis zu dieser Größe arbeitet die KI bisher nativ, alles was größer ist, wird künstlich hochskaliert, was eben zur Unschärfe führen kann. Eine mögliche Abhilfe ist hier, bei großen Aufträgen die Fläche in kleinere Bereiche zu unterteilen und die „Generative Füllung“ mehrmals laufen zu lassen.

Die Vergütung der Urheber an den Trainingsdaten

Adobe wirbt damit, dass deren KI im Gegensatz zu gewissen anderen Anbietern rechtlich und ethisch „sauber“ sein soll, weil die Trainingsdaten alle legal genutzt worden seien.

Adobe beruft sich hier vor allem darauf, dass sie die Bilder aus ihrem Adobe Stock-Portfolio für Trainingszwecke verwendet haben. Das ist in den Nutzungsbedingungen für Adobe Stock-Anbieter vom 15. April 2022 geregelt, wo es plötzlich heißt:

„You grant us a non-exclusive, worldwide, perpetual, fully-paid, and royalty-free license to use, reproduce, publicly display, publicly perform, distribute, index, translate, and modify the Work for the purposes of operating the Website; presenting, distributing, marketing, promoting, and licensing the Work to users; developing new features and services; archiving the Work; and protecting the Work.“
(Hervorhebung durch mich)

Bezahlt wurden die Adobe Stock-Anbieter bisher für ihre Trainingsdaten noch nicht, was das „ethisch“ etwas grauer werden lässt. Zurecht sind daher einige Adobe Stock-Anbieter etwas sauer, dass sie weder bezahlt noch richtig gefragt wurden. Die Änderung der Nutzungsbedingungen geschah wie üblich ohne große Ankündigung oder gar Verweise auf geplante KI-Trainings.

Immerhin schreibt Adobe eher nebenbei auf Twitter, dass eine Kompensation der Urheber geplant sei, wenn die Firefly-KI die Betaphase verlasse:

Was habt ihr bisher mit dem Tool umsetzen können?
Was ist eure Meinung zu dem Werkzeug?
Schreibt es gerne in die Kommentare.

Gastartikel, Technik

Die Bildershop-Software Pixtacy 4 braucht Beta-Tester (Gastartikel)

4. Oktober 2014 Gastautor 4 Kommentare

Der Fotograf Thomas Gade aus Berlin vom medienarchiv.com schickte mir diesen Gastartikel, weil er um Mithilfe bei der Verbesserung der von ihm genutzten Bildershop-Software Pixtacy bitten möchte:

Fotografen, die ihre Bilder im Internet präsentieren und verkaufen, nutzen verschiedene Möglichkeiten. Sie unterscheiden sich im Wesentlichen dadurch, dass sie entweder im eigenen Webspace individuell aufgesetzt und gemanagt werden oder von anderen nach deren Regeln betrieben werden.

Welche Gründe sprechen für die eigene Bilddatenbank? Stockagenturen nehmen viele Bilder gar nicht an, die vom Urheber als präsentationswürdig erachtet werden. Eventfotografen brauchen Präsentations- und Vermarktungsplattformen, die zu ihrem Geschäft passen. Archive präsentieren ihre Bestände im Rahmen einer musealen Philosophie, beispielsweise Ausschnitte aus fotografischen Nachlässen von Menschen, die regionale Zeitgeschichte dokumentiert haben. Im kommerziellen Sektor finden solche Bestände keine angemessene Präsentation.

Es gibt gute kostenlose Lösungen wie Coppermine, Piwigo und Gallery 3. Nach der unvermeidlichen Lernphase lassen sich damit ansprechende Bildergalerien aufbauen. Das Urgestein Coppermine hat ein reges Forum, mit dessen Hilfe sich viele Fragen rasch klären lassen. Unter den kostenlosen Bilddatenbanken ist es aus meiner Sicht die interessanteste, zumal Gallery 3 nicht mehr gepflegt wird.

Seit 2009 gibt es das in Bremen entwickelte Pixtacy, ein ‚Shopsystem für Fotografen‘. Es basiert auf dem Content Management System (CMS) Virthos, das mir neben Pixtacy noch nie begegnet ist und wird von Martin Wandelt, einem mit den kaufmännischen Interessen der Fotografen bestens bewanderten Programmierer, betreut.

Pixtacy hat die üblichen Elemente von Bilddatenbanken. Es gibt eine Eingangsseite mit Login- und Suchfunktion gefolgt von einer Übersichtsseite in Form einer Liste oder mit Thumbnails und dazugehörigen Bezeichnungen. Dies sind übergeordnete Themen, anderswo Kategorien genannt, zu denen beliebig viele Alben gehören können. Sie werden ebenfalls als Thumbnails angezeigt und nach dem Öffnen eines Albums sieht man die darin befindlichen Bilder in der gleichen Form. Jedoch ist beim Mouse-over auf einem der kleinen Bildchen eine größere Darstellung zu sehen und nach einem Klick darauf erscheint eine Einzeldarstellung mit detaillierten Informationen und, falls eingerichtet, Lizenzierung-und Erwerbsmöglichkeiten, Leuchtkastenfunktion und mehr. Martin Wandelt hat das technisch gut gelöst und selbst eine ausgewachsene kommerzielle Abwicklung integriert, wie die Rechnungslegung und Dokumentation. Letzteres bietet keine Freeware.

Hier ist ein Link zu vielen Pixtacy Installationen, dort kann man diverse Designs ansehen.

Hat man lokal seine eigenen Bilder im Griff, also ordentlich beschriftet, strukturiert und benannt, ist der Aufbau eines Onlinearchivs relativ simpel. Man lädt eine Kopie seines gesamten Archivs mit all seinen Verzeichnissen und Unterordnern in ein Zielverzeichnis. Anschließend wird Pixtacy beauftragt, die Bilder zu importieren und Thumbnails nebst Previews mit oder ohne Wasserzeichen anzufertigen.

Das Einrichten der individuell gewünschten Verkaufsoptionen ist kniffliger, doch am Ende können die Bilder in verschiedenen Auflösungen gegen Honorar lizenziert werden oder als Abzüge bis hin zum Druck auf einem Kaffeepott bestellt werden. Die entsprechenden Dienstleister werden eingebunden und der gesamte Vorgang läuft anschließend automatisch ab.

Das klingt fast zu gut, um wahr zu sein, zumal die Free-Edition für maximal 250 Fotos kostenlos ist und die Lizenzgebühr für eine Professional-Edition faire 349 € kostet. Der Anbieter gewährt zu verschiedenen Anlässen Rabatte. Mit einem kostenpflichtigen Zusatzmodul ist Pixtacy sogar an Picturemaxx anzubinden, dem Recherche- und Bestelltool der Redakteure schlechthin.

Jedoch gibt es eine Achillesferse. Das Design von Pixtacy bewegt sich auf einem Niveau, das längst nicht mehr zeitgemäß ist. Der Benutzer kann durch Veränderungen an verschiedenen CSS- und anderen Dateien eigene Gestaltungsideen realisieren. Seltsamerweise liegen die relevanten Dateien nicht in einem individuell benennbaren Themeverzeichnis, sondern in mehreren Ordnern. Der Entwickler setzt einen hohen Kenntnisstand bezüglich der Webseitentechnologie voraus, um ansprechende individuelle Installationen einzurichten.

Eine seit langem vorherrschende Kritik an dem Projekt ist der Umstand, dass durch Updates mühsam erstellte Veränderungen außer Kraft gesetzt werden. Die Benutzer können sich nach einer gewissen Pause nicht mehr im einzelnen daran erinnern, wo und was sie geändert haben. Die betreffenden Dateien werden durch Updates überschrieben und es gibt kein benutzerfreundliches Verfahren, um dies zu verhindern.

Vor einigen Wochen wurde auf der Pixtacy-Website zum Betatest der in Kürze erscheinenden Version 4 aufgerufen. Die Teilnahme am Betatest ist kostenlos. Bislang ist die Resonanz mau. Abgesehen von einigen wenigen Stimmen, die begrüßen, dass sich endlich etwas tut, kommt nur aus einer Ecke konstruktive Kritik. Eventuell an diesem System Interessierte lassen die Chance verstreichen, Einfluss zu nehmen auf den Entwickler, der Hinweise und Vorschläge ernst nimmt, wenn sie von mehreren geäußert werden.

Die neue Version bietet endlich die Möglichkeit, Thumbnail- und Previewabmessungen flexibel einzustellen und sie adaptiv zu präsentieren. Doch die für ein eigenes Design relevanten Dateien befinden sich in drei verschiedenen Ordnern. Damit bleibt jedes Erscheinungsbild durch jedes Update gefährdet. Um dies zu vermeiden, gehören diese Dateien in einen einzigen Ordner, der vom Benutzer im Themeverzeichnis angelegt wird und einen Namen bekommt, den kein anderes Verzeichnis in der Pixtacyinstallation trägt. So kann er bei Updates nicht überschrieben werden.

Programmiertechnisch ist es sicherlich keine große Angelegenheit, die entsprechenden Pfade zu den CSS- und HTML-Dateien so zu bestimmen, dass diese Dateien in einem einzigen Ordner sind und nicht über die gesamte Installation verteilt. Dann gäbe es die Möglichkeit, Themes zu entwickeln, die leicht mit anderen zu teilen sind.

Wenn euch das Thema interessiert, beteiligt euch am Betatest und wirken wir gemeinsam darauf hin, dass das oben beschriebene Problem vernünftig gelöst wird.

Business, Internet-Funde, Rechtliches, Technik, Trends

Hilfe bei der Bildersuche. Oder: Bilderdiebe aufgepasst!

13. Mai 2008 Robert Kneschke 9 Kommentare

Wo bleibt mein Geld? In Zeiten von geringeren Umsätzen pro Bild im Bildermarkt, der von vielen durch mehr Bilder versucht wird auszugleichen, ist es schwer, einen Überblick zu behalten, wo Fotos von einem verwendet werden. Zum einen, um es den Models zu zeigen, zum anderen, um Referenzen zu bekommen.

Eine dritte Möglichkeit ist es, zu überprüfen, ob Fotos nicht sogar unrechtmäßig oder entgegen den Lizenzbestimmungen genutzt wurden. Einige Firmen wie Attributor oder Idée Inc. bieten deshalb den Service an, das Internet und Printmedien automatisiert nach Fotos (oder anderen Medieninhalten) zu durchsuchen. Selbst Beschnitt, Textzugabe, Spiegelung oder Farbveränderungen an Fotos wird dabei erkannt.

Bisher waren diese Services nur für große Industriekunden wie Nachrichtenagenturen verfügbar. Beide Firmen arbeiten jedoch an Systemen für Privatkunden oder Kleinunternehmen. Idée Inc. bietet nun den Service „TinEye“ in der Beta-Phase zum Testen an. Damit können eigene Fotos im Internet gesucht werden.

Ich habe mal einen Test mit ca. 40 meiner meistverkauften Fotos gemacht. Bei einem der Fotos habe ich auf einer ungarischen Webseite eine unerlaubte Nutzung gefunden. Vom Agenturfoto mit Wasserzeichen wurde der Beschnitt so gewählt, dass das Wasserzeichen nicht zu sehen ist.

Danach habe ich mal einen Test mit populären Microstock-Bestseller-Fotos gemacht (z.B. dem hier) und 58 Webseiten gefunden, die das Foto nutzen. Darunter auch Blogs, bei denen das istockphoto-Wasserzeichen noch zu sehen ist.

Angesichts dessen, dass bisher nur ein Bruchteil der Fotos im Internet vom Service erfasst werden, eine ganz gute Trefferquote, die es Fotografen in Zukunft hoffentlich ermöglicht, Bilderdieben leichter auf die Spur zu kommen.