Der Suchalgorithmus einer Bildagentur gehört zu den stärksten Betriebsgeheimnissen. Besonders pikant ist das, weil dieser Algorithmus wesentlich darüber entscheidet, ob man als Fotograf mit dieser Bildagentur viel Geld verdient oder nicht (YouTuber können da ein Lied von singen).
Weil dieser Suchalgorithmus so geheim ist, kann man nur Mutmaßungen darüber anstellen, welche Kriterien genau relevant sind, um bei einer Bildersuche weit oben zu erscheinen.
Manchmal geben die Entwickler jedoch selbst einen seltenen Einblick in ihre Arbeit. So kürzlich bei diesem sehr spannenden Artikel von Fengbin Chen, Machine Learning Engineer bei Adobe.
In diesem Artikel werden erstens einige beobachtete Verhaltensweisen von Bildkäufern aufgezählt. Dazu zählen zum Beispiel:
- Kunden scrollen selten in den Suchergebnissen und schauen selten mehr als die erste Seite der Suchergebnisse an
- Abo-Kunden benutzen häufig die gleichen Suchbegriffe, jedoch mit anderen geplanten Endnutzungen im Hinterkopf, weshalb die Topresulte nicht die gleichen bleiben sollten
- Kunden laden Bilder oft runter, um diese weiterzuverarbeiten, viele suchen nach Inspirationen durch Stock-Bilder, die sie für ihre finalen Projekte bearbeiten können
- Bilder auf der ersten Trefferposition haben mehr als zehn Mal zu viele Downloads wie Bilder auf der dreizehnten Trefferposition.
- Mehr als die Hälfte aller Downloads erzielen Bilder im oberen Drittel der Suchergebnisse
- Es gibt eine „Positionsbefangenheit“ (Position Bias), das heißt, Kunden kaufen lieber Bilder aus den oberen Suchergebnissen als aus den unteren, unabhängig von der Bildqualität und Relevanz.
- Ein Kunde lädt eher das 100. Bild (das letzte einer Seite) als das 95. Bild und wenn sie auf die zweite Seite gehen, eher eins aus den oberen Positionen der zweiten Seite als aus den unteren Positionen der ersten Seite.
Ebenfalls sehr spannend ist der seltene Einblick, wie das Adobe Stock Team auf die oben genannten Verhaltensweisen reagiert. Damit geben sie einen nützlichen Einblick in die Denkweise der „Hüter des Algorithmus“:
Das Team hat ein neues Ranking-Feature hinzugefügt mit dem Namen „unbiased DTR“. DTR steht für „Download-through-rate“. Die Idee dahinter ist, dass bisher die Anzahl der Verkäufe ins Verhältnis zu den Views bei den Suchergebnissen gesetzt wurde. Ein Bild, was genauso oft angezeigt wurde wie ein anderes, aber häufiger gekauft wurde, bekam in der Zukunft einen höheren Platz. Das berücksichtigte aber noch nicht den Fakt, dass die Kunden die oberen Bilder unabhängig von der Bildqualität bevorzugten, weshalb sich diese Topseller oben festsetzten und kaum von neueren, eventuell besseren Bildern ablösen ließen.
Beim „unbiased DTR“ wird das nun berücksichtigt, indem die Anzeigeposition mit einfließt in das Verhältnis. Zum Beispiel wird ein Bild auf dem Platz eins der Suchergebnisse als „ein View“ gezählt, während ein Bild auf der 30. Position nur als „ein Fünftel View“ gezählt wird, weil die Neigung, das erste Bild zu kaufen, fünf Mal höher ist als die, das 30. Bild zu kaufen.
Zusäzlich zu diesem Faktor spielen natürlich noch viele andere Faktoren wie Alter des Bildes, Suchbegriffe, Portfoliogröße und so weiter eine Rolle.
Als Ergebnis wird im Artikel dieses Vorher-Nachher-Beispiel gezeigt:

So sehr ich den Einblick in die Arbeitsweise des Such-Teams zu schätzen weiß, so sehr bin ich doch vom Ergebnis enttäuscht. Es wird behauptet, das Nachher-Ergebnis würde mehr Diversität und Variationen zeigen. Ich bin da einer anderen Meinung.
Wie seht ihr das?