Warum sind die Amazon-Empfehlungen eigentlich so schlecht?
Über die Blüten, die die Amazon-Empfehlungen manchmal hervor bringen, lästere ich ja gerne mal. Als mir die Tage mal wieder ein paar besonders absurde Empfehlungen unterkamen, fiel mir ein Tweet ein:
Amazon is a $250 billion dollar company that reacts to you buying a vacuum by going THIS GUY LOVES BUYING VACUUMS HERE ARE SOME MORE VACUUMS
— Daniel Kibblesmith (@kibblesmith) April 26, 2016
Ja, warum ist eigentlich ein Unternehmen von der Größe von Amazon nicht in der Lage, solche Absurditäten zu vermeiden? Eine mögliche Antwort findet sich auch schon in den Kommentaren zu dem o.g. Tweet: Der Empfehlungs-Algorithmus wurde ursprünglich für Bücher entwickelt und da kauft man natürlich eher noch mehr ähnliche Bücher.
Mittlerweile aber, das sollte man bei Amazon doch auch gemerkt haben, gibt es bei Amazon aber so ziemlich alles zu kaufen, was man überhaupt käuflich erwerben kann. Und damit funktioniert der Algorithmus eben gefühlt immer schlechter, weil man zunehmend auch andere Dinge als Bücher kauft.
Soweit, so logisch. Aber warum tut Amazon nichts dagegen? Der einst als gutes Vorbild gepriesene Algorithmus gerät immer mehr zur Lachnummer. Und hier geht es doch um das Kerngeschäft von Amazon, das Verkaufen von Waren. Da sollte man doch meinen, dass die Korrektur eine hohe Priorität hätte. Hat sie aber, für mich unverständlicherweise, offenbar nicht.
Was müsste der Algorithmus denn überhaupt besser machen? Zunächst einmal, um auf die Staubsauger auf dem Tweet zurück zu kommen, müsste er wissen, dass man bestimmte Warengruppen eher selten kauft: Waschmaschinen, Fernseher, Computer, usw. Zweitens fehlt oft der Zusammenhang zwischen Warengruppen. Da werden einem etwa Nachfüllpatronen für einen bestimmten Tintenstrahldrucker empfohlen, obwohl man überhaupt nie einen bei Amazon gekauft hat. Oder wenn ich mir die Komplett-Box einer Serie wie Deep Space Nine gekauft habe, dann bin ich sicher nicht mehr an den Boxen für die einzelnen Staffeln interessiert. Und natürlich gibt es Waren, die geschlechtsspezifisch sind (siehe mein Beispiel von oben). Gerade da ließen sich viele Peinlichkeiten leicht vermeiden, sollte man meinen.
Eigentlich sollte es für Amazon nicht unmöglich sein, diese und noch viele andere Zusammenhänge zu erkennen - sie haben die Daten doch alle! Man müsste aus den Daten doch lernen können, dass Staubsauger seltener gekauft werden als Bücher. Sogar die durchschnittliche Lebensdauer eines Geräts müsste man so ermitteln können. Und wenn dann heraus kommt, dass ein Staubsauger im Schnitt 3 Jahre (willkürlich gewählte Zahl) hält, dann kann man ja nach 2,5 Jahren anfangen, wieder einen zu empfehlen. Vielleicht zeigt das Gerät dann schon erste Anzeichen von Schwäche und man ist eher geneigt, der Empfehlung auch zu folgen.
So gesehen ist Amazon eigentlich eine klassische Big Data-Anwendung. Schade (und unverständlich) nur, dass Amazon nicht schon längst etwas mit diesen Daten tut. Es wäre ja schließlich im eigenen Interesse - und mal ein Fall von "Vorratsdatenspeicherung" mit dem ich weniger Bauchschmerzen habe ...