Warum Nullverkäufe (mindestens) zwei Arten von

Blog

Warum Nullverkäufe (mindestens) zwei Arten von

Bei der Absatzprognose im Einzelhandel erfordern Null-Umsätze besondere Aufmerksamkeit beim Training und der Anwendung von Nachfragemodellen. Es ist schwierig , im Nachhinein festzustellen, ob bei einem Ereignis, bei dem keine Verkäufe erzielt wurden, tatsächlich eine verschwindende Nachfrage an einem bestimmten Tag vorlag (im Sinne von „niemand hat dieses Produkt aus dem Regal genommen“), oder ob das vorhergesagte Produkt einfach nicht verfügbar war (im Sinne von „das Produkt wurde gar nicht erst ins Regal gestellt“). Zum Glück lässt sich die Übereinstimmung der Daten mit dem Vorhersagemodell überprüfen, indem man die vorhergesagte Wahrscheinlichkeit, einen Wert von Null zu beobachten, mit der beobachteten Häufigkeit von Null-Verkaufsereignissen vergleicht. Wenn diese nicht gut übereinstimmen, d. h. wenn man Nullverkäufe viel häufiger oder viel seltener beobachtet als vorhergesagt, hat man ein größeres, aber klar definiertes Datenproblem diagnostiziert.

Existiert die Null, und wenn ja, auf wie viele Arten?

Die Zahl „Null“ entzieht sich erstaunlich lange der menschlichen Abstraktionsfähigkeit. Verschiedene antike Kulturen behandelten die „Abwesenheit von irgendetwas“ auf unterschiedliche Weise, und Wissenschaftshistoriker diskutieren noch immer darüber, wann und wie die Null als Symbol erfunden wurde und Teil des mathematischen Mainstreams wurde. Zum Beispiel enthalten die römischen Zahlen nicht einmal ein Symbol für Null, wahrscheinlich weil die Römer Zahlen für die Buchhaltung und nicht für die Arithmetik verwendeten. Aristoteles lehnte sogar die Idee ab, dass Null eine Zahl sei – wenn man nicht durch sie teilen kann, wozu ist sie dann gut? Im siebten Jahrhundert n. Chr. begann der indische Mathematiker und Astronom Brahmagupta, eine geschriebene Null zu verwenden und zu analysieren, die dann ihren Weg ins Chinesische und Arabische und über letzteres in die europäische Kultur fand.

Natürlich kennen Sie die Null und fühlen sich wohl damit, sie zu verwenden. Spulen wir also einige Jahrhunderte mathematischer Diskussionen vor zur Vorhersage der Einzelhandelsnachfrage mithilfe von künstlicher Intelligenz (KI) und maschinellem Lernen (ML). Ich behaupte hier, dass eine Art von Null nicht ausreicht. Für eine korrekte Beschreibung der Umsätze im Einzelhandel sind mindestens zwei unterschiedliche Nullkonzepte erforderlich. Einer der beiden Datensätze muss im Trainingsdatensatz beibehalten, der andere muss entfernt werden.

Einerseits kann ein Produkt verfügbar sein und der Öffentlichkeit angeboten werden: Das Geschäft ist geöffnet, die Kasse und alles andere funktioniert – aber einfach kein Kunde will es kaufen! In diesem Fall spiegelt das Ereignis „Null Verkäufe“ den tatsächlichen Mangel an Nachfrage und das fehlende Interesse der Verbraucher an diesem Produkt wider. Idealerweise wird unser Nachfrageprognosemodell von dieser Null nicht „überrascht“, da es eine nicht mikroskopische, sondern eine endliche Wahrscheinlichkeit für das Auftreten einer Null vorhergesagt hat.

Ein echter Nachfragemangel führt zu einer Nachfrage-Null, die ich von einer Verfügbarkeit-Null unterscheiden möchte. Diese letztgenannte Art von Null wird schlichtweg durch die Nichtverfügbarkeit des Produkts hervorgerufen. Dem Kunden wird das Produkt gar nicht erst angeboten, er hat keine Möglichkeit, es zu kaufen, selbst wenn er es wollte (wir werden es nie erfahren). Ich habe gestern kein iPhone für 99 Dollar verkauft – aber das ist eine nebensächliche Aussage, denn ich habe ja gar niemandem ein iPhone angeboten. Hätte ich es angeboten, hätte meine moderate Preisvorstellung eine beträchtliche Nachfrage ausgelöst und wahrscheinlich einen Käufer gefunden. Ich habe auch den gebrauchten Kinderwagen, den ich online angeboten habe, nicht verkauft – das ist aussagekräftiger, es gibt einfach keine Nachfrage. Während die Nachfrage-Nullstelle darauf hinweist, dass der Artikel nicht besonders beliebt ist (um es gelinde auszudrücken), hat die Nichtverfügbarkeit-Nullstelle nichts mit der tatsächlichen Nachfrage nach einem Artikel zu tun.

Nichtverfügbarkeit kann viele verschiedene Ursachen haben: Am wichtigsten ist, dass die Lagerbestände erschöpft sein können – dann gibt es schlichtweg nichts mehr zu verkaufen. Deshalb ist es großartig, die morgendlichen Aktienkurse in einer übersichtlichen Spalte unserer Daten zu haben. Dann können wir auf die in diesem Blogbeitrag beschriebenen Methoden zurückgreifen. Oftmals entspricht diese Datenqualität jedoch nicht dem Ideal: Aktieninformationen sind nicht verfügbar oder zumindest nicht gänzlich vertrauenswürdig. Aber selbst wenn verlässliche Lagerbestände erfasst würden, könnten wir nicht mit absoluter Sicherheit sagen, ob das Produkt tatsächlich im Regal steht – es könnte im Lager aufbewahrt werden, oder der Filialleiter könnte entschieden haben, dass es zu früh oder zu spät im Jahr ist, es anzubieten.

Nichtverfügbarkeit verschleiert die tatsächliche Nachfrage: Um die Nachfrage nach einem Artikel zu erfahren, müssen wir ihn anbieten. Ich habe keine Ahnung, wie groß die Nachfrage nach einem grünen Regenmantel mit rosa Sprenkeln sein wird, es sei denn, ich stelle ihn ins Regal, versehen ihn mit einem Preisschild und biete ihn den Kunden an. Wenn ein Produkt nicht angeboten wird, kann ich nur Vermutungen über die Nachfrage anstellen, sie aber nicht messen.

Zusammenfassend lässt sich sagen, dass meine Konzepte von Null folgende sind: Die wohlerzogene Nachfrage-Null vermittelt ehrlich die (vielleicht irreführende) Information, dass das Produkt im Regal einfach nicht sehr beliebt ist (übrigens: Braucht jemand da draußen einen gebrauchten Kinderwagen?). und die Verfügbarkeits-Null -Wahrscheinlichkeit, die alle möglichen Informationen über die tatsächliche Nachfrage ausblendet – diese Nachfrage hätte null, eins, 14 oder 2.766 betragen können. Es ist klar, dass man die Nachfrage-Nullstellen in das Modelltraining einbeziehen muss, aber man würde enorm darunter leiden, eine Verfügbarkeits-Nullstelle mit einem Mangel an Nachfrage zu verwechseln.

Einen klaren Weg für Ihre Lieferkette aufzeigen

Globale Trends und Brancheneinblicke, monatlich geliefert mit dem Supply Chain Compass Newsletter. 

Wie wahrscheinlich ist ein Absatz aufgrund fehlender Nachfrage überhaupt?

Im Einzelhandel haben wir es oft mit der Poisson-Verteilung zu tun (lesen Sie mehr darüber in den Blogbeiträgen "Forecasting few is different" Teil 1 und Teil 2). Bei einem Poisson-Prozess nimmt die Wahrscheinlichkeit, 0 zu beobachten, mit zunehmender mittlerer Rate exponentiell ab. Das heißt, bei einer Poisson-Vorhersage mit einer mittleren Rate von 1 (d. h. wir erwarten, im Durchschnitt ein Stück zu verkaufen) erwarten wir, in etwa 37 % der Fälle Null zu beobachten – dies ist daher durchaus wahrscheinlich und überhaupt nicht überraschend. Bei einer Rate von 4 beträgt diese Wahrscheinlichkeit 2 % – wir gehen davon aus, dass dies etwa alle sieben Wochen passiert. Bei einer Rate von 10 sinkt diese Wahrscheinlichkeit auf 0,005 %, bei einer Vorhersage von 20 sprechen wir von extrem seltenen Ereignissen, die uns sehr überraschen würden, wenn sie einträten. Die Poisson-Vorhersage ist zugegebenermaßen eine Idealisierung: Eine realistische Nachfrageprognose wird insofern „breiter“ ausfallen, als dass Umsatzwerte, die weit vom Mittelwert entfernt sind, in der Praxis wahrscheinlicher sind, als sie von der Poisson-Verteilung vorhergesagt wurden. Das heißt, wir erwarten mehr Nullverkäufe, als die obigen Zahlen vermuten lassen.

Wenn wir nur die meistverkauften Produkte berücksichtigen, die etwa 20 Mal oder öfter pro Tag gekauft werden, kann jede auftretende Null getrost als Verfügbarkeits-Null interpretiert werden. Betrachten Sie folgendes Muster der im Zeitverlauf verkauften Einheiten:

why-zero-sales-come-in-at-least-two-kinds-body-01

 

Offensichtlich geschieht in jener Woche Mitte Januar etwas Außergewöhnliches, wenn an drei aufeinanderfolgenden Tagen keine Verkäufe stattfinden. Es ist unwahrscheinlich, dass die tatsächliche Nachfrage drei Tage lang so stark eingebrochen ist, um dann wieder auf das Ausgangsniveau zurückzukehren. Offensichtlich haben wir Verfügbarkeits-Nullwerte, die aus dem Training entfernt werden sollten.

Wenn die Gesamtverkaufsraten jedoch nicht so hoch sind, ist es nicht einfach zu entscheiden, ob eine gegebene Null eine Nachfrage-Null oder eine Verfügbarkeits-Null ist:

why-zero-sales-come-in-at-least-two-kinds-body-02

Hier ist es viel schwieriger zu beurteilen, ob ein Ereignis ohne Verkäufe auf eine fehlende Nachfrage oder auf ein fehlendes Angebot zurückzuführen ist. Welche dieser Nullen sollten im Training beibehalten werden, welche sollten entfernt werden? Diese Frage ist entscheidend für ein unvoreingenommenes Training: Die durchschnittlichen Umsätze, ob mit oder ohne Nullwerte, unterscheiden sich erheblich.

Das Beispiel mit den geringen Umsätzen verdeutlicht die Notwendigkeit, Zuordnungs- oder Angebotsinformationen aufzunehmen, die uns im Voraus sagen, ob an einem bestimmten Tag überhaupt mit Umsätzen zu rechnen ist. Wenn das Produkt nicht verfügbar war, handelte es sich bei dem wenig überraschenden und nichtssagenden Ereignis von Nullverkäufen um eine Verfügbarkeits-Null. Als das Produkt verfügbar war, bedeutete das Ereignis „Null Verkäufe“ eine Nachfrage-Null, was eine geringe Nachfrage widerspiegelte.

Bewertung der Konsistenz anhand der vorhergesagten Nullzählwahrscheinlichkeit

Nehmen wir an, wir verfügen über integrierte Daten, einschließlich Angebots- und Verfügbarkeitsinformationen. Wir haben ein Modell anhand der beobachteten Nachfrage trainiert (einschließlich Nachfrage-Nullstellen, aber ohne Verfügbarkeits-Nullstellen) und Vorhersagen generiert. Wie können wir herausfinden, ob die Informationen über die Art der Nullen korrekt sind? Bei einem gegebenen Verkaufsereignis eines sich langsam drehenden Produkts (das sich wie im zweiten Zeitreihendiagramm verhält) ist es unmöglich, im Nachhinein festzustellen, ob es sich bei einer Null um eine Verfügbarkeitsnull oder eine Nachfragenull handelt. Wir können jedoch eine Beurteilung anhand einer Reihe von Vorhersagen und entsprechenden Beobachtungen vornehmen: Wir können die beobachtete Häufigkeit von vermeintlichen Nachfrage-Nullstellen mit der vorhergesagten Häufigkeit vergleichen. Zu diesem Zweck tragen wir die erwartete Nullrate gegen die Vorhersage auf (die eine exponentiell abnehmende Kurve darstellt):

why-zero-sales-come-in-at-least-two-kinds-body-03

Beachten Sie die logarithmische x-Achse, die sich über vier Größenordnungen von 0,01 bis 100 erstreckt.

Nun gruppieren wir alle Vorhersagen und Ergebnisse in Gruppen, die durch die Vorhersage charakterisiert sind, z. B. alle Vorhersagen zwischen 0,8 und 1,2, alle zwischen 1,2 und 1,5 usw. Fragen Sie sich, warum wir nach Vorhersage und nicht nach Ergebnis gruppieren? Die Antwort ist im Blogbeitrag „Du hättest es nicht immer besser wissen sollen“ versteckt. Für jeden dieser Buckets tragen wir den beobachteten Anteil an Nullen als Kreis in das Diagramm ein, wobei die Größe des Kreises der Anzahl der Beobachtungen entspricht. Wir haben dies hier für drei verschiedene Sätze von Vorhersagen und Ergebnissen durchgeführt, die sich in der Datenqualität unterscheiden:

why-zero-sales-come-in-at-least-two-kinds-body-04

Schauen Sie sich zuerst die roten Kreise an. Bei jedem Vorhersage-Bucket stimmt die Anzahl der beobachteten Nullen in den Daten sehr gut mit dem vorhergesagten Anteil der Nachfrage-Nullen überein. In diesem Fall sind die Daten sauber (zumindest was die Nullen betrifft): Verfügbarkeitsnullen wurden ordnungsgemäß entfernt, wir können im Durchschnitt davon ausgehen, dass es sich bei den Nullen in den Daten tatsächlich um Nachfragenullen handelt. Wir werden nie wissen, ob es sich bei den auftretenden Nullen tatsächlich um Nachfrage-Nullstellen handelt, aber es gibt keine Anhaltspunkte, die diese Annahme in Frage stellen.

Schauen wir uns nun den grünen Datensatz an: Der Anteil der Nullen ist immer zu groß. Dies deutet auf ein systematisches Problem in den Daten hin: Wenn das Modell 30 vorhersagt, erwartet man keine Nullen, beobachtet aber 30 % Nullen in den Daten. Selbst wenn diese Vorhersage von 30 sehr daneben und verzerrt wäre, würden wir niemals so viele Nullen erwarten. Daher wurden zahlreiche Verfügbarkeitsnullstellen fälschlicherweise als echte Nachfragenullstellen behandelt. Das „Plateau“, bei dem die Kreise zusammenlaufen, deutet darauf hin, dass ein konstanter Anteil an Verfügbarkeitsnullstellen die Daten verunreinigt. Man sollte die Daten überprüfen und Angebotsinformationen hinzufügen, um sicherzustellen, dass nur angebotene Produkte in den Verkaufsdaten enthalten sind. In den einzelnen Zeitreihen der Produkte erwarten wir Artefakte wie das in der obigen Abbildung.

Der orangefarbene Datensatz ist ein Beispiel für die gegenteilige Art von Fehler: Bei sehr kleinen Vorhersagen, wie z. B. 0,1, erwarten wir viele Nullen in den Daten, beobachten aber viel weniger. Offenbar wurden einige Nachfrage-Nullwerte fälschlicherweise als Verfügbarkeits-Nullwerte interpretiert und aus dem Datensatz entfernt. Auch hier kann die genaue Untersuchung einzelner Produkte helfen, die Ursache für dieses Verhalten zu ermitteln.

Kurz gesagt, ein Bild wie bei den roten Daten hilft uns, den Daten zu vertrauen, während die grünen und orangen Formen es uns ermöglichen, Fehlbehandlungen von Nachfrage- und Verfügbarkeitsnullstellen schnell zu erkennen. Nach unserer Erfahrung bewegen sich viele andere KPIs, wie zum Beispiel die Verzerrung, in den Bereich akzeptabler Werte, sobald die Probleme mit Nullwerten behoben sind.

Formulieren Sie Ihre Erwartung quantifizierbar und explizit und vergleichen Sie sie mit den Beobachtungen.

Wir haben hier keine Raketenwissenschaft betrieben, tut mir leid, falls ich falsche Erwartungen geweckt habe! Wir haben unserem Modell lediglich eine einfache Frage gestellt („Wie oft erwarten Sie im Durchschnitt ein Ergebnis von Null bei dieser Vorhersage?“) und die empirische Beobachtung mit der theoretischen Antwort verglichen. Eine Verzerrung im Modell ist häufig auf eine unsachgemäße Behandlung von Null-Umsatz-Ereignissen zurückzuführen. Die Überprüfung des Zustands der Nullen mithilfe eines Diagramms wie dem hier gezeigten sollte ein Standardschritt bei der Diagnose von Datenproblemen in Bedarfsplanungsprojekten sein.

Tatsächlich wird die Zahl Null in ML-Anwendungen immer noch oft falsch behandelt. Das Fehlen von Beweisen (eine Verfügbarkeits-Nullstelle) sollte daher nicht als Beweis für die Abwesenheit (eine Nachfrage-Nullstelle) interpretiert werden. Diese explizite Unterscheidung hilft uns, auf fundierter Grundlage zu entscheiden, welche Datenpunkte in das Modelltraining einbezogen und welche entfernt werden sollten.