In der letzten Woche hat der Rechner für uns Ähnlichkeiten von Zeitreihen automatisch beurteilt. Heute definieren wir einen Indikator, mit dem wir Unterschiede analysieren, z.B. zwischen Gruppen. Eine Gruppe könnte z.B. anhand demografischer Merkmale beschrieben sein.
Als Indikatoren kommen hierfür nicht nur metrisch-skalierte Variablen wie z.B. monetäre Größen (Umsatz, Deckungsbeitrag, Kosten), Mengen, Volumina oder Gewichte in Frage sondern auch Einschätzungen und Wertungen, die z.B. aus einer Kundenbefragung gewonnen werden. Die Zufriedenheit mit einem Produkt wird z.B. mit Noten auf einer Skala von 1 (sehr zufrieden) bis 6 (völlig unzufrieden) bewertet. Jeder der Kunden lässt sich mit einem ganzen Bündel an Eigenschaften beschreiben: Alter, Einkommen, Beruf, Geschlecht, Wohnort usw.
Nun könnte uns interessieren, ob die Zufriedenheit der Kunden etwas mit deren Eigenschaften zu tun hat. Anstatt wie üblich Hypothesen zu bilden und sie einzeln mithilfe statistischer Methoden auf ihre Überzeugungskraft zu überprüfen, machen wir uns den Vorteil einfacher Rangfolgen zunutze. Die Frage selbst packen wir in einen unserer schlauen Indikatoren.
Nehmen wir an, dass die mittlere Kundenzufriedenheit über alle Befragten den Notenschnitt 2,3 hat. Die Kunden aus ländlichen Regionen geben jedoch im Schnitt eine 1,3 während die Kunden aus Großstädten eine 3,4 geben. Eine solche Bewertung für weitere Kundenmerkmale und insbesondere auch Merkmalskombinationen (z.B. „Großstadt & mittleres Einkommen“) lässt auf zahlreiche interessante Unterschiede hoffen, die es zu finden gilt.
Rechnerisch müssen wir für jede denkbare Kombination von Kundeneigenschaften den Abstand von der mittleren Kundenzufriedenheit berechnen. Dies ist eine mehrdimensionale Aufgabe, die sich in einer OLAP-Datenbank sehr leicht mit einer berechneten Kennzahl („Abweichung vom Mittelwert“) lösen lässt. Da wir den Abstand vom Mittelwert als Kennzahl definiert haben, können wir mit einfachen Rangfolgen herausfinden, wer mit dem Produkt überdurchschnittlich zufrieden ist und wer unterdurchschnittlich zufrieden ist.
Mit Verfahren wie dem multidimensionalen Ranking können wir diese Frage über alle Eigenschaften der Befragten gleichzeitig stellen und sogar auffällige Merkmalskombinationen automatisch herausfiltern.
Das Faszinierende dabei: Das Ergebnis bleibt gut verständlich, da es gelungen ist, die Komplexität der Frage in den Indikator zu packen und nicht ins (statistische) Verfahren.