Big Data, big Spock, bigger Kirk!

Heute geht es weiter mit Fallbeispielen dafür, wie man den Schwung von Big Data mitnimmt, um Unternehmen datengetriebener zu machen. Wir wissen schon: Die Betriebswirte sollen die Informatik führen, wenn es um Big Data geht. Oder wie Trekkies sagen würden: Es braucht nicht nur Spock, sondern auch besonders viel Kirk, damit aus Big Data kein Flop wird.

Mein Sohn (17) bestand den Raumschiff-Enterprise-Test gerade so. Er hatte von Kirk und Spock gehört, würde Spock wohl wiedererkennen – das war’s. Bei Nerds älteren Semesters scheint das anders zu sein. Jedenfalls kam die Enterprise auf einer Podiumsdiskussion über Big Data zu einiger Ehre. Mehrfach stand der Vulkanier Spock Pate für den kühlen, logischen Verstand automatisierter, maschineller Analysen. Sehr gut!

Source: Welt am Sonntag from 03.03.2013, p. 52.
Die WAMS findet: „Auch wenn Big Data zu nichts führt, kann es gut aussehen.“ Hilft oder schadet am Ende solch ein Frohsinn? Wir wissen es (noch) nicht. Quelle: WAMS vom 03.03.2013, S. 52.

Captain Kirk wiederum stand für die menschliche Erfahrung, mit der erst Analysen zu Entscheidungen werden. Großartig! Wenn das keine Metapher für die grundsolide Ansicht ist, dass es Aufgabe des Controllings ist, die Daten zu bändigen, in Form zu gießen und das, was die Daten hergeben, prägnant zu visualisieren. Der Manager bringt dann assoziativ Erfahrungswissen ein und den Willen, Zukunft nicht zu prognostizieren, sondern zu gestalten, und entscheidet. Immerhin der Technikchef von Amazon sah das in der Podiumsdiskussion anders, nahm den Phaser und erschoss kurzerhand Captain Kirk. Jeff Bezos sei Spock, Kirk brauche man nicht, sagte er. Oha.

Vielleicht lässt sich der Konflikt lösen, indem wir in der Reihe der Fallbeispiele fortfahren:

Fallbeispiel 3: Wie die Schüchternheit von Datenanalyseexperten und Technikgläubigkeit von Anwendern zu halbgaren Modellen führen können, aus denen dann Investitionsruinen werden
Jetzt menschelt es: An Datenanalyseprojekten sind meist mehrere Abteilungen und externe Experten beteiligt. Irgendjemand ist immer dagegen und sorgt für Sportlichkeit: Der Experte bekommt erst einmal lieblos zusammengestellte Daten und soll beweisen, was er kann. Das tut er und bekommt tatsächlich etwas heraus, aber das Modell ist so schräg wie die Testdaten. Es kommt zur Präsentation: Das Management hat es wie immer eilig. Die IT hält sich ohnehin zurück, soweit es um den Inhalt geht. Die Fachabteilung hat jemanden entsendet, der für das Projekt ist, aber das Budget nicht erweitern kann. Der Experte steckt in der Klemme: Eigentlich braucht er mehr und bessere Daten, das bedeutet aber mehr Aufwand, wie soll er das einfordern? Jetzt muss der Experte entweder selbst Betriebswirt genug sein, um die Geschäftsleitung in ihrer Sprache zu erreichen oder jemanden dabei haben, der das kann. Der wiederum muss das Problem des Experten verstehen, das dieser wahrscheinlich viel zu mathematisch ausdrücken wird. Die Wahrscheinlichkeit ist groß, dass der Experte glaubt, die Modellmängel ließen sich später noch korrigieren und zu allem nickt. Das Rezept dagegen ist einfach: Manager verstehen jedes Data-Mining-Modell, wenn es vernünftig erklärt wird (wir werden das im nächsten Posting anhand des Amazon-Algorithmus belegen). Eine solche Erklärung sollten sie einfordern. In einem eigenen Projekt für einen Anbieter von Netzwerktechnik mussten wir im Auswahlprozess gegen unser eigenes Testmodell argumentieren. Das Modell konnte mit 80 % Genauigkeit für Geschäftskunden vorhersagen, ob der Umsatz mit dem Sortiment im Folgejahr größer oder kleiner als im abgelaufenen Jahr sein würde. Es konnte mangels Daten aber keine Reihung der Kunden ermitteln. Aus unserer Sicht war das aber die Kernfrage, schließlich ging es darum, welche Kunden in der knappen Arbeitszeit am besten anzusprechen wären. Dafür brauchten wir zusätzliche Daten zu den Vertriebsaktivitäten. In unserem Fall bekamen wir sie und das Modell wurde produktiv, selbstverständlich ist das nicht. Als Nachfrager sollten Sie von großer Schüchternheit technisch orientierter Experten ausgehen. Mit Big Data steigt die Anzahl der Beteiligten und mit ihr das Problem dramatisch, weil zur Schüchternheit noch Politik anderer Beteiligter hinzukommt.

Fallbeispiel 4: Wenn man an das „Ende der Theorien“ glaubt, steht man in der Praxis am Anfang vom Ende
Chris Anderson, ehemals Chefredakteur der niemals um kesse Sprüche verlegenen Wired, hat das „Ende der Theorien“ ausgerufen. Er interpretiert Big Data, wie man seinerzeit Data Mining interpretierte, nämlich hypothesenfrei. Jedoch, Hypothesen‑ und damit Theoriefreiheit gibt es nicht. Jedes Datenanalyseverfahren kann nur eine Sorte Muster finden. Eine Clusteranalyse findet Gruppen, Entscheidungsbäume finden Wenn-Dann-Beziehungen usw. Damit steckt die Hypothese schon im Verfahren. Das ist aber eher für Wissenschaftstheoretiker wichtig. Wichtiger ist die Frage, wie hypothesenfrei man sein sollte. Man kann Rechenanforderungen beliebig in die Höhe treiben, indem man Vollständigkeit postuliert, was die Big-Data-Version von Theoriefreiheit ist. Wenn etwa ein Versandhändler herausfinden will, welche Merkmale seiner Produkte und Kunden auf häufigere Retouren schließen lassen, dann kann er das theoriefrei tun, indem er alle Variablenkombinationen durchrechnen lässt. Im Controlling vermeiden wir solche Unbekümmertheit. Controller haben keine Supercomputer. Deswegen haben alle unsere Data-Mining-Verfahren eine „Rechenzeitbremse“: Variablen, die nicht relevant sind, schließt man einfach von der Analyse aus. Der Versandhändler Otto berichtete auf einer Konferenz von seinen Retourenanalysen und bestätigte, dass man explizit mit Thesen, also nicht theoriefrei, und nur einigen davon startete. Dass mehr hier nicht mehr sein kann, leuchtet noch mehr ein, wenn man sich die möglichen Handlungsoptionen vor Augen führt. Retouren sind ärgerlich, aber wäre es eine erfolgversprechende Strategie im Versandhandel, Kunden abzuweisen, weil die Maschine eine überdurchschnittliche Retourenwahrscheinlichkeit errechnet hat? Sicher nicht. Schon eher wird man Regeln suchen, die auch dem Kunden einleuchten. Wenn man versucht, bei Otto das gleiche Hemd in 5 Größen zu bestellen, erscheint ein Popup und redet einem ins ökologische Gewissen.

Ein Popup fürs ökologische Gewissen. Quelle: otto.de.
Anklicken zum Vergrößern.

Fallbeispiel 5: Auf Facebook wird mehr Geld mit Machen als durch Analysieren verdient
Ich bin Fan einer starken Verzahnung von strukturierten und unstrukturierten Daten. Facebook steht in der Big-Data-Diskussion beinahe synonym für unstrukturierte Daten und das schadet nicht. Auffällig ist jedoch, dass selten über einige systematische Mängel eines solchen Datenpools nachgedacht wird. Die Güte von Datenauswertung hängt sehr an der Repräsentativität. Die ist in sozialen Netzwerken per se nicht gegeben. Selbst wenn 1.000 Ihrer Kunden sich lauthals auf Facebook über Ihre Produkte beschweren, sagt das wenig darüber aus, was die anderen 99.000 Ihrer Kunden denken. Eine gezielte Umfrage unter nicht einmal hundert halbwegs repräsentativ ausgewählten Kunden wird einen schneller an die Wahrheit bringen. Hinzu kommt, dass Anbieter sich Meinungen und ihre Verbreitung im großen Stil kaufen. Was auf Facebook und anderswo passiert, ist längst nicht mehr ein unschuldiges Datenbild sozialer Phänomene, sondern Schauplatz von Kämpfen um diese Phänomene.

Freitag, 15. Februar 2013

Big Data Data Mining Datenanalyse

Kommentare Antworten abbrechen

Sie müssten eingeloggt sein um Kommentare zu posten..

Über den Autor

Dr. Nicolas Bissantz

Gründer und geschäftsführender Gesellschafter der Bissantz & Company GmbH, KI-Pionier, Forschungsunternehmer.

Veranstaltungs-Tipp

Webinar 30. April 2025 Erfolgreiche Business-Intelligence-Projekte: vom ersten Schritt bis zur Ziellinie

In diesem Webinar zeigen wir, wie wir von Bissantz in unseren Projekten arbeiten, worauf es ankommt – und was Unternehmen davon haben.

Anmeldung

In diesem Webinar zeigen wir, wie wir von Bissantz in unseren Projekten arbeiten, worauf es ankommt – und was Unternehmen davon haben.

Webinar 7. Mai 2025 Exzellent planen ohne Excel – ein Erfahrungsbericht von Severin

Geschwindigkeit in der Umsetzung: Das war das zentrale Kriterium für Severin bei der Modernisierung der Planung – und ausschlaggebend für die Entscheidung für Bissantz.

Anmeldung

Geschwindigkeit in der Umsetzung: Das war das zentrale Kriterium für Severin bei der Modernisierung der Planung – und ausschlaggebend für die Entscheidung für Bissantz.

Webinar 21. Mai 2025 Bissantz Spotlight – Neues aus der Produktwelt von Bissantz

In dieser Webinar-Reihe rücken wir Innovationen rund um DeltaMaster, DeltaApp und Power BI ins Rampenlicht und zeigen, was wir zu Themen wie Künstliche Intelligenz, Cloud und Planung für Sie vorbereitet [...]

Anmeldung

Letzte Blogartikel

Bissantz News Bissantz zu Gast im Atvisio-Podcast: BI-Experten im Dialog

Peter Bluhm und Dr. Nicolas Bissantz sind Experten in der Welt von Business Intelligence und Data Analytics. In der aktuellen Ausgabe des Performance [...]

mehr erfahren

Bissantz News Bissantz ist Preisträger der UX Design Awards 2023

„Wir können Daten nicht verstehen, wenn wir sie nicht richtig gestalten.“ Mit diesem Credo traf die DeltaApp von Bissantz im Rahmen des [...]

mehr erfahren

Bissantz News BI-Experten im Gespräch – Interview im Performance Manager Podcast

Peter Bluhm und Dr. Nicolas Bissantz sind Gründer und Geschäftsführer zweier seit Jahrzehnten am Markt führenden Software- und Beratungsunternehmen [...]

mehr erfahren

Bissantz News „Mit Künstlicher Intelligenz zur unternehmensweiten KPI-Landschaft“ – Artikel in der REthinking Finance

Eine Modernisierung der Führungsinstrumente im Finanzbereich kann das ganze Unternehmen durchdringen – auch ohne große IT- oder Beratungsprojekte [...]

mehr erfahren

Bissantz News Wissenschaft als Erfolgsfaktor

Auf der 17. Internationalen Konferenz Wirtschaftsinformatik (WI22) war Dr. Nicolas Bissantz in einer Diskussionsrunde zu sehen und zu hören [...]

mehr erfahren

Forschung Kaltmieten in Deutschland

Kaltmieten bzw. Mieten im Allgemeinen sind in den letzten Jahren stetig gestiegen und stellen für viele Mieter den größten Posten der monatlichen [...]

mehr erfahren

Data Warehousing Unternehmensplanung und -konsolidierung auf Basis der Bissantz ERP Solutions

Dieser Beitrag erläutert, wie sich Prozesse der integrierten Unternehmensplanung und der Unternehmenskonsolidierung strukturiert gestalten [...]

mehr erfahren

Forschung Achsenelemente als Filter an Zielbericht zuweisen

Achsenelemente können mit dem neuesten Release von DeltaMaster in ihrer Gesamtheit als Filter an einen Zielbericht zugewiesen werden. Wir erklären [...]

mehr erfahren

Forschung Leistungsausgaben der gesetzlichen Krankenversicherung

Die Leistungsausgaben der gesetzlichen Krankenkassen steigen von Jahr zu Jahr. Als Folge haben im Januar 2025 etliche Krankenkassen erneut die [...]

mehr erfahren

Data Warehousing Partitionierung von Bewegungsdaten

Die Aktualisierung von Bewegungsdaten nimmt während der täglichen Aufbereitung einer SQL-Datenbank in der Regel den Großteil der benötigten [...]

mehr erfahren

Vorheriger Artikel

Big Data, Big Impact?

Nächster Artikel

Mythos Amazon

Big Data, big Spock, bigger Kirk!

Kommentare Antworten abbrechen

Über den Autor

Veranstaltungs-Tipp

Letzte Blogartikel

Mehr aus Bissantz denkt nach.

Nicolas Bissantz

Diagramme im Management