Kausalität: Das kommt davon

Abhängigkeiten, die zwischen zufälligen Größen existieren, können häufig in einem Graphen einprägsam wiedergegeben werden. Wir erläutern heute Ansätze, die es auf relativ einfache Weise ermöglichen, Aussagen über nicht beobachtete Variablen abzuleiten.

In unserem Beispiel nehmen wir an, dass ein Unternehmen sowohl auf seiner Internetpräsenz, als auch im TV für ein neues Waschmittel wirbt. Ein zufällig in einer Straßenumfrage angesprochener Kunde kennt das Produkt – möglicherweise verursacht durch die Werbung – bereits bewusst oder eben nicht. Er wird gefragt, ob er eine kleine Probe gratis haben möchte und ob er seine Email-Adresse zwecks Zusendung eines Newsletters mit weiteren Produkten hinterlassen möchte. Insgesamt gibt es fünf Variablen mit den folgenden Bedeutungen:

A: Person hat das Produkt auf der Webseite bereits gesehen (ja/nein)
B: Person hat das Produkt in der TV-Werbung gesehen (ja/nein)
C: Person kann sich bewusst an das Produkt erinnern (ja/nein)
D: Person möchte die Gratisprobe (ja/nein)
E: Person möchte die Email-Adresse hinterlassen (ja/nein)

Der folgende Graph zeigt qualitativ, welche Einflüsse zwischen den Größen angenommen werden:

Graph der Abhängigkeiten

Was besagt dieser Graph? Hier wird beispielsweise angenommen, dass der Konsum von Fernsehwerbung unabhängig vom Besuch der Webseite ist. Man könnte auch argumentieren, dass eine positive Korrelation vorliegen könnte: Personen, die Fernsehen schauen, sind mit höherer Wahrscheinlichkeit auch im Web unterwegs. Auch halbwegs plausibel klingt die entgegengesetzte Annahme, dass die Zeit vor dem Fernseher auf Kosten der Zeit im Web geht. Wir bleiben bei der Annahme der Unabhängigkeit.

Dass nur von C aus Pfeile auf D und E zeigen und nicht direkt von A oder B, bedeutet, dass die Entscheidung für eine Gratisprobe oder den Newsletter nur von der Tatsache abhängt, ob das Waschmittel bereits bekannt war oder nicht, es aber keine Rolle mehr spielt, ob das Produkt im Web und/oder im TV gesehen wurde.

Hat man sich auf eine plausible Struktur der Abhängigkeiten festgelegt, gilt es, die Darstellung quantitativ zu füllen. Möchte man ein solches sogenanntes Bayes’sches Netzwerk herleiten, lässt sich die Tatsache ausnutzen, dass die gemeinsame Wahrscheinlichkeitsfunktion aller 5 Variablen hier eine spezielle Struktur annimmt:

Gemeinsame Wahrscheinlichkeitsfunktion

Beim Vergleich mit der Netzstruktur wird die starke Korrespondenz zur Formel deutlich. Jeder Knoten ohne Vorgänger steht in der Formel als einfache Wahrscheinlichkeit da, hier also P(A) und P(B).
Jeder andere Knoten mit Vorgängern ist ebenfalls vertreten, diesmal als bedingte Wahrscheinlichkeit P(Knoten|Vorgänger). Die hinteren drei Faktoren fallen unter diese Rubrik.

Diese fünf Wahrscheinlichkeitsfunktionen müssen nun bestimmt werden, sei es durch Schätzung, durch Annahmen oder durch Experimente. Letztendlich gelange man beispielsweise zu den folgenden Wahrscheinlichkeitsfunktionen:

Wahrscheinlichkeitsfunktionen

Die Wahrscheinlichkeiten für die Nein-Fälle ergeben sich jeweils als Differenz zu 1, beispielsweise ist P(C = nein | A = ja, B = ja) = 1-0.7 = 0.3.

Nun sind wir soweit, das vollständig definierte Bayes’sche Netz für Schlussfolgerungen nutzen können. Beispielsweise können wir fragen, wie groß die Wahrscheinlichkeit ist, dass eine Person, von der wir nur wissen, dass sie die Werbung im Fernsehen gesehen hat, bei Ansprache auf der Straße den Newsletter bestellen wird. Hier handelt es sich also um eine Voraussage:

Ableitung der Wahrscheinlichkeit einer Newsletter-Bestellung, gegeben “TV-Werbung gesehen”

In der Summation müssen insgesamt 8 mögliche Kombinationen von A, C und D durchgespielt werden. Hier bei diesem übersichtlichen Beispiel ist das noch ohne Probleme durchführbar, bei sehr großen Netzen kann es passieren, dass man sich mit approximativen Verfahren begnügen muss. Hier ergibt sich nach etwas Rechnerei, dass P(E = ja | B = ja) = 0.168 beträgt.

Aber Schlussfolgerungen können auch rückwärts laufen und nach der Ursache von Beobachtungen fragen. Sei beispielsweise nach der Wahrscheinlichkeit gefragt, dass jemand die Werbung im TV gesehen hat, wenn die Person behauptet, das Produkt bewusst zu kennen. Gesucht ist somit

Ableitung der Wahrscheinlichkeit, die Werbung gesehen zu haben, gegeben “Das Produkt ist mir bekannt”

Hier ergibt sich P(B = ja | C = ja) = 0.51. Wie ändert sich die Berechnung, wenn der angesprochene Passant nebenbei bemerkt, das Produkt bereits auf der Homepage gesehen zu haben? Wir suchen somit

Ableitung der Wahrscheinlichkeit, die Werbung gesehen zu haben, gegeben “Das Produkt ist mir bekannt und ich habe es auf der Homepage gesehen”

Nun ergibt sich P(B = ja | A = ja, C = ja) = 0.375 < 0.51. Dieses Phänomen, dass bei gegebenem Effekt (“kenne das Produkt”) die Wahrscheinlichkeit einer Ursache (“im TV gesehen”) sinkt, wenn eine andere Ursache (“im Web gesehen”) bekannt ist, nennt man Wegerklären (im Engl. “explaining away”).

Ist eine Teilmenge der 5 Variablen mit den Werten gegeben, lassen sich, so wie hier mehrfach illustriert, die Wahrscheinlichkeiten für die ungesehenen Zustände berechnen.

Hier in unserem Beispiel lagen nur binäre Variablen vor und ein Wert war entweder gegeben oder nicht. Bei Variablen mit vielen möglichen Werten kann das beobachtete Vorwissen auch in der Form von vagen Aussagen der Art “Der Würfel zeigte jedenfalls keine 3 und keine 5” vorliegen. Dann gestaltet sich aber die Berechnung aufwändiger.

Es gibt auch Ansätze, die Graphenstruktur soweit wie möglich aus Daten automatisch zu lernen und dann die benötigten Wahrscheinlichkeitstabellen auf der Basis der gefundenen Struktur zu füllen.

Dienstag, 1. März 2016

Diagnose Kausalität Predictive Analytics Prognosen Bayes'sches Netzwerk

Veranstaltungs-Tipp

On-Demand-Webinar 29. April 2025 Webinar: Berichtserstellung mit DeltaMaster

Mit Bissantz-Lösungen können Berichtsredakteure in kürzester Zeit neue Berichte und Ad-hoc-Analysen erstellen. Wie das funktioniert, sehen Sie im Webinar!

Anmeldung

Mit Bissantz-Lösungen können Berichtsredakteure in kürzester Zeit neue Berichte und Ad-hoc-Analysen erstellen. Wie das funktioniert, sehen Sie im Webinar!

On-Demand-Webinar 7. Mai 2025 Webinar: Reporting mit DeltaMaster

DeltaMaster-Berichte geben Signale, die unmissverständlich zeigen, wo gehandelt werden muss. Im Webinar zeigen wir Ihnen die drei leistungsfähigsten Methoden für die interaktive Ad-hoc-Analyse von [...]

Anmeldung

On-Demand-Webinar 13. Mai 2025 Webinar: Business-Intelligence-Anwendungen mit DeltaMaster Repository verwalten

Das Repository ist die zentrale Komponente zur datenbankgestützten Bereitstellung von DeltaMaster-Anwendungen. Wie Sie hier Benutzergruppen, Rollen, Berechtigungen und Anwendungen verwalten, erfahren [...]

Anmeldung

Über den Autor

Dr. Achim Lewandowski

ist zu Hause in der Grundlagen- und Anwendungsforschung von Bissantz & Company.

Letzte Blogartikel

Forschung Kaltmieten in Deutschland

Kaltmieten bzw. Mieten im Allgemeinen sind in den letzten Jahren stetig gestiegen und stellen für viele Mieter den größten Posten der monatlichen [...]

mehr erfahren

Forschung Achsenelemente als Filter an Zielbericht zuweisen

Achsenelemente können mit dem neuesten Release von DeltaMaster in ihrer Gesamtheit als Filter an einen Zielbericht zugewiesen werden. Wir erklären [...]

mehr erfahren

Forschung Leistungsausgaben der gesetzlichen Krankenversicherung

Die Leistungsausgaben der gesetzlichen Krankenkassen steigen von Jahr zu Jahr. Als Folge haben im Januar 2025 etliche Krankenkassen erneut die [...]

mehr erfahren

Forschung Analyse von Verteilungen

Die Beschreibung von Verteilungen geht oft über die Angabe von Mittelwert und Standardabweichung hinaus. Wir erläutern, was sich bei den hierfür [...]

mehr erfahren

Forschung Personenverkehr mit Bussen und Bahnen in der DeltaApp

Für den Personenverkehr spielen Busse und Bahnen eine wichtige Rolle. Das Statistische Bundesamt stellt hierzu interessante Daten zur Verfügung [...]

mehr erfahren

Data Warehousing Unternehmensplanung und -konsolidierung auf Basis der Bissantz ERP Solutions

Dieser Beitrag erläutert, wie sich Prozesse der integrierten Unternehmensplanung und der Unternehmenskonsolidierung strukturiert gestalten [...]

mehr erfahren

Data Warehousing Partitionierung von Bewegungsdaten

Die Aktualisierung von Bewegungsdaten nimmt während der täglichen Aufbereitung einer SQL-Datenbank in der Regel den Großteil der benötigten [...]

mehr erfahren

Data Warehousing Arbeitstagkalender

Zur Berechnung von Kennzahlen, die von der genauen Anzahl der Arbeitstage abhängen, ist es notwendig, diese im Modell korrekt abzubilden. Die [...]

mehr erfahren

Bissantz News The BI & Analytics Survey 25: Platz 1 für Bissantz in Selfservice, Mobile BI und zahlreichen weiteren Kriterien

Im BI & Analytics Survey 25 von BARC liegt Bissantz auf Platz eins in den Vergleichsgruppen Selfservice BI, Mobile BI und zahlreichen weiteren [...]

mehr erfahren

Forschung Reisegebiete mit Ankünften und Übernachtungen

Reisegebiete in Deutschland üben sowohl auf inländische als auch auf ausländische Touristen wieder ansteigende Anziehungskraft aus. Wie sieht [...]

mehr erfahren

Vorheriger Artikel

Strategie: Aufhören, wenn es am schönsten ist

Nächster Artikel

Strategie: Das haben wir schon immer so gemacht!

Kausalität: Das kommt davon

Veranstaltungs-Tipp

Über den Autor

Schlagwörter

Letzte Blogartikel

Mehr aus Forschung.

Nicolas Bissantz

Diagramme im Management