Relevanz: Den Zufall zu Fall bringen

Die Ergebnisse von Umfragen nach Relevanz zu ordnen, ist doch ganz einfach – oder vielleicht doch nicht? Testen Sie Ihre Fähigkeiten anhand des folgenden fiktiven Beispiels.

Nehmen wir einmal an, dass in Deutschlands Fußgängerzonen 18500 zufällig ausgewählte erwachsene Passanten befragt wurden, ob sie an Horoskope glauben. Alle angesprochenen Personen haben bereitwillig ihre Meinung kundgetan und neben dem offensichtlichen Geschlecht auch Berufsgruppe, Alter und Sternzeichen verraten.

Die Auswertung der Antworten nach Geschlecht ergab folgende Tabelle:

Die Quoten nach Geschlecht

Offensichtlich stimmen hier Frauen der Frage prinzipiell häufiger zu. Wie sieht es mit dem Beruf aus?

Die Quoten nach Beruf

Es sieht so aus, dass Arbeiter doch eher an Horoskope glauben als die anderen Berufsgruppen. Eine weitere Tabelle nach Altersklassen verrät eine gewisse Abneigung der Twens:

Die Quoten nach Altersklassen

Schließlich variiert die Quote, je nach betrachtetem Sternzeichen, von 28 bis 35 Prozent:

Die Quoten nach Sternzeichen

Welche der Dimensionen liefert nun das auffälligste Ergebnis bei der Auswertung der Horoskopgläubigkeit des gemeinen volljährigen Fußgängerzonenbummlers? Ist der beobachtete Unterschied zwischen Frauen und Männern erwähnenswert oder doch eher die Streuung entlang der Sternzeichen („Widder glauben nicht an Horoskope“)?

Zur Beantwortung solcher Fragen kann die Prüfgröße eines Chi-Quadrat-Tests zu Rate gezogen werden, genauer gesagt, der p-Wert, der angibt, mit welcher Wahrscheinlichkeit eine solch große Prüfgröße wie die beobachtete erreicht oder überschritten werden kann. Dies geschieht unter der Annahme, dass eigentlich gar kein Einfluss der Dimensionselemente vorliegt, also die theoretischen Quoten für alle Dimensionselemente gleich sind, und dass somit die beobachteten Abweichungen in der Stichprobe allein durch Zufall entstanden sind.

Ist der p-Wert klein, ist der Einfluss der Dimensionselemente auf die Quote groß. Ist der p-Wert groß, liegt eher keine besondere Auffälligkeit vor. Bei unseren Daten entsteht nun aber das Problem, dass im Fall des Geschlechts und der Altersklasse handelsübliche Prozeduren die p-Werte durch die beschränkte Rechengenauigkeit der verwendeten Algorithmen mit einer glatten 0 ausgeben. Es ist dadurch zwar fast sicher, dass sowohl Geschlecht, als auch Alter einen deutlichen Einfluss auf die Quote haben und solch unterschiedliche Quoten kaum durch reinen Zufall entstehen, jedoch können diese beiden Dimensionen nicht angeordnet werden.

Dieser Makel ließ uns nicht ruhen, und wir haben deshalb einen besseren Score entwickelt, der die Reihung der p-Werte beibehält, sich aber bezüglich der Vergleichbarkeit von Dimensionen keine Blöße gibt.

Wie sieht nun das Ergebnis aus? Unser Score sieht folgende Reihung vor:

Die Scores der Dimensionen

Besonders der Einfluss der Altersklassen auf die Quoten ist bei diesem Datensatz erwähnenswert; die Bedeutung der Sternzeichen für die Quoten ist im relativen Vergleich weniger ausgeprägt. Absolut gesehen sollten Scorewerte mindestens 1 betragen (bei strengerer Auslegung mindestens 2), um als relevant angesehen werden zu können. Dies ist hier für alle 4 Dimensionen der Fall.

Unser Score lässt sich durch vermeintlich hohe Schwankungen, wie sie bei der Dimension Sternzeichen beobachtet werden, nicht irritieren, sondern berücksichtigt implizit, dass hier die gleiche Anzahl von Personen (18500) auf insgesamt 12 mögliche Elemente verteilt wird. Die Varianz einer Quote steigt, wenn die Stichprobengröße sinkt, und somit sind bei 12 Dimensionselementen mit durchschnittlich ca. 1540 Personen pro Sternzeichen allein durch reinen Zufall höhere Schwankungen zu erwarten als etwa beim Geschlecht, da hier bei 2 Dimensionselementen bereits knapp 9000 Personen pro Dimensionselement vorliegen und die Quoten weniger Variabilität aufweisen.

Kurz: Unser Score berücksichtigt die höhere Varianz von Quoten, die mit einer höheren Anzahl von Dimensionselementen einhergeht, und kann auch noch Dimensionen mit extremeren Abweichungen gemäß ihrer Bedeutung verlässlich anordnen.

Montag, 1. Juli 2013

Navigation Chi-Quadrat-Test Relevanz

Veranstaltungs-Tipp

On-Demand-Webinar 28. April 2026 Webinar: Planung mit Bissantz

DeltaMaster ermöglicht die effektive Erfassung und Verarbeitung von Planzahlen mit unterschiedlichen Planungsansätzen, Simulationen, Planungshorizonten und Analyse-Funktionen. Sehen Sie selbst!

Anmeldung

DeltaMaster ermöglicht die effektive Erfassung und Verarbeitung von Planzahlen mit unterschiedlichen Planungsansätzen, Simulationen, Planungshorizonten und Analyse-Funktionen. Sehen Sie selbst!

Meet the Experts 4. Mai 2026 Webinar: ERP Solutions für SAP

Das Management hat hohe Erwartungen an Business Intelligence: glasklar, verbindlich, schnell und einfach soll es sein. Die Bissantz ERP Solutions bieten eine schnelle und einfache Lösung, Ihre Daten [...]

Anmeldung

On-Demand-Webinar 13. Mai 2026 Webinar: Projekterfolg mit Bissantz

Ob Planung, Analyse oder Reporting: Bissantz-Projekte funktionieren! In diesem Webinar zeigen wir, wie wir von Bissantz in unseren Projekten arbeiten, worauf es ankommt – und was Unternehmen davon haben. [...]

Anmeldung

Über den Autor

Dr. Achim Lewandowski

ist zu Hause in der Grundlagen- und Anwendungsforschung von Bissantz & Company.

Letzte Blogartikel

Forschung KI-generierte E-Mails per Publisher versenden

KI-generierte E-Mails können die interessantesten, automatisiert gewonnenen Erkenntnisse aus einer Datenanalyse in kompakter Form enthalten [...]

mehr erfahren

Forschung Krankenstand der BKK-Versicherten

Krankenstand und Arbeitszeiten in Deutschland wurden in den vergangenen Wochen häufiger thematisiert: Ersterer sei angeblich zu hoch und Letztere [...]

mehr erfahren

Forschung Auftragsbestand im Bauhauptgewerbe

Der Auftragsbestand im Bauhauptgewerbe wird vierteljährlich vom Statistischen Bundesamt veröffentlicht. Welche Entwicklungen in den letzten [...]

mehr erfahren

Forschung Güterverkehrsstatistik der Eisenbahn

Die Güterverkehrsstatistik der Eisenbahn zeigt die auf dem öffentlichen Schienensystem beförderten Mengen verschiedenster Güter. Für das [...]

mehr erfahren

Forschung Erwerbstätigkeit, Löhne und Arbeitsstunden

Erwerbstätigkeit, Löhne und Gehälter sowie Arbeitsstunden reagieren auf Konjunkturschwankungen. Wodurch sich die einzelnen Wirtschaftsbereiche [...]

mehr erfahren

Bissantz News KI im Controlling sicher einsetzen: Compliance, Transparenz und menschliche Kontrolle

Compliance umfasst beim KI-Einsatz mehr als die Einhaltung gesetzlicher Vorgaben. Rechtliche Sicherheit, organisatorische Kontrolle und wirtschaftliche [...]

mehr erfahren

Bissantz News Dr. Nicolas Bissantz in den Nürnberger Nachrichten über KI, Entscheidungen und Tempo

Wie schnell sich die Welt der Künstlichen Intelligenz derzeit verändert, zeigt sich besonders deutlich im Silicon Valley. Auf einer Delegationsreise [...]

mehr erfahren

Kunden Linxens: Einheitliche Steuerung und schnellere Entscheidungen durch Business Intelligence mit Bissantz

Ludwig Stüwe, Division Controller bei Linxens, erläutert, wie DeltaMaster Transparenz über Kosten, Margen und Prozesse schafft – und warum [...]

mehr erfahren

Bissantz News Controlling 2026: KI als Evolution von Business Intelligence

Für Controlling und Management ist BI ein zentrales Instrument der Unternehmenssteuerung. Gleichzeitig wächst der Anspruch: Entscheidungen [...]

mehr erfahren

Produkt Vom Reporting zum Managementsystem

Zahlen müssen so gestaltet sein, dass sie Orientierung geben, Entscheidungen fokussieren und Handeln auslösen. Dieser Beitrag zeigt, wie wirksames [...]

mehr erfahren

Vorheriger Artikel

Gruppierung: Klassen-Keile

Nächster Artikel

Sortierung: Matricks

Relevanz: Den Zufall zu Fall bringen

Veranstaltungs-Tipp

Über den Autor

Schlagwörter

Letzte Blogartikel

Nicolas Bissantz

Diagramme im Management