CiAgICA8IS0tIExpbmtlZEluIC0tPgogICAgPHNjcmlwdCB0eXBlPSJ0ZXh0L2phdmFzY3JpcHQiPgogICAgICAgIF9saW5rZWRpbl9wYXJ0bmVyX2lkID0gIjEyMzUwNzMiOwogICAgICAgIHdpbmRvdy5fbGlua2VkaW5fZGF0YV9wYXJ0bmVyX2lkcyA9IHdpbmRvdy5fbGlua2VkaW5fZGF0YV9wYXJ0bmVyX2lkcyB8fCBbXTsKICAgICAgICB3aW5kb3cuX2xpbmtlZGluX2RhdGFfcGFydG5lcl9pZHMucHVzaChfbGlua2VkaW5fcGFydG5lcl9pZCk7CiAgICA8L3NjcmlwdD48c2NyaXB0IHR5cGU9InRleHQvamF2YXNjcmlwdCI+CiAgICAgICAgKGZ1bmN0aW9uKCl7dmFyIHMgPSBkb2N1bWVudC5nZXRFbGVtZW50c0J5VGFnTmFtZSgic2NyaXB0IilbMF07CiAgICAgICAgICAgIHZhciBiID0gZG9jdW1lbnQuY3JlYXRlRWxlbWVudCgic2NyaXB0Iik7CiAgICAgICAgICAgIGIudHlwZSA9ICJ0ZXh0L2phdmFzY3JpcHQiO2IuYXN5bmMgPSB0cnVlOwogICAgICAgICAgICBiLnNyYyA9ICJodHRwczovL3NuYXAubGljZG4uY29tL2xpLmxtcy1hbmFseXRpY3MvaW5zaWdodC5taW4uanMiOwogICAgICAgICAgICBzLnBhcmVudE5vZGUuaW5zZXJ0QmVmb3JlKGIsIHMpO30pKCk7CiAgICA8L3NjcmlwdD4KICAgIDxub3NjcmlwdD4KICAgICAgICA8aW1nIGhlaWdodD0iMSIgd2lkdGg9IjEiIHN0eWxlPSJkaXNwbGF5Om5vbmU7IiBhbHQ9IiIgc3JjPSJodHRwczovL3B4LmFkcy5saW5rZWRpbi5jb20vY29sbGVjdC8/cGlkPTEyMzUwNzMmZm10PWdpZiIgLz4KICAgIDwvbm9zY3JpcHQ+CiAgICA8IS0tIEVuZCBMaW5rZWRJbiAtLT4KICAgIA==
Generic filters
Exact matches only
Search in title
Search in excerpt
Search in content

Was haben Schweißroboter und medizinische Studien gemeinsam? - Modellierung von Ereignisfolgen

Seit der Einführung der Sparklines wissen wir, dass für die Interpretation von Daten auch die historische Entwicklung zu betrachten ist. Dies ist möglich, da Datenerhebungen immer mit einem Zeitstempel oder einem Zeitbezug verbunden sind und dieser auch in den Datenbanken festgehalten wird. Beides zusammen führt dazu, dass wir Daten zunächst einmal der Zeitdimension zuordnen. Möglicherweise übersieht man dabei jedoch, dass in den Daten nicht eine zeitliche Folge von Datenpunkten, wie z. B. Tagesumsätze oder tägliche Lagerbestände abgebildet ist, sondern eine sich wiederholende Folge von Ereignissen, die zu beliebigen Zeitpunkten beginnen kann.

Beispiel 1:

In einer medizinischen Studie werden 100 Patienten jeweils sieben Mal behandelt. Vor Beginn jeder Behandlung wird ein Messwert aufgezeichnet. Untersucht werden soll nun die Veränderung des Messwertes in Abhängigkeit von den Behandlungen. Weiterhin sind Zusammenhänge mit Patientenmerkmalen und Behandlungsmerkmalen aufzudecken.

Die Daten enthalten neben Patientenmerkmalen, Behandlungsmerkmalen und Messwert auch den Zeitstempel der Behandlung. Die Behandlung der Patienten erfolgt typischerweise nicht gleichzeitig, es können sogar Patienten bereits die Studie abgeschlossen haben während andere noch am Anfang stehen. Schnell wird klar, dass die zeitliche Betrachtung der durchschnittlichen Veränderung der Messwerte über alle Patienten keine sinnvollen Erkenntnisse liefern kann.

Beispiel 2:

An Schweißrobotern werden nach jedem Schweißvorgang verschiedene Messwerte genommen, anhand deren die Abnutzung des Schweißkopfes ermittelt wird. Bei entsprechender Abnutzung müssen die Schweißköpfe nachgeschliffen oder sogar ersetzt werden. Durch optimale Einstellungen des Schweißroboters kann die Abnutzung minimiert oder zumindest etwas ausgeglichen werden. Überlegt man jetzt, was die Abbildung all dieser Messwerte, wenn auch geschickt aggregiert, auf einer Zeitdimension an Analysen ermöglicht, muss man zu der Erkenntnis kommen, dass hier andere Modellierungsansätze zu suchen sind.

Beiden Fällen gemeinsam ist, dass wir es hier mit Folgen von Ereignissen zu tun haben, deren Startzeitpunkt für die Analyse nur eine nebengeordnete Rolle spielt.

Für die Vergleichbarkeit der Folgen ist also eine Normierung auf einen gemeinsamen Startpunkt notwendig.

Bei der mehrdimensionalen Modellierung ist dies durch eine Dimension “Ereignisfolge” leicht möglich, wenn zunächst einmal Beginn und Ende der Folge definiert sind.

Für das Beispiel 1, besteht die Folge ganz klar aus den sieben aufeinanderfolgenden Messungen je Patient. Die Dimension Behandlungen enthält also die Elemente 1, 2, 3, 4, 5, 6 und 7.

Im Beispiel 2 haben wir es genaugenommen sogar mit drei unterschiedlichen Folgen zu tun. Zum einem mit den Schweißpunkten nach Austausch des Schweißkopfes, zum anderen mit den Schweißpunkten nach dem Nachschleifen des Schweißkopfes. Das Nachschleifen des Schweißkopfes selbst ist auch wieder eine Ereignisfolge die orthogonal zur zweiten Folge steht. Dies im Modell zu berücksichtigen wird dem Leser aber zur selbstständigen Vertiefung aufgegeben.

Modelliert wird hier also eine Dimension Schweißpunkte nach Austausch, die analog zum Beispiel 1 die Elemente 1 bis X enthält, wobei X der maximalen mit einem Schweißkopf durchführbaren Schweißvorgänge entspricht. Ist X sehr groß wie in der dem Beispiel zugrundeliegenden Anwendung mit X gleich 500, so ist es sinnvoll dieser Dimension eine oder mehrere Verdichtungsebenen mitzugeben. Bei der Analyse ist jedoch zu beachten, dass durch die vorgegebenen Intervalle möglicherweise interessante Entwicklungen verdeckt werden. Die Verdichtungsintervalle sind also hinreichend klein zu wählen und es sind immer auch Kontrollanalysen auf der Ereignisebene durchzuführen.

Analog dazu erfolgt die Dimension Schweißpunkte nach Nachschliff, die natürlich deutlich weniger Elemente enthält. Das Ergebnis der selbstständigen Vertiefung ergibt eine dritte Dimension Nachschleifpunkt nach Austausch mit den Elementen 0, 1 etc.

Jeder Schweißvorgang wird also auf den drei Dimensionen eingeordnet.

Folgende Aspekte sind bei der Modellierung und Analyse noch zu beachten:

Auf die echte Zeitdimension wollen wir in diesen Modellen nicht verzichten. Es bietet sich an, die Daten einer Folge immer anhand des Startzeitpunktes auf der Zeitachse anzuordnen. Damit lassen sich die durch die Folge analysierbaren Prozessveränderungen zeitlich beobachten. So kann beispielsweise die Betrachtung des 100ten Messpunktes über die Zeit Aufschluss über kontinuierliche oder auch plötzlich auftretende Veränderung des Abnutzungsprozesses geben.

In den beiden genannten Beispielen spielt die Zeitspanne zwischen den Ereignissen keine Rolle, weil sie entweder jeweils gleich ist (Beispiel 1), oder aber für den abgebildeten Prozess keine Rolle spielt (Beispiel 2). Sind jedoch unterschiedliche Zeitspannen zu berücksichtigen, kann dies in der Ereignisfolgedimension durch Elemente, die die Zeitspannen abbilden, erfolgen. Ggf. kann die Zeitspanne auch auf einer zusätzlichen Dimension abgetragen werden.

Falls es technisch möglich ist, sollte eine Falldimension in das Modell aufgenommen werden. Dies ermöglicht weitere Analysen, insbesondere dann, wenn mehrere Ereignisfolgen auf der Zeitdimension demselben Element zugeordnet sind.

Nicolas Bissantz

Diagramme im Management

Besser entscheiden mit der richtigen Visualisierung von Daten

Erhältlich im Haufe-Onlineshop oder bei Amazon.