In letzter Zeit kommt es immer wieder zu großen Diskussionen bezüglich der Weitergabe von persönlichen Daten und Verletzungen von Datenschutzbestimmungen. Vor allem in unserer Branche werden Geheimhaltungsvereinbarungen immer strenger und der Umgang mit Kundendaten ist kritischer denn je.
Typischerweise erhalten wir Daten von Interessenten oder Kunden, um daraus mithilfe des DeltaMaster Modeler ein Demo-Datenmodell zu erstellen. Wenn das fertige Demomodell präsentiert wird, dürfen dabei in der Regel keine kundenspezifischen Bezeichnungen oder tatsächliche Werte verwendet werden: es gilt, die Daten zu anonymisieren.
Aus diesem Grund muss das Vorkommen dieser Informationen an folgenden Stellen geprüft werden:
1. DeltaMaster Modeler
2. Microsoft SQL Server
3. Microsoft Analysis Services
4. DeltaMaster Analysesitzung
Der folgende Blogbeitrag zeigt, auf welche konkreten Stellen man bei der Anonymisierung achten muss.
DeltaMaster Modeler
Anmeldedialog
Beim Start der Analysesitzung von DeltaMaster Modeler öffnet sich der Dialog zur Anmeldung an die relationale Datenbank. Bereits hier ist zu beachten, dass der Server und die relationale Datenbank keine kundenspezifischen Bezeichnungen enthalten.
Innerhalb der Analysesitzung gilt es an verschiedenen Stellen auf die anonymisierte Verwendung von Parametern und Bezeichnungen zu achten.
Ordner „Configuration“
Bericht „Parameter“
Hier müssen die folgenden Bezeichnungen hinsichtlich kundenspezifischer Informationen geprüft und ggf. anonymisiert werden:
- Model Name, da die Bezeichnung des Model Name im weiteren Verlauf in der OLAP Datenbank unter Datenquellen (DataSource) und Datenquellensichten (DataSource View) eingesehen werden kann.
- OLAP Server
- OLAP Database
- Writeback table Database
Ordner „Model“
Berichte „Dimensions“, „Levels“, „Level Source Columns“ und „Level Attribute”
Alle Informationen, die kundenspezifische Hinweise geben könnten, gilt es zu ändern. Dies betrifft in der Regel die Bezeichnungen von:
- Dimensionen und All-Elementen
- Ebenen und zugehörigen Attributen
- Quelltabellen bzw. -views inkl. deren Spalten
- Cubes
- MeasureGroups und den zugehörigen Measures
Bericht „MeasGrp Info“
Um später auch den SQL-Durchgriff bedenkenlos zeigen zu können, werden auch Spalten- und Infobezeichnungen geändert.
Ordner „Advanced Modeling“
Additional Hierarchy
Einträge in den Additional Hierarchies und deren Ebenen müssen ebenfalls überprüft werden, beispielsweise die Branchenbezeichnung.
Microsoft SQL Server
Strukturen
Um einen Blick auf die Daten zu werfen, betrachten wir unser Demomodell Chair. Für die Wiederherstellung von relationalen Datenbanken gibt es die Dateien mit Endung mdf und ldf. Auch diese können Hinweise auf kundenspezifische Informationen enthalten.
Stammdaten
Die Bezeichnungen der Dimensionselemente müssen verfälscht werden. Dabei reicht es, die Einträge in der Tabelle T_DIM_XXX umzubenennen, wenn anschließend kein Transform_All ausgeführt werden muss.
Bewegungsdaten
Im Blogbeitrag „Für Präsentationszwecke: Daten kräftig durchmischen“ (http://crew.bissantz.de/updatetablewithrandomfactor) wird beschrieben, wie Bewegungsdaten verfälscht werden ohne den Zusammenhang zu verlieren. Diese Prozedur kann noch erweitert werden, um die Veränderung von mehreren Spalten (Bsp. 4 Kennzahlenspalten) gleichzeitig zu ermöglichen. Mit folgendem Statement ist das möglich:
Zu beachten ist hierbei, dass alle ausgewählten Spalten mit dem gleichen Faktor multipliziert werden.
Microsoft Analysis Services
Auch in der OLAP Datenbank sind die Namen von Datenquelle, Datenquellensicht, Cube, Measuregroups, Dimensionen und Kennzahlen zu prüfen.
Zudem müssen die Rollen und möglicherweise die mittels Berechnungen per MDX erzeugten Dimensionselemente und Kennzahlen geprüft werden.
In der Datenquellensicht sieht man den Modellnamen. Dieser wurde wie oben beschrieben, im DeltaMaster Modeler definiert.
DeltaMaster Analysesitzung
Ist bereits eine Analysesitzung vorhanden, werden diese und die darin enthaltenen Ordner, Cockpits und Berichte, Berechnete Elemente und Kennzahlen umbenannt. Mithilfe des Modellbrowsers erhält man unter Modell einen schnellen Überblick über Dimensionen und Analysewerte. Übersetzungen sind unter Alias Sets definiert.