Das Semantische Datenmodell in der BI (Business Intelligence)


Einordnung der Semantischen Datenmodellierung

Die Datenanalyse hat beim Aufbau eines AIS (Analytischen Informationssystem) eine wichtige Funktion. Zur Datenanalyse gehört nicht nur, daß die relevanten Daten für das Risikomanagement spezifiziert und in den DBS lokalisiert werden, sondern auch, daß ein leistungsfähiges Datenmodell entwickelt wird. Dieses Datenmodell muß nicht nur den Anforderungen von operativen DBS genügen, sondern auch noch den Anforderungen der Erweiterbarkeit, Schnelligkeit und Flexibilität von Daten­analysen. Daraus folgt, daß schon in der Analysephase beachtet wird, daß die Daten auch in aggregierter Form gespeichert werden. Diesen Anforderungen genügen die herkömmlichen Datenmodelle aus den operativen Systemen nicht. Durch die Speicherung der Daten in aggre­gierter Form kann das Performance-Problem zum Teil gelöst werden. Neben relationalen DBS kommen auch objektorientierte und multidimensionale DBS bei Data Warehouse-Lösungen zum Einsatz.

Die Datenmodellierung erfolgt in mehreren Schritten. Zur Abbildung eines bestimmten Systems in einer Datenbank muß zuerst der Umfang der Realwelt eingegrenzt werden. Im zweiten Schritt muß diese eingegrenzte Realwelt auf eine Datenbank abgebildet werden. Diese Abbil­dung entspricht nach ANSI/SPARC dem konzeptionellen Schema. Das konzeptionelle Schema muß dann in ein internes Schema umgesetzt werden. Die Abbildung des Realweltaus­schnitts auf ein konzeptionelles Schema erfolgt in zwei Schritten. Zuerst wird der Realwelt­ausschnitt auf ein semantisches Datenmodell und dann auf ein logisches Datenmodell abgebildet.



Das Semantische Datenmodell als Basis für das Logische Datenmodell

Bei der Datenmodellierung von AIS sollte im Rahmen der Systementwicklung, wie bei den operativen DBS, vor der logischen Datenmodellierung die semantische Datenmodellierung erfolgen.102 Durch das semantische Datenmodell wird die semantische Lücke zwischen Real­welt und logischem Datenmodell verkleinert. Zur Abbildung der Realwelt in einem semanti­schen Datenmodell bedient man sich zumeist dem ERM. Dieses Modell genügt zwar meistens den Ansprüchen von operativen DBS, jedoch hat dieses Modell Probleme, Daten multidimen­sional abzubilden. Aus diesem Grund wird nach neuen Modellierungstechniken bzw. Daten­modellen gesucht.

In der letzten Zeit hat man sich mehr mit der technischen Umsetzung von AIS beschäftigt als mit der Datenmodellierung. Dadurch kam es auch zur Vernachlässigung der Entwicklung ge­eigneter Werkzeuge zur Datenmodellierung, vor allem für semantische Datenmodelle. Aus diesem Grund existiert im Gegensatz zur logischen Datenmodellierung, wie z.B. das Star-Schema, bei der semantischen Datenmodellierung noch kein Konzept, welches die Anforde­rungen an multidimensinale Datendarstellung erfüllt.

Bei der Datenmodellierung von AIS ist nicht die Realwelt die direkte Grundlage der Model­lierung, da in den AIS nur Kennzahlen wie Absatzmenge, Umsatz, Gewinn, Cash Flow, ROI, RAROC, Zinssätze, Marktrendite usw. gespeichert werden. Die Datengrundlage für diese Kennzahlen liefern die operativen DBS bzw. externe Datenquellen. In den Unternehmen sind die semantischen Datenmodelle nicht immer vollständig, so daß auf diese nicht unbegrenzt zugegriffen werden kann. Dies bedeutet natürlich auch die Chance, vollständige semantische Datenmodelle für die transaktionsorientierten Informationssysteme und die AIS zu erstellen, welche auch in Zukunft gepflegt werden müssen. Das semantische Datenmodell muß auch die Anforderungen der Erweiterbarkeit und der Wiederverwendbarkeit erfüllen.

Bei der semantischen Datenmodellierung der AIS müssen neue Wege gegangen werden, da die bisher verwendeten Datenmodelle die Multidimensionalität und die Aggregationen nicht unterstützen. Zuerst soll noch einmal das bislang in der Praxis für relationale DBS verwendete EERM vorgestellt werden. Im nächsten Kapitel wird ein Modellierungsvorschlag beschrieben, wie die semantische Datenmodellentwicklung aussehen könnte. Weitere alternative Modelle und Ansätze stellen Gabriel und Gluchowski103 (z.B. Application Design for Analytical Processing Technologies - ADAPT104) und Schelp105 vor.

(Auszug aus der Diplomarbeit von Ralph Leipert: "Analytische Informationssysteme als Basis des Risikomanagement der Unternehmung")


102 Vgl.: Schelp, J. (1998), S.264

103 Vgl.: Gabriel, R. / Gluchowski, P.: (1997), S.18-37

104 Vgl.: Bulos, Dan (1998b), S.251-261

105 Vgl.: Schelp, J. (1998) S.263-276