Datenmodellierung in der BI (Business Intelligence)


Herausforderung der BI-Datenmodellierung

Die Datenmodellierung von Analytischen Informationssystemen in der BI (Business Intelligence) muss andere Anforderungen erfüllen als die Datenmodellierung der transaktionalen Systeme. Dies hat u.a. folgende Hintergründe. Die Datenmodellierung eines transaktionalen Systems muss im Allgemeinen genau einem Zweck genügen: einen operativen Geschäftsprozess unterstützen, z.B. ein CRM-System (Customer Relationship System) muss CRM-Prozesse unterstützen und deswegen 'nur' ein CRM-Datenmodell abbilden und ein Abrechnungssystem muss 'nur' ein Datenmodell für Rating und Billing für den Abrechnungsprozess unterstützen. Die Analytischen Informationssystem müssen hingegen meistens sowohl die Datenmodelle der transaktionalen Systeme als auch das Datenmodell des analytischen Informationsystems abbilden und die Transformation der verschiedenen transaktionalen Datenmodell (CRM, ERP, Billing, Logistik, ...) in das analytische Datenmodell.

Der Irrweg der BI-Datenmodellierung

Gemäß der geschilderten Herausforderungen bei der BI-Datenmodellierung wird häufig ein suboptimales Standardvorgehen gewählt. Bei der BI-Datenmodellierung werden in der Praxis Analysten dafür eingesetzt, das transaktionale physische Datenmodell manchmal auch noch das logische Datenmodell fachlich zu interpretieren und damit mit einer Heuristik das semantische Datenmodell entwickelt (Re-Engineering). Dieses heuristisch entwicklte semantische Datenmodell dient dann als Basis für die Vorgaben der Datenmodellierung in der Welt der Business Intelligence. Initial ist dies häufig der schnellste und billigste Weg. Langfristig kann diese Vorgehensweise nicht gut funktionieren, da sich die Semantik in der Operativen Welt ändert und somit jede Änderung mit teuer eingekauften Analysten nachgezogen werden muss oder aber eine schlechte semantische Datenqualität in der BI (Business Intelligence) in Kauf genommen wird.

Der Königsweg der BI-Datenmodellierung

Anstatt aus dem physichen und/oder logischen transaktionalen Datenmodell mit heuristischen Methoden ein seamtisches Datenmodell für die Belange der BI (Business Intelligence) zu entwickeln ist es einfacher auf dem semantischen Datenmodell der operativen Prozesse aufzusetzen. Bei der Transformation des transaktionalen Datenmodell in das analytische Datenmodell muss man die technischen Abbildungen und Restriktionen der transaktionalen Systeme nicht berücksichtigen. Bei der Erstellung des Logischen Datenmodells für die Transformation des Datenmodells der operativen Prozesse in das Datenmodell der analytischen Prozesse kann man dann strukturelle Verbesserungen erzielen, die bei der oben beschriebenen Vorgehensweise nicht erzielt werden kann. Hierzu zählen u.a.
  1. Anpassung des logischen/physichen Datenmodells in den transaktionalen Systemen
  2. Identifizierung der idealen Datenquelle für die Belieferung der BI-Systeme (z.B. transaktionale Frontendsysteme liefern direkt und parallel an die BI-Systeme anstatt nur an die transaktionalen Backendsysteme und von dort an die BI-Systeme). Dadurch wird eine Entkopplung der BI vom Datenmodell der transaktionalen Backendsysteme vorgenommen, was zu extrem vielen Vorteilen führt.

In den folgenden Unterkapiteln wird noch einmal ausführlich auf die Datenmodellierung in den analytischen Informationssystemen eingegangen.