Datenqualität Korektheit (Konsistenz, Redundanz, Vollständigkeit)


Werden die richtigen Kennzahlen berechnet, aber die Inhalte sind in einer unzureichenden Qualität (nicht korrekt), dann kann dies viele Ursachen haben. Die Korrektheit bzw. Nicht-Korrektheit kann man u.a. an folgenden Kriterien feststellen
  • Widerspruchsfreiheit vs. Inkonsistenz
  • Redundanzfreiheit vs. Mehrfachspeicherung
  • Vollständigkeit vs. lückenbehaftete Datenbasis
  • ...
Die Ursachen für die schlechte Datenqualität müssen nicht unbedingt in den Business Intelligence Systemen liegen (in den seltensten Fällen), sondern sind häufig in unzureichenden Datenbereitstellungsprozessen der Quellsysteme begründet inkl. derer fachlichen Vorgaben für die Prozessabläufe.

Überbringer von schlechten Nachrichten ist nicht zwangsläufig der Verursacher.


Für die Business Intelligence bedeutet dies, dass die Feststellung (Messen) von schlechter Datenqualität in den BI-Systemen nicht automatisch den Schluß zuläßt, dass die Ursache der schlechten Datenqualität in den Systemen der Business Intelligence liegt. Für die Ursachenforschung muss eine sehr stringende strukturierte Analyse der BI-Systeme, deren Bewirtschaftung (ETL) und gegebenfalls die der Quellsysteme und der operativen Prozesse auf den Quellsystemen erfolgen.

Die folgende Analysesequenz wird bei der Ermittlung der Ursachen empfohlen:
  1. Syntaktische Datenqualität der BI-Systeme
  2. Semantische Datenqualität der BI-Systeme
  3. Semantische Datenqualität in den Quellsystemen
  4. Syntaktische Datenqualität in den Quellsystemen