Semantische Datenqualität der BI-Systeme


Die semantischen Datenqualität kann durch einen Vergleich der Daten in den Business Intelligence Systemen mit den Daten in den Quellsystemen messen. Dabei wird sowohl die korrekte Übertragung als auch die korrekte Weiterverarbeitung geprüft. Folgende Datenqualitätsprobleme können hierbei auftreten:
  • Unvollständige Übernahme der Daten aus den Quellsystemen, z.B. aufgrund fachlicher Filtervorgaben (explizit gewünscht oder auch unerwünscht)

  • Übernahme der Daten aus den Quellsystemen in einer falschen Semantik. Ungenügendes Wissen der BI-Fachwender über die operativen Prozesse in den Quellsystemen führen häufig zu falschen bzw. unzureichenden Vorgaben, so dass die Daten nicht im benötigten Kontext im Quellsystem extrahiert werden. Datenqualitätsproblemen sind häufig die Folge in den BI-Reports und den Analyse-Tools

  • Verarbeitung der Daten aus den Quellsystemen zu Informationen in der Business Intelligence auf Basis einer falschen Semantik / Fachlichkeit. Insbesondere Beziehungen zwischen mehreren Objekten aber auch zwischen Objekten und Attributen können die Fehlerursache sein. Häufig werden in den verschiedenen Datenmodellen der verschiedenen Quellsysteme die selben Entitäten unterschiedlich bezeichnet bzw. unterschiedliche Entitäten mit dem selben Begriff bezeichnet. Des weiteren werden in den verschiedenen Quellsystem Detaillierungen auf unterschiedlichen Ebenen verwendet. Dies alles kann zu unvollständigen aber auch zu doppelten Datensätzen führen (Inkonsistenz, Redundanz) aber auch zu falschen Objektbeziehungen (Inkonsistenz).