Datenqualität Semantik Checks

Im Gegensatz zu den Syntax Checks, welche die Struktur und Zusammensetzung von Daten zum Gegenstand haben, sind bei den Sematik Checks die inhaltliche Bedeutung und die Beziehung von Datenobjekten untereinander sehr wichtig.

Zu den wichtigsten Semantik Checks gehören:
  • Fachliche Eindeutigkeit / Eineindeutigkeit
  • Relationencheck / Objektbeziehungschecks (Constrains)
  • Inhaltliche Richtigkeit

Fachliche Eindeutigkeit

Für die Sicherstellung der Ein(ein)deutigkeit muss für jeden Datensatz ein fachlicher Primary Key (eindeutiger Schlüssel) definiert werden. Inwieweit dieser Primary Key auch technisch umgesetzt wird, oder mit anderen Mechanismen gearbeitet wird, muss von Fall zu Fall geprüft werden. Der fachliche Dublettencheck ist ein sehr wichtiger Syntax Sementik in den Systemen.

Korrekte Objektbeziehung

Extrem wichtig für eine hohe Datenqualität ist die korrekte Abbildung der Beziehungen / Relationen von Objekten und Attributen zueinander. Datenverarbeitungssysteme speichern niemals alle Informationen vollständig ab, sondern immer nur einen relevanten definierten Ausschnitt. Nachträglich nicht in den Systemen vorhandene abzubildende Beziehungen wie z.B. in der Business Intelligence sind mit großer Vorsicht zu geniesen. Um solche Beziehungen abzubilden muss das Semantische Datenmodell und die logischen Datenmodelle der relevanten Systeme verstanden werden. Ansonsten werden Daten falsch in Beziehung gesetzt und falsche Schlüsse gezogen.

Inhaltliche Richtigkeit

Die inhaltliche Richtigkeit und somit auch Vollständigkeit (Teilmenge der Richtigkeit) muss von Business Experten sichergestellt werden. Die IT-Systeme können die Daten nur korrekt verarbeiten, wie sie entsprechend definiert und bereitgestellt werden. Werden beispielsweise in einem Abrechnungssystem bewußt Rechnungen mit einem Betrag von 0 Euro unterdrückt, dann kann man keine Auswertungen erstellen über 'alle' Rechnungen, sondern nur über Rechnungen mit einem Betrag größer 0 Euro. Die inhaltliche Richtigkeit kann man insbesondere an den Definitionen und fachlichen Erwartungshaltungen festmachen. Wenn man die Anzahl der Kunden zählt kann man viele Unterschiede an den Details der Definition Kunde festmachen. U.a. folgende Kurzbeschreibungen passen auf den Begriff 'Kunde':

  • Personen die Produkte nutzen: aktive Kunden
  • Personen die einen Vertrag abgeschlossen haben: Vertragskunden
  • Organisationen die einen Vertrag abgeschlossen haben: Geschäftskunden
  • Personen die eine Rechnung erhalten: Rechnungsempfänger
  • Personen die eine Rechnung bezahlen: zahlender Kunde
  • Personen die Interesse an den Produkten bekundet haben: Interessenten
  • ...

So wie es sich mit dem Begriff Kunde verhält, so verhält es sich mit allen Objekten und deren Daten in den Systemen. Die Systeme halten immer nur den relevanten Ausschnitt an Daten vor, die benötigt werden.