Datenqualität Syntax Datenstruktur

Bei der Übertragung von Dateien zwischen Systemen werden häufig Dateien verwendet. Die Dateien müssen nach einer entsprechenden Syntax einer Dateistruktur aufgebaut werden. Zu diesen Strukturelementen gehören die folgenden Elemente:

  • Dateiname
  • Dateistruktur
    • Kopfbereich
    • Rumpfbereich: Datensätze bzw. Inhalte
    • Fußbereich

Der Dateiname

Der Dateiname ist ein wichtiges Strukturelement bei der Syntax von Dateien. Anhand des Dateinamen kann ein System erkennen, ob es sich um die erwartete Datei handelt. Je nach Verwendungszweck macht es Sinn bestimmte Inhalte im Namen zu verewigen. Sind z.B. Datensätze mit Adressdaten in der Datei enthalten, dann sollte auch die Bezeichnung 'Adressdaten' im Dateinamen stehen. Weiterhin macht es Sinn ein zeitliches Ordungskriterium einzufügen, z.B. den Erstellungszeitpunkt und / oder der Gültigkeitszeitraum der Datensätze, z.B. Adressdatensätze vom April 2013. Ein guter Dateiname könnte z.B. wie folgt aussehen: Adressdatensätze_April_2013_erstellt_am_20130501.csv

Die Dateistruktur

Die Datei selbst ist überlicherweise in drei Bereiche aufgeteilt.
  • Der Kopfteil beinhaltet Metadaten zur Datei und den Inhalten der Datei. Hierzu zählen u.a. Daten zum Quellsystem, Dateiname, Inhaltsbeschreibungen, Gültigkeitszeitraum für die Inhalte / Datensätze oder auch Filter der Selektion, beispielsweise 'Adressdaten aus der Region West'. Auch eine laufende Nummerierung der Dateien könnte zum Inhalt des Kopfteils hören.
  • Der Rumpfteil beinhaltet die Datensätze. Die einzelnen Daten wie auch die  Datensätze müssen mit einem Trennzeichen versehen werden. Hier bietet sich das Semikolon an, da andere Zeichen wie das Leerzeichen oder das Komma im normalen Text vorkommen können. Falsch verwendete Trennzeichen sind häufig eine Ursache von Problemen in der Datenqualität.
  • Der Fußbereich ist für betriebliche Metadaten vorgesehen. Hier können Checksummen, aber auch die 'Anzahl von Datensätzen in der Datei' geschrieben werden. Mithilfe dieser Informationen kann nachgeprüft werden, ob alle Daten übertragen wurden.