Big Data - Definition


Definition Big Data

Unter Big Data wird die Verarbeitung (Datenerfassung, Datentransformation, Datenvisualisierung) extrem großer Datenmengen (z.B. aus Social Media Plattformen) verstanden, bei der insbesondere auch unstrukturierte Daten (Video, Sprache, Zeichen, Bilder, ...) zu strukturierten Daten (Objekte, Attribute, Beziehungen, ...) verarbeitet werden können. Das Ziel von Big Data ist Informationen, Erkenntnisse und Wissen aus den Daten herauszuziehen, um die Steuerung des Unternehmens zu verbessern oder aber neue Geschäftsfelder zu identifizieren.

Die drei V des Big Data von Gartner


Zitat Gartner 2014: Big Data

"Big data is high-volume, high-velocity and high-variety information assets that demand cost-effective, innovative forms of information processing for enhanced insight and decision making."

Quelle: Big Data | Gartner IT Glossary, Januar 2014: http://www.gartner.com/it-glossary/big-data/


Anhand der Definition und Zielrichtung ist kaum ein Unterschied zur Definition von Business Intelligence erkennbar. Bei beiden Begriffen handelt es sich um die Verarbeitung von großen Datenmengen (Big Data 'noch' größere Datenmengen) die erfasst/selektiert, transformiert und visualisiert werden. Bei Big Data sind einige Detaillierungen / Kriterien hinzugekommen, die allerdings durch den Begriff Business Intelligence nicht ausgeschlossen werden:
  • Verarbeitung von Social Media - Datenquellen
    -> Business Intelligence verarbeitet auch externe Datenquellen, Social Media Daten werden nicht ausgeschlossen.

  • Transformation unstrukturierter Daten in strukturierte Daten
    -> ETL-Prozesse transformieren in der Business Intelligence Daten, auch von unstrukturiert in strukturiert.

  • extrem große Datenmengen, hohe Geschwindigkeit
    -> In der Business Intelligence gibt es keinerlei Eisnschränkungen hinsichtlich Datenmengen und hoher Verarbeitungsgeschwindigkeit. Durch datei-orientierte anstatt datenbank-orientierte Verarbeitungsmethoden bei ETL-Prozessen und zusätzlichen Hauptspeicher-Verarbeitungsmethoden können extrem größe Datenmengen sehr schnell verarbeitet werden.

Unbenommen von den Gemeinsamkeiten zwischen Business Intelligence und Big Data werden unter dem Begriff Big Data neue technologische Inovationen wie z.B. NoSQL und In-Memory verstanden, die in der Business Intelligence bisher kaum zum Einsatz kamen. Inweiweit solche 'neue' Technologien einen neuen Begriff wie Big Data benötigen kann bezweifelt werden. Den Software-Lieferanten kann dies durchaus einen wirtschaftlichen Schub geben, ob den Anwenderm / Kunden hierdurch ein Zusatznutzen (Return on Investment) entstehen wird, kann durchaus ernsthaft bezweifelt werden.

weiter siehe: Big Data - Kritik an der Definition