Data Mining


„Trotz der rasanten Fortschritte in der Computertechnologie sind die Möglichkeiten, Daten zu analysieren, weit hinter denen zurückgeblieben, sie zu generieren und zu speichern.“69 Mit der Entwicklung der Informationstechnologien in den letzten Jahren sind auch die Datenmengen gestiegen. So verdoppelt sich die gespeicherte Informationsmenge alle 20 Monate.70 In diesen Datenmengen stecken Zusammenhänge von Daten, die nur schwer aufzuspüren sind. Sei es, daß die Datenpools einen zu großen Umfang haben, oder die Daten für Analysezwecke zu unstrukturiert gespeichert sind. Durch Data Mining soll die Entwicklung der Datenanalyse wieder vorangetrieben werden.

Einige Unternehmen nutzen schon auf dem Markt vorhandene Data Mining Systeme, so z.B. Kreditinstitute, um die Kreditwürdigkeit ihrer Kunden zu überprüfen. Aber auch im Marketing-Bereich oder in der Verbrechensbekämpfung71 werden Data Mining Tools eingesetzt. Allerdings sollte man unter Data Mining nicht das Allheilmittel für alle ungelösten Zusam­menhänge sehen.72 Data Mining ist, wie Datawarehousing, ein kontinuierlicher und iterativer Prozeß und folgt keinesfalls einer magischen Formel.73

Mindestens die Hälfte der sogenannten Fortune-1000-Unternehmen werden nach einer Studie der Gartner Group bis zum Jahre 2000 Data Mining-Technologien nutzen.74 In den folgenden Kapiteln soll deshalb auf das Data Mining näher eingegangen werden.

Definition, Konzept, Anwendungsbereiche des Data Mining

„Data Mining kann als Kernaktivität des umfangreichen Prozesses KDD (Knowledge Discovery in Databases) aufgefaßt werden.“75 Dieser Prozeß hat die Aufgabe, in umfangreichen Datenbeständen implizit vorhandenes Wissen zu finden und explizit zu machen.76 Der Begriff des Data Mining umschließt eine Menge von Technologien, mit deren Hilfe Unternehmen entscheidungsrelevante Informationen aus Datenbanken filtern und analysieren können.77 Data Mining hat die Aufgabe, Datenmuster zu erkennen und sie dem Anwender als interessantes Wissen zu präsentieren.78 Unter einem Datenmuster versteht man die Zusammenhänge zwischen Datensätzen, zwischen einzelnen Feldern der Datensätze, den Daten innerhalb eines Datensatzes sowie bestimmte Regelmäßigkeiten.79

Durch das Konzept des Data Warehouse können die Daten strukturiert und themenorientiert gespeichert werden. Dies ermöglichte auch die schnelle Entwicklung des Data Mining, da hierdurch nicht mehr Probleme der Vollständigkeit und der Konsistenz der Daten gelöst werden müssen. Die Datenmenge ist jedoch noch größer geworden, da im Data Warehouse auch Vergangenheitsdaten und aggregierte Daten gespeichert werden. Aus diesem Grund ist es mit herkömmlichen Tools nicht möglich, in dieser Datenbasis verborgene Zusammenhänge zu finden.

69 Woods, E. (1998), S.16

70 Vgl.: Dilly, Ruth in: http://www-pcc.qub.ac.uk/tec/courses/datamining/stu-notes/dm_book_2.html, S.1

71 Vgl.: Buser, U. (1995), S.30-31

72 Vgl.: Woods, E. (1998), S.17

73 Vgl.: Woods, E. (1998), S.17

74 Vgl.: Data Mining Forum in: www.data-mining.de/mining.htm

75 Chamoni, P. (1998a), S. 303

76 Vgl.: Düsing, Roland (1998), S. 292

77 Vgl.: Data Mining Forum in: www.data-mining.de/mining.htm

78 Vgl.: Hagedorn, J. / Bissantz, N / Mertens P (1997), S.601

79 Vgl.: Hagedorn, J. / Bissantz, N / Mertens P (1997), S.601


(Auszug aus der Diplomarbeit von Ralph Leipert: "Analytische Informationssysteme als Basis des Risikomanagement der Unternehmung")