Data Mining Problembereiche


Durch die Anwendung von Data Mining Tools kommen einige Probleme auf die Entwickler und Anwender zu. Da das Konzept des Data Mining in der ursprünglichen Fassung visionär ist, konnten aus heutiger Sicht die Anforderungen an die Datenmustererkennung nur zum Teil gelöst werden.99 Hierzu zählen Probleme wie Autonomie, Datenproblematik, Verständlich­keit, Sicherheit und Interessantheit.

Zu den Problemen der Autonomie zählt vor allem die Begriffsabgrenzung. Bei der Diskussion dieses Problems sehen Hagedorn, Bissantz und Mertens100 zwei Richtungen. Einige Autoren verstehen unter Data Mining einen regelkreisähnlichen Prozeß, der mit einer Hypothese des Anwenders beginnt und abhängig von den Zwischenergebnissen bis zum befriedigendem Re­sultat verfeinert wird. Andere Autoren sehen in dem Prozeß keine vorher definierten Hypothe­sen der Anwender, sondern es sollte nach eher allgemein formulierten Auffälligkeiten gesucht werden, die dann durch das Data Mining System in Form von Regeln oder Aussagen präsen­tiert werden.101

Ein weiteres Problem wird in der Datenproblematik gesehen. Dies sind meist Probleme, die in der heterogen Umgebung der Informationssysteme liegen. Dabei treten Probleme wie Inkonsi­stenzen, Datenredundanzen, Unvollständigkeiten sowie Integrationsprobleme auf der konzep­tionellen Ebene (Detaillierungs-, Bezeichnungskonflikte, usw.) auf.

Des weiteren müssen die präsentierten Informationen in einer verständlichen Form mit einer angegebenen Sicherheit bzw. Wahrscheinlichkeit ausgegeben werden. Die gefunden Informationen müssen vor allem für den Benutzer relevant sein. Es sollen keine unnützen, bedeutungslosen, trivialen und schon bekannten Informationen generiert werden.

Einige dieser Probleme wie die der Datenproblematik und der Interessantheit können durch eine gut aufbereitete Datenbasis minimiert werden. Hierzu trägt das Konzept des Data Ware­house bei, in dem Daten vor allem themenorientiert aufbereitet werden. Dadurch werden nur nützliche anwendungsorientierte Daten aus den operativen DBS herausselektiert, aufbereitet und verwaltet. Außerdem erreicht man durch das Konzept des Data Warehouse eine konsistente und voll integrierte Datenbasis, mit der einige Probleme des Data Mining gelöst werden. Ein wichtiger Punkt dabei ist jedoch eine vollständige Datenmodellierung, die den Anforderungen der AIS standhält.


99 Vgl.: Hagedorn J. / Bissantz N. / Mertens P. (1997), S. 602

100 Vgl.: Hagedorn J. / Bissantz N. / Mertens P. (1997), S. 602

101 Vgl.: Hagedorn J. / Bissantz N. / Mertens P. (1997), S. 602; Gebhardt, F. (1994), S. 9-15