Data Mining

Der englische Begriff Data Mining bedeutet in seiner Übersetzung so viel wie "Daten schürfen oder abbauen" was jedoch nicht bedeutet, Daten zu sammeln, sondern aus einer bestehenden Datengrundlage aussagekräftige Informationen zu gewinnen.

Die Erhebung der Daten an sich ist ein vorgelagerter Prozess und nicht Bestandteil des Data Mining.

Grundannahme ist, dass es sich beim Data Mining stets um eine sehr große Datenmenge handelt, die nicht mehr mit einfachen analytischen Methoden analysiert werden können.

Die Analyse kann jedoch mithilfe komplexer statistischer Methoden und Tools erreicht werden, die exakt auf den jeweiligen Anwendungszweck hin abgestimmt sind, um beispielsweise über einen bestimmten Zeitraum Trends oder Korrelationen zu identifizieren.

Grundlage aller Einsatzgebiete ist es, dass es sich in der Regel um sehr große Mengen an Daten (oft fällt in diesem Zusammenhang der Begriff "Big Data") handelt, die in die umfassende computergestützte Analyse einbezogen werden. Häufige Felder, in denen das Data Mining zum Einsatz kommt, sind das Web (zum Beispiel mit Analysen zu Aktivitäten in sozialen Netzwerken oder dem Verhalten von Nutzern), der Bereich Finanzen, der Vertrieb sowie das Marketing. Hier kann durch Data Mining beispielsweise explizit herausgearbeitet werden, wie Kunden auf spezielle Werbeaktionen reagieren, welche Zielgruppen auf welche Art und Weise am besten angesprochen werden können, und welche Nachfrage von relevanten Kunden im Hinblick auf spezielle Produkte und deren Preis zu erwarten ist.

Zudem ist Data Mining häufig auch eine wichtige Grundlage in Bezug auf die Gestaltung der Kundenbeziehungen eines Unternehmens. Dies ergibt sich aus der Tatsache, dass ein Customer Relationship Management nicht selten auf Basis eines professionellen Data Mining aufgebaut wird. Hier können wichtige Erkenntnisse aus dem Kaufverhalten von Kunden (z.B. bei Online Shops) gezogen werden.

Ein weiterer Aspekt von Data Mining ist die Identifizierung und Eliminierung von Sonderfällen, die ggf. Rückschlüsse verfälschen. Diese „Ausreißer“ sind Datensätze, die von den anderen Datenbeständen deutlich abweichen. Auch diese können durch Data Mining erkannt und deren Ursachen analysiert werden.

Oft sollen große Datenbestände im Sinne einer größeren Aussagekraft und Anschaulichkeit professionell visualisiert werden. Auch hierzu kann Data Mining einen wichtigen Beitrag leisten, indem der Prozess der Visualisierung etwa durch das Gewinnen von repräsentativen Stichproben schneller, komfortabler und kostengünstiger abgebildet werden kann.

Ein besonderer Aspekt im Data Mining ist die Konformität zu bestehenden Gesetzen, insbesondere zum Datenschutz und der Auswertung personenbezogener Informationen. Dies ist vor allem im Hinblick auf die DSGVO und das Bundesdatenschutzgesetz bedeutsam.

Für ein hochwertiges und zielführendes Data Mining befinden sich zahlreiche Produkte am Markt, beispielsweise Alteryx, RapidMiner und SAS.

Weitere Informationen

  • Kategorie: Glossar
  • Thema: Business Intelligence & Analytics