Data Mining stellt eine Synthese aus der Statistik und Informatik dar. Explizit kommen hier statistische Verfahren zur Anwendung um Wissen aus großen Datenmengen - Big Data - zu generieren. Man unterscheidet im Wesentlichen zwischen zwei Anwendungsbereichen:

Im "Unsupervised Learning" wird versucht, Muster/Strukturen in großen Datenmengen zu finden. Das ist vielen Bereichen hilfreich. So kann man basierend auf den gewonnenen Erkenntnissen Geschäftsentscheidungen treffen - wie es im Bereich Business Intelligence (BI) geschieht - oder es wird nach Auffälligkeiten in medizinischen Daten geforscht um Risikofaktoren zu entdecken.

Auch das "Supervised Learning" findet Anwendung im BI-Umfeld. Hier wird versucht, möglichst präzise Prognosen zu generieren. Diese können dann Entscheidungen im Rahmen von Business Intelligence beeinflussen oder auch direkt praktische Probleme lösen, wie z.B. Texterkennung (OCR). Typische Verfahren, die hier zur Anwendung kommen, sind z.B. Entscheidungsbäume (CART, MARS), Neuronale Netze und Ensemble-Modelle. 

Data Mining Tools

Auch wenn sich die Wissenschaft des Data Minings zum Teil aus der Statistik entwickelt hat, so stoßen viele Statistik-Programme hier an ihre Grenzen. Die meisten Data Mining/Business Intelligence-Tools sind eigenständige Programme, die in der Regel die Beiden für die Business Intelligence wichtigen Anwendungen - Mustererkennung und Prognose - beherrschen. Speziell zur Visualisierung von Prozessen und großen Datenmengen eignen sich Programme, wie AllClear ganz hervorragend.

Natürlich gibt es aber auch Ausnahmen von der Regel. Im Zuge der immer größeren Relevanz von BI-Themen bieten die wichtigsten Statistik-Tools (z.B. SPSS, SAS, R) inzwischen auch Ableger oder Zusatzmodule um die Fragestellungen des Data Mining beantworten zu können.

Business Intelligence

Business Intelligence (BI) ist ein Oberbegriff für das systematische Sammeln, Aufbereiten und Analysieren von Daten. Ziel von Business Intelligence ist es mit der gewonnenen Information Geschäftsprozesses zu optimieren um dadurch Qualität zu Verbessern, Kosten zu minimieren oder Risiken zu senken. Größte Stütze sind dabei vielfältige Werkzeuge, die den BI-Prozess unterstützen und in die Vorhandene Softwarelandschaft integrieren.

Interessante Produkte zum Thema

CART - Basic

Treffen Sie die richtige Entscheidung mit CART! Big Data auswerten und Ihre relevanten Daten erfassen. Data Mining mit CART: einfach, schnell, ...

zum Produkt

Alle Artikel der Kategorie "Data Mining"

Data Mining Software

Data Mining Software zeichnet sich durch die Fähigkeit aus auch mit großen Datenmengen (Big Data) umgehen zu können.

zur Kategorie