Learning from Data

Data Preprocessing

Data Preprocessing bedeutet die richtigen Daten auszuwählen, Daten zu bereinigen und zur Weiterverarbeitung im geeigneten Format bereit zu stellen. In diesem Data-Preprocessing werden u.a. fehlende Werte ergänzt (Interpolation) und Ausreißer identifiziert. Ergebnis des Preprocessings ist eine bereinigte Datengrundlage - die Basis für eine nachhaltige Lösung.

Data Mining - Machine Learning

Eine erste Exploration der Daten erfolgt mittels einer deskriptiven Analyse. Graphiken wie Histogramme, Scatterplots, Box Plots und Run Charts zeigen wesentliche Strukturen an, z. B. Abhängigkeiten, Einflussgrößen, Trend, saisonale Schwankung. Die Erkenntnisse der explorativen Studie werden durch quantitative Verfahren erweitert, vertieft und methodisch erhärtet. Algorithmen des Unsupervised Learning (Data Mining) erkennen Muster in Daten. Bereits erkannte Zusammenhänge werden durch Verfahren des Supervised Learning (Machine Learning) exakt quantifiziert und für Prognosen oder optimale Entscheidungen nutzbar gemacht.