Einführung in das Data Mining und die prädiktive Analyse mit RapidMiner
nicht mehr verfügbar
Classroom Schulung | Deutsch | Anspruch
Schulungsdauer: 2 Tage
Ziele
In diesem Seminar erhalten Sie einen kompakten Einblick in die Basics des Data Mining und in die Anwendung RapidMiner.
Zielgruppe
Administratoren, Analysten, Anwender und Entwickler
Voraussetzungen
Basics im Data Mining und Mathematik
Agenda
Überblick
- Business Cases
- Kursüberblick
- Laden neuer Daten
Erste Schritte mit RapidMiner
- Datentypen
- Datenhierarchie
- Schnellauswertung
- Datenvisualisierung
- Charts
- Normalisierung und Standardisierung
- Grund-Transformationen der Werttypen
- Umgang mit fehlenden Werten
- Problem
- Filtern von Beispielen und Attributen
- Organisierung
- Umbenennung
- Relative Pfade
- Flow Control
EDA
- Mulitple Quellen
- Neue Attribute
- Schema Beziehungen
Datenaufbereitung
- Joins
- Aggregation
- Multi-level Aggregation
- Pivot
- Kalkulierte Werte
- Reguläre Ausdrücke
- Änderung der Werttypen
- Data-Balancing
- Abweichungen erkennen
- Feature Selektion
- Dimensionsreduktion
Vorhersagensmodelle
- SVM
- k-Means Clustering
- Neuronale Netze
- Logistische Regression
- Meta Learning
Modell Evaluation
- Fortgeschrittene Performance Kriterien
- ROC plots
- Modellvergleich
- Lift Chart
- Signifikanztests
- Validierung der Vorverarbeitung und Vorverarbeitungsmodelle
- Logging Ergebnisse
Bereitstellung
- Teilen von Daten, Models und Prozessen
- Prozesse als Web Service exportieren
- Grundlagen der Reporterstellung
- Prozesse und Dienste verwalten
Ziele
In diesem Seminar erhalten Sie einen kompakten Einblick in die Basics des Data Mining und in die Anwendung RapidMiner.
Zielgruppe
Administratoren, Analysten, Anwender und Entwickler
Voraussetzungen
Basics im Data Mining und Mathematik
Agenda
Überblick
- Business Cases
- Kursüberblick
- Laden neuer Daten
Erste Schritte mit RapidMiner
- Datentypen
- Datenhierarchie
- Schnellauswertung
- Datenvisualisierung
- Charts
- Normalisierung und Standardisierung
- Grund-Transformationen der Werttypen
- Umgang mit fehlenden Werten
- Problem
- Filtern von Beispielen und Attributen
- Organisierung
- Umbenennung
- Relative Pfade
- Flow Control
EDA
- Mulitple Quellen
- Neue Attribute
- Schema Beziehungen
Datenaufbereitung
- Joins
- Aggregation
- Multi-level Aggregation
- Pivot
- Kalkulierte Werte
- Reguläre Ausdrücke
- Änderung der Werttypen
- Data-Balancing
- Abweichungen erkennen
- Feature Selektion
- Dimensionsreduktion
Vorhersagensmodelle
- SVM
- k-Means Clustering
- Neuronale Netze
- Logistische Regression
- Meta Learning
Modell Evaluation
- Fortgeschrittene Performance Kriterien
- ROC plots
- Modellvergleich
- Lift Chart
- Signifikanztests
- Validierung der Vorverarbeitung und Vorverarbeitungsmodelle
- Logging Ergebnisse
Bereitstellung
- Teilen von Daten, Models und Prozessen
- Prozesse als Web Service exportieren
- Grundlagen der Reporterstellung
- Prozesse und Dienste verwalten