Einführung in das Data Mining und die prädiktive Analyse mit RapidMiner

nicht mehr verfügbar

Classroom Schulung | Deutsch | Anspruch

Schulungsdauer: 2 Tage

Ziele

In diesem Seminar erhalten Sie einen kompakten Einblick in die Basics des Data Mining und in die Anwendung RapidMiner.

Zielgruppe

Administratoren, Analysten, Anwender und Entwickler

Voraussetzungen

Basics im Data Mining und Mathematik

Agenda

Überblick

Business Cases
Kursüberblick
Laden neuer Daten

Erste Schritte mit RapidMiner

Datentypen
Datenhierarchie
Schnellauswertung
Datenvisualisierung
Charts
Normalisierung und Standardisierung
Grund-Transformationen der Werttypen
Umgang mit fehlenden Werten
Problem
Filtern von Beispielen und Attributen
Organisierung
Umbenennung
Relative Pfade
Flow Control

EDA

Mulitple Quellen
Neue Attribute
Schema Beziehungen

Datenaufbereitung

Joins
Aggregation
Multi-level Aggregation
Pivot
Kalkulierte Werte
Reguläre Ausdrücke
Änderung der Werttypen
Data-Balancing
Abweichungen erkennen
Feature Selektion
Dimensionsreduktion

Vorhersagensmodelle

SVM
k-Means Clustering
Neuronale Netze
Logistische Regression
Meta Learning

Modell Evaluation

Fortgeschrittene Performance Kriterien
ROC plots
Modellvergleich
Lift Chart
Signifikanztests
Validierung der Vorverarbeitung und Vorverarbeitungsmodelle
Logging Ergebnisse

Bereitstellung

Teilen von Daten, Models und Prozessen
Prozesse als Web Service exportieren
Grundlagen der Reporterstellung
Prozesse und Dienste verwalten

Ziele

In diesem Seminar erhalten Sie einen kompakten Einblick in die Basics des Data Mining und in die Anwendung RapidMiner.

Zielgruppe

Administratoren, Analysten, Anwender und Entwickler

Voraussetzungen

Basics im Data Mining und Mathematik

Agenda

Überblick

Business Cases
Kursüberblick
Laden neuer Daten

Erste Schritte mit RapidMiner

Datentypen
Datenhierarchie
Schnellauswertung
Datenvisualisierung
Charts
Normalisierung und Standardisierung
Grund-Transformationen der Werttypen
Umgang mit fehlenden Werten
Problem
Filtern von Beispielen und Attributen
Organisierung
Umbenennung
Relative Pfade
Flow Control

EDA

Mulitple Quellen
Neue Attribute
Schema Beziehungen

Datenaufbereitung

Joins
Aggregation
Multi-level Aggregation
Pivot
Kalkulierte Werte
Reguläre Ausdrücke
Änderung der Werttypen
Data-Balancing
Abweichungen erkennen
Feature Selektion
Dimensionsreduktion

Vorhersagensmodelle

SVM
k-Means Clustering
Neuronale Netze
Logistische Regression
Meta Learning

Modell Evaluation

Fortgeschrittene Performance Kriterien
ROC plots
Modellvergleich
Lift Chart
Signifikanztests
Validierung der Vorverarbeitung und Vorverarbeitungsmodelle
Logging Ergebnisse

Bereitstellung

Teilen von Daten, Models und Prozessen
Prozesse als Web Service exportieren
Grundlagen der Reporterstellung
Prozesse und Dienste verwalten