Einführung in das Data Mining und die prädiktive Analyse mit RapidMiner

No longer available

Classroom training | German | Claim

Duration of training: 2 days

Objectives

In diesem Seminar erhalten Sie einen kompakten Einblick in die Basics des Data Mining und in die Anwendung RapidMiner.

Target audience

Administratoren, Analysten, Anwender und Entwickler

Requirements

Basics im Data Mining und Mathematik

Agenda

Überblick

Business Cases
Kursüberblick
Laden neuer Daten

Erste Schritte mit RapidMiner

Datentypen
Datenhierarchie
Schnellauswertung
Datenvisualisierung
Charts
Normalisierung und Standardisierung
Grund-Transformationen der Werttypen
Umgang mit fehlenden Werten
Problem
Filtern von Beispielen und Attributen
Organisierung
Umbenennung
Relative Pfade
Flow Control

EDA

Mulitple Quellen
Neue Attribute
Schema Beziehungen

Datenaufbereitung

Joins
Aggregation
Multi-level Aggregation
Pivot
Kalkulierte Werte
Reguläre Ausdrücke
Änderung der Werttypen
Data-Balancing
Abweichungen erkennen
Feature Selektion
Dimensionsreduktion

Vorhersagensmodelle

SVM
k-Means Clustering
Neuronale Netze
Logistische Regression
Meta Learning

Modell Evaluation

Fortgeschrittene Performance Kriterien
ROC plots
Modellvergleich
Lift Chart
Signifikanztests
Validierung der Vorverarbeitung und Vorverarbeitungsmodelle
Logging Ergebnisse

Bereitstellung

Teilen von Daten, Models und Prozessen
Prozesse als Web Service exportieren
Grundlagen der Reporterstellung
Prozesse und Dienste verwalten

Objectives

In diesem Seminar erhalten Sie einen kompakten Einblick in die Basics des Data Mining und in die Anwendung RapidMiner.

Target audience

Administratoren, Analysten, Anwender und Entwickler

Requirements

Basics im Data Mining und Mathematik

Agenda

Überblick

Business Cases
Kursüberblick
Laden neuer Daten

Erste Schritte mit RapidMiner

Datentypen
Datenhierarchie
Schnellauswertung
Datenvisualisierung
Charts
Normalisierung und Standardisierung
Grund-Transformationen der Werttypen
Umgang mit fehlenden Werten
Problem
Filtern von Beispielen und Attributen
Organisierung
Umbenennung
Relative Pfade
Flow Control

EDA

Mulitple Quellen
Neue Attribute
Schema Beziehungen

Datenaufbereitung

Joins
Aggregation
Multi-level Aggregation
Pivot
Kalkulierte Werte
Reguläre Ausdrücke
Änderung der Werttypen
Data-Balancing
Abweichungen erkennen
Feature Selektion
Dimensionsreduktion

Vorhersagensmodelle

SVM
k-Means Clustering
Neuronale Netze
Logistische Regression
Meta Learning

Modell Evaluation

Fortgeschrittene Performance Kriterien
ROC plots
Modellvergleich
Lift Chart
Signifikanztests
Validierung der Vorverarbeitung und Vorverarbeitungsmodelle
Logging Ergebnisse

Bereitstellung

Teilen von Daten, Models und Prozessen
Prozesse als Web Service exportieren
Grundlagen der Reporterstellung
Prozesse und Dienste verwalten