Einführung in das Data Mining und die prädiktive Analyse mit RapidMiner

No longer available

Classroom training | German | Claim

Duration of training: 2 days

Objectives

In diesem Seminar erhalten Sie einen kompakten Einblick in die Basics des Data Mining und in die Anwendung RapidMiner.

Target audience

Administratoren, Analysten, Anwender und Entwickler

Requirements

Basics im Data Mining und Mathematik

Agenda

Überblick

  • Business Cases
  • Kursüberblick
  • Laden neuer Daten

Erste Schritte mit RapidMiner

  • Datentypen
  • Datenhierarchie
  • Schnellauswertung
  • Datenvisualisierung
  • Charts
  • Normalisierung und Standardisierung
  • Grund-Transformationen der Werttypen
  • Umgang mit fehlenden Werten
  • Problem
  • Filtern von Beispielen und Attributen
  • Organisierung
  • Umbenennung
  • Relative Pfade
  • Flow Control

EDA

  • Mulitple Quellen
  • Neue Attribute
  • Schema Beziehungen

Datenaufbereitung

  • Joins
  • Aggregation
  • Multi-level Aggregation
  • Pivot
  • Kalkulierte Werte
  • Reguläre Ausdrücke
  • Änderung der Werttypen
  • Data-Balancing
  • Abweichungen erkennen
  • Feature Selektion
  • Dimensionsreduktion

Vorhersagensmodelle

  • SVM
  • k-Means Clustering
  • Neuronale Netze
  • Logistische Regression
  • Meta Learning

Modell Evaluation

  • Fortgeschrittene Performance Kriterien
  • ROC plots
  • Modellvergleich
  • Lift Chart
  • Signifikanztests
  • Validierung der Vorverarbeitung und Vorverarbeitungsmodelle
  • Logging Ergebnisse

Bereitstellung

  • Teilen von Daten, Models und Prozessen
  • Prozesse als Web Service exportieren
  • Grundlagen der Reporterstellung
  • Prozesse und Dienste verwalten

Objectives

In diesem Seminar erhalten Sie einen kompakten Einblick in die Basics des Data Mining und in die Anwendung RapidMiner.

Target audience

Administratoren, Analysten, Anwender und Entwickler

Requirements

Basics im Data Mining und Mathematik

Agenda

Überblick

  • Business Cases
  • Kursüberblick
  • Laden neuer Daten

Erste Schritte mit RapidMiner

  • Datentypen
  • Datenhierarchie
  • Schnellauswertung
  • Datenvisualisierung
  • Charts
  • Normalisierung und Standardisierung
  • Grund-Transformationen der Werttypen
  • Umgang mit fehlenden Werten
  • Problem
  • Filtern von Beispielen und Attributen
  • Organisierung
  • Umbenennung
  • Relative Pfade
  • Flow Control

EDA

  • Mulitple Quellen
  • Neue Attribute
  • Schema Beziehungen

Datenaufbereitung

  • Joins
  • Aggregation
  • Multi-level Aggregation
  • Pivot
  • Kalkulierte Werte
  • Reguläre Ausdrücke
  • Änderung der Werttypen
  • Data-Balancing
  • Abweichungen erkennen
  • Feature Selektion
  • Dimensionsreduktion

Vorhersagensmodelle

  • SVM
  • k-Means Clustering
  • Neuronale Netze
  • Logistische Regression
  • Meta Learning

Modell Evaluation

  • Fortgeschrittene Performance Kriterien
  • ROC plots
  • Modellvergleich
  • Lift Chart
  • Signifikanztests
  • Validierung der Vorverarbeitung und Vorverarbeitungsmodelle
  • Logging Ergebnisse

Bereitstellung

  • Teilen von Daten, Models und Prozessen
  • Prozesse als Web Service exportieren
  • Grundlagen der Reporterstellung
  • Prozesse und Dienste verwalten