Einführung in das Data Mining und die prädiktive Analyse mit RapidMiner

Classroom Schulung | deutsch | Anspruch

Schulungsdauer: 2 Tage

Ziele

In diesem Seminar erhalten Sie einen kompakten Einblick in die Basics des Data Mining und in die Anwendung RapidMiner.

Zielgruppe

Administratoren, Analysten, Anwender und Entwickler

Voraussetzungen

Basics im Data Mining und Mathematik

Agenda

Überblick

  • Business Cases
  • Kursüberblick
  • Laden neuer Daten

Erste Schritte mit RapidMiner

  • Datentypen
  • Datenhierarchie
  • Schnellauswertung
  • Datenvisualisierung
  • Charts
  • Normalisierung und Standardisierung
  • Grund-Transformationen der Werttypen
  • Umgang mit fehlenden Werten
  • Problem
  • Filtern von Beispielen und Attributen
  • Organisierung
  • Umbenennung
  • Relative Pfade
  • Flow Control

EDA

  • Mulitple Quellen
  • Neue Attribute
  • Schema Beziehungen

Datenaufbereitung

  • Joins
  • Aggregation
  • Multi-level Aggregation
  • Pivot
  • Kalkulierte Werte
  • Reguläre Ausdrücke
  • Änderung der Werttypen
  • Data-Balancing
  • Abweichungen erkennen
  • Feature Selektion
  • Dimensionsreduktion

Vorhersagensmodelle

  • SVM
  • k-Means Clustering
  • Neuronale Netze
  • Logistische Regression
  • Meta Learning

Modell Evaluation

  • Fortgeschrittene Performance Kriterien
  • ROC plots
  • Modellvergleich
  • Lift Chart
  • Signifikanztests
  • Validierung der Vorverarbeitung und Vorverarbeitungsmodelle
  • Logging Ergebnisse

Bereitstellung

  • Teilen von Daten, Models und Prozessen
  • Prozesse als Web Service exportieren
  • Grundlagen der Reporterstellung
  • Prozesse und Dienste verwalten

Ziele

In diesem Seminar erhalten Sie einen kompakten Einblick in die Basics des Data Mining und in die Anwendung RapidMiner.

Zielgruppe

Administratoren, Analysten, Anwender und Entwickler

Voraussetzungen

Basics im Data Mining und Mathematik

Agenda

Überblick

  • Business Cases
  • Kursüberblick
  • Laden neuer Daten

Erste Schritte mit RapidMiner

  • Datentypen
  • Datenhierarchie
  • Schnellauswertung
  • Datenvisualisierung
  • Charts
  • Normalisierung und Standardisierung
  • Grund-Transformationen der Werttypen
  • Umgang mit fehlenden Werten
  • Problem
  • Filtern von Beispielen und Attributen
  • Organisierung
  • Umbenennung
  • Relative Pfade
  • Flow Control

EDA

  • Mulitple Quellen
  • Neue Attribute
  • Schema Beziehungen

Datenaufbereitung

  • Joins
  • Aggregation
  • Multi-level Aggregation
  • Pivot
  • Kalkulierte Werte
  • Reguläre Ausdrücke
  • Änderung der Werttypen
  • Data-Balancing
  • Abweichungen erkennen
  • Feature Selektion
  • Dimensionsreduktion

Vorhersagensmodelle

  • SVM
  • k-Means Clustering
  • Neuronale Netze
  • Logistische Regression
  • Meta Learning

Modell Evaluation

  • Fortgeschrittene Performance Kriterien
  • ROC plots
  • Modellvergleich
  • Lift Chart
  • Signifikanztests
  • Validierung der Vorverarbeitung und Vorverarbeitungsmodelle
  • Logging Ergebnisse

Bereitstellung

  • Teilen von Daten, Models und Prozessen
  • Prozesse als Web Service exportieren
  • Grundlagen der Reporterstellung
  • Prozesse und Dienste verwalten

Diese Seite weiterempfehlen