RapidMiner & Data Science: Foundations

Classroom Schulung | deutsch | Anspruch

Schulungsdauer: 2 Tage

Ziele

In diesem Seminar befassen sich die Teilnehmer mit Data Mining und Predictive Analytics mit RapidMiner Studio. Dabei werden Sie einen vereinfachten Business-Anwendungsfall erforschen und ein umfassendes Analysemodell erstellen. Zudem erhalten die Seminarteilnehmer einen ersten Einblick in die grafische Benutzeroberfläche sowie die wichtigsten Produktfunktionen.

Zielgruppe

  • Analysten
  • Data Scientists

Voraussetzungen

Grundlegende Computerprogramm- und Mathematikkenntnisse

Agenda

Einführung

  • Geschäftsszenario
  • Analytik Taxonomie & Hierarchie
  • CRISP-DM & Data Mining im Unternehmen

RapidMiner Studio

  • Benutzeroberfläche
  • Erstellen und Verwalten von RapidMiner-Repositories
  • Operatoren und Prozesse
  • Speichern von Daten, Prozessen und Ergebnismengen

EDA: Exploratory Data Analysis

  • Laden von Daten
  • Kurzfassung der Statistik
  • Visualisierung von Daten & Basisdiagrammen

Datenaufbereitung

  • Basic Data ETL (Extract, Transform, and Load)
  • Datentypen & Transformationen von Werttypen
  • Behandlung fehlender Werte
  • Behandlung von Attribut-Rollen
  • Filterung von Beispielen und Attributen
  • Normalisierung und Standardisierung

Entwicklung besserer Prozesse

  • Organisieren, Umbenennen und relative Pfade
  • Teilprozesse
  • Building Blocks
  • Breakpoints

Predictive Modeling Algorithms

  • k-Nächster Nachbar
  • Naïve Bayes
  • Lineare Regression
  • Entscheidungsbäume & Regeln

Modellbau und -bewertung

  • Machine Learning Theory: Vorurteile, Abweichungen, Overfitting & Underfitting
  • Datenaufteilung
  • Split- und Cross-Validierung
  • Bewertungsmethoden & Leistungskriterien
  • Optimierung und Parametereinstellung
  • Anwenden von Modellen

Zusätzliche Workshops

  • Ausreißererkennung
  • Random Forests
  • Ensemble-Modellierung

Ziele

In diesem Seminar befassen sich die Teilnehmer mit Data Mining und Predictive Analytics mit RapidMiner Studio. Dabei werden Sie einen vereinfachten Business-Anwendungsfall erforschen und ein umfassendes Analysemodell erstellen. Zudem erhalten die Seminarteilnehmer einen ersten Einblick in die grafische Benutzeroberfläche sowie die wichtigsten Produktfunktionen.

Zielgruppe

  • Analysten
  • Data Scientists

Voraussetzungen

Grundlegende Computerprogramm- und Mathematikkenntnisse

Agenda

Einführung

  • Geschäftsszenario
  • Analytik Taxonomie & Hierarchie
  • CRISP-DM & Data Mining im Unternehmen

RapidMiner Studio

  • Benutzeroberfläche
  • Erstellen und Verwalten von RapidMiner-Repositories
  • Operatoren und Prozesse
  • Speichern von Daten, Prozessen und Ergebnismengen

EDA: Exploratory Data Analysis

  • Laden von Daten
  • Kurzfassung der Statistik
  • Visualisierung von Daten & Basisdiagrammen

Datenaufbereitung

  • Basic Data ETL (Extract, Transform, and Load)
  • Datentypen & Transformationen von Werttypen
  • Behandlung fehlender Werte
  • Behandlung von Attribut-Rollen
  • Filterung von Beispielen und Attributen
  • Normalisierung und Standardisierung

Entwicklung besserer Prozesse

  • Organisieren, Umbenennen und relative Pfade
  • Teilprozesse
  • Building Blocks
  • Breakpoints

Predictive Modeling Algorithms

  • k-Nächster Nachbar
  • Naïve Bayes
  • Lineare Regression
  • Entscheidungsbäume & Regeln

Modellbau und -bewertung

  • Machine Learning Theory: Vorurteile, Abweichungen, Overfitting & Underfitting
  • Datenaufteilung
  • Split- und Cross-Validierung
  • Bewertungsmethoden & Leistungskriterien
  • Optimierung und Parametereinstellung
  • Anwenden von Modellen

Zusätzliche Workshops

  • Ausreißererkennung
  • Random Forests
  • Ensemble-Modellierung

Tags

Diese Seite weiterempfehlen