RapidMiner & Data Science: Advanced
Classroom Schulung | Deutsch | Anspruch
Schulungsdauer: 2 Tage
Ziele
In diesem Seminar befassen sich die Teilnehmer schwerpunktmäßig mit Data Mining und Predictive Analytics mit RapidMiner Studio. Das Seminar vertieft die Inhalt von "RapidMiner & DataScience: Foundations" und zeigt den Teilnehmern auf, wie Sie ein ausgefeilteres Analysemodell erstellen und gleichzeitig ihr Wissen über die grafische Benutzeroberfläche sowie alle wichtigen Produktfunktionen vertiefen.
Zielgruppe
- Fortgeschrittene Analysten
- Data Scientists
Voraussetzungen
- Grundlegende Computerprogramm- und Mathematikkenntnisse
- RapidMiner & DataScience: Foundations
Agenda
EDA: Exploratory Data Analysis
- Mehrere Quellen
- Joins & Set Theory
- Neue Attribute verstehen
Datenaufbereitung
- Erweiterte Daten-ETL (Extract, Transform, and Load)
- Aggregation & mehrstufige Aggregation
- Pivot & De-Pivot
- Berechnete Werte
- Reguläre Ausdrücke
- Werttypen ändern
- Feature-Generierung und Feature-Engineering
- Loops
- Makros
Predictive Modeling Algorithms
- Unterstützung von Vektor-Maschinen
- Neuronale Netze
- Logistische Regression
Modellbau und -bewertung
- Erweiterte Leistungskriterien
- ROC-Plots
- Gegenüberstellung von Modellen
- Sampling
- Gewichtung
- Auswahl der Merkmale: Forward Selection
- Auswahl der Merkmale: Backward Elimination
- Validierung der Vorverarbeitung und von Vorverarbeitungsmodellen
- Optimierung & Protokollierung der Ergebnisse
Zusätzliche Workshops
- Analyse der Hauptkomponenten
- Logistische Regression
- Performance (Cost) Model Optimization
Ziele
In diesem Seminar befassen sich die Teilnehmer schwerpunktmäßig mit Data Mining und Predictive Analytics mit RapidMiner Studio. Das Seminar vertieft die Inhalt von "RapidMiner & DataScience: Foundations" und zeigt den Teilnehmern auf, wie Sie ein ausgefeilteres Analysemodell erstellen und gleichzeitig ihr Wissen über die grafische Benutzeroberfläche sowie alle wichtigen Produktfunktionen vertiefen.
Zielgruppe
- Fortgeschrittene Analysten
- Data Scientists
Voraussetzungen
- Grundlegende Computerprogramm- und Mathematikkenntnisse
- RapidMiner & DataScience: Foundations
Agenda
EDA: Exploratory Data Analysis
- Mehrere Quellen
- Joins & Set Theory
- Neue Attribute verstehen
Datenaufbereitung
- Erweiterte Daten-ETL (Extract, Transform, and Load)
- Aggregation & mehrstufige Aggregation
- Pivot & De-Pivot
- Berechnete Werte
- Reguläre Ausdrücke
- Werttypen ändern
- Feature-Generierung und Feature-Engineering
- Loops
- Makros
Predictive Modeling Algorithms
- Unterstützung von Vektor-Maschinen
- Neuronale Netze
- Logistische Regression
Modellbau und -bewertung
- Erweiterte Leistungskriterien
- ROC-Plots
- Gegenüberstellung von Modellen
- Sampling
- Gewichtung
- Auswahl der Merkmale: Forward Selection
- Auswahl der Merkmale: Backward Elimination
- Validierung der Vorverarbeitung und von Vorverarbeitungsmodellen
- Optimierung & Protokollierung der Ergebnisse
Zusätzliche Workshops
- Analyse der Hauptkomponenten
- Logistische Regression
- Performance (Cost) Model Optimization