RapidMiner & Data Science: Foundations
Classroom training | German | Claim
Duration of training: 2 days
Objectives
In diesem Seminar befassen sich die Teilnehmer mit Data Mining und Predictive Analytics mit RapidMiner Studio. Dabei werden Sie einen vereinfachten Business-Anwendungsfall erforschen und ein umfassendes Analysemodell erstellen. Zudem erhalten die Seminarteilnehmer einen ersten Einblick in die grafische Benutzeroberfläche sowie die wichtigsten Produktfunktionen.
Target audience
- Analysten
- Data Scientists
Requirements
Grundlegende Computerprogramm- und Mathematikkenntnisse
Agenda
Einführung
- Geschäftsszenario
- Analytik Taxonomie & Hierarchie
- CRISP-DM & Data Mining im Unternehmen
RapidMiner Studio
- Benutzeroberfläche
- Erstellen und Verwalten von RapidMiner-Repositories
- Operatoren und Prozesse
- Speichern von Daten, Prozessen und Ergebnismengen
EDA: Exploratory Data Analysis
- Laden von Daten
- Kurzfassung der Statistik
- Visualisierung von Daten & Basisdiagrammen
Datenaufbereitung
- Basic Data ETL (Extract, Transform, and Load)
- Datentypen & Transformationen von Werttypen
- Behandlung fehlender Werte
- Behandlung von Attribut-Rollen
- Filterung von Beispielen und Attributen
- Normalisierung und Standardisierung
Entwicklung besserer Prozesse
- Organisieren, Umbenennen und relative Pfade
- Teilprozesse
- Building Blocks
- Breakpoints
Predictive Modeling Algorithms
- k-Nächster Nachbar
- Naïve Bayes
- Lineare Regression
- Entscheidungsbäume & Regeln
Modellbau und -bewertung
- Machine Learning Theory: Vorurteile, Abweichungen, Overfitting & Underfitting
- Datenaufteilung
- Split- und Cross-Validierung
- Bewertungsmethoden & Leistungskriterien
- Optimierung und Parametereinstellung
- Anwenden von Modellen
Zusätzliche Workshops
- Ausreißererkennung
- Random Forests
- Ensemble-Modellierung
Objectives
In diesem Seminar befassen sich die Teilnehmer mit Data Mining und Predictive Analytics mit RapidMiner Studio. Dabei werden Sie einen vereinfachten Business-Anwendungsfall erforschen und ein umfassendes Analysemodell erstellen. Zudem erhalten die Seminarteilnehmer einen ersten Einblick in die grafische Benutzeroberfläche sowie die wichtigsten Produktfunktionen.
Target audience
- Analysten
- Data Scientists
Requirements
Grundlegende Computerprogramm- und Mathematikkenntnisse
Agenda
Einführung
- Geschäftsszenario
- Analytik Taxonomie & Hierarchie
- CRISP-DM & Data Mining im Unternehmen
RapidMiner Studio
- Benutzeroberfläche
- Erstellen und Verwalten von RapidMiner-Repositories
- Operatoren und Prozesse
- Speichern von Daten, Prozessen und Ergebnismengen
EDA: Exploratory Data Analysis
- Laden von Daten
- Kurzfassung der Statistik
- Visualisierung von Daten & Basisdiagrammen
Datenaufbereitung
- Basic Data ETL (Extract, Transform, and Load)
- Datentypen & Transformationen von Werttypen
- Behandlung fehlender Werte
- Behandlung von Attribut-Rollen
- Filterung von Beispielen und Attributen
- Normalisierung und Standardisierung
Entwicklung besserer Prozesse
- Organisieren, Umbenennen und relative Pfade
- Teilprozesse
- Building Blocks
- Breakpoints
Predictive Modeling Algorithms
- k-Nächster Nachbar
- Naïve Bayes
- Lineare Regression
- Entscheidungsbäume & Regeln
Modellbau und -bewertung
- Machine Learning Theory: Vorurteile, Abweichungen, Overfitting & Underfitting
- Datenaufteilung
- Split- und Cross-Validierung
- Bewertungsmethoden & Leistungskriterien
- Optimierung und Parametereinstellung
- Anwenden von Modellen
Zusätzliche Workshops
- Ausreißererkennung
- Random Forests
- Ensemble-Modellierung