Big Data Analytics with RapidMiner Radoop
Classroom Schulung | Deutsch | Anspruch
Schulungsdauer: 2 Tage
Ziele
In diesem Seminar erlernen die Teilnehmer riesige Datenerfassungen wirksam einzusetzen, indem Sie mit RapidMiner Radoop Rohdaten in wertvolle Informationen umwandeln. RapidMiner Radoop bietet ETL, Analytik und Visualisierung in einem einzigen Paket und lässt sich nahtlos in neue und bestehende RapidMiner-Prozesse einbinden, um die Analytik in Ihren Hadoop-Clustern zu integrieren.
Zielgruppe
- Advanced Analysts
- Data Scientists
Voraussetzungen
- Grundkenntnisse in Computerprogrammen und Mathematik
- RapidMiner & DataScience: Foundations
- RapidMiner & DataScience: Advanced
- RapidMiner Server: Bereitstellung und Web-Applikationen
Agenda
Was ist Big Data?
Wie passt Big Data in die moderne Analytik?
Einführung in Hadoop
- Distributionen
- Allgemeine Infrastruktur
Hadoop-Integration mit RapidMiner: Radoop
Einführung in Radoop GUI
Verbindung zu einem Hadoop Cluster herstellen
Datenexploration
- Durchsuchen von Tabellen
- Anzeigen von Statistiken und hochrangigen Informationen
Datenextraktion und Laden von Daten
- Formulierung von Abfragen
- Daten in Hadoop übertragen
Integration von In-Cluster-Analysen in RapidMiner-Prozesse
- Modellierungsalgorithmen
- Natürliche Aggregation
- In-Memory-Training, In-Hadoop-Scoring
Jenseits der natürlichen Aggregation
- Chunking
- Voting
- In-Hadoop-Modeling
- Clustering
Ziele
In diesem Seminar erlernen die Teilnehmer riesige Datenerfassungen wirksam einzusetzen, indem Sie mit RapidMiner Radoop Rohdaten in wertvolle Informationen umwandeln. RapidMiner Radoop bietet ETL, Analytik und Visualisierung in einem einzigen Paket und lässt sich nahtlos in neue und bestehende RapidMiner-Prozesse einbinden, um die Analytik in Ihren Hadoop-Clustern zu integrieren.
Zielgruppe
- Advanced Analysts
- Data Scientists
Voraussetzungen
- Grundkenntnisse in Computerprogrammen und Mathematik
- RapidMiner & DataScience: Foundations
- RapidMiner & DataScience: Advanced
- RapidMiner Server: Bereitstellung und Web-Applikationen
Agenda
Was ist Big Data?
Wie passt Big Data in die moderne Analytik?
Einführung in Hadoop
- Distributionen
- Allgemeine Infrastruktur
Hadoop-Integration mit RapidMiner: Radoop
Einführung in Radoop GUI
Verbindung zu einem Hadoop Cluster herstellen
Datenexploration
- Durchsuchen von Tabellen
- Anzeigen von Statistiken und hochrangigen Informationen
Datenextraktion und Laden von Daten
- Formulierung von Abfragen
- Daten in Hadoop übertragen
Integration von In-Cluster-Analysen in RapidMiner-Prozesse
- Modellierungsalgorithmen
- Natürliche Aggregation
- In-Memory-Training, In-Hadoop-Scoring
Jenseits der natürlichen Aggregation
- Chunking
- Voting
- In-Hadoop-Modeling
- Clustering