Big Data Analytics with RapidMiner Radoop

Classroom Schulung | deutsch | Anspruch

Schulungsdauer: 2 Tage

Ziele

In diesem Seminar erlernen die Teilnehmer riesige Datenerfassungen wirksam einzusetzen, indem Sie mit RapidMiner Radoop Rohdaten in wertvolle Informationen umwandeln. RapidMiner Radoop bietet ETL, Analytik und Visualisierung in einem einzigen Paket und lässt sich nahtlos in neue und bestehende RapidMiner-Prozesse einbinden, um die Analytik in Ihren Hadoop-Clustern zu integrieren.

Zielgruppe

  • Advanced Analysts
  • Data Scientists

Voraussetzungen

  • Grundkenntnisse in Computerprogrammen und Mathematik
  • RapidMiner & DataScience: Foundations
  • RapidMiner & DataScience: Advanced
  • RapidMiner Server: Bereitstellung und Web-Applikationen

Agenda

Was ist Big Data?

Wie passt Big Data in die moderne Analytik?

Einführung in Hadoop

  • Distributionen
  • Allgemeine Infrastruktur

Hadoop-Integration mit RapidMiner: Radoop

Einführung in Radoop GUI

Verbindung zu einem Hadoop Cluster herstellen

Datenexploration

  • Durchsuchen von Tabellen
  • Anzeigen von Statistiken und hochrangigen Informationen

Datenextraktion und Laden von Daten

  • Formulierung von Abfragen
  • Daten in Hadoop übertragen

Integration von In-Cluster-Analysen in RapidMiner-Prozesse

  • Modellierungsalgorithmen
  • Natürliche Aggregation
  • In-Memory-Training, In-Hadoop-Scoring

Jenseits der natürlichen Aggregation

  • Chunking
  • Voting
  • In-Hadoop-Modeling
  • Clustering

Ziele

In diesem Seminar erlernen die Teilnehmer riesige Datenerfassungen wirksam einzusetzen, indem Sie mit RapidMiner Radoop Rohdaten in wertvolle Informationen umwandeln. RapidMiner Radoop bietet ETL, Analytik und Visualisierung in einem einzigen Paket und lässt sich nahtlos in neue und bestehende RapidMiner-Prozesse einbinden, um die Analytik in Ihren Hadoop-Clustern zu integrieren.

Zielgruppe

  • Advanced Analysts
  • Data Scientists

Voraussetzungen

  • Grundkenntnisse in Computerprogrammen und Mathematik
  • RapidMiner & DataScience: Foundations
  • RapidMiner & DataScience: Advanced
  • RapidMiner Server: Bereitstellung und Web-Applikationen

Agenda

Was ist Big Data?

Wie passt Big Data in die moderne Analytik?

Einführung in Hadoop

  • Distributionen
  • Allgemeine Infrastruktur

Hadoop-Integration mit RapidMiner: Radoop

Einführung in Radoop GUI

Verbindung zu einem Hadoop Cluster herstellen

Datenexploration

  • Durchsuchen von Tabellen
  • Anzeigen von Statistiken und hochrangigen Informationen

Datenextraktion und Laden von Daten

  • Formulierung von Abfragen
  • Daten in Hadoop übertragen

Integration von In-Cluster-Analysen in RapidMiner-Prozesse

  • Modellierungsalgorithmen
  • Natürliche Aggregation
  • In-Memory-Training, In-Hadoop-Scoring

Jenseits der natürlichen Aggregation

  • Chunking
  • Voting
  • In-Hadoop-Modeling
  • Clustering

Diese Seite weiterempfehlen