Big Data - Hands On für Predictive Analytics

Classroom Schulung | Deutsch | Anspruch

Schulungsdauer: 2 Tage

Ziele

Dieser Kurs behandelt die Lösungsfindung sowie deren Umsetzung. Anhand praktischer Aufgabenstellungen diskutieren Sie unterschiedliche Möglichkeiten bezüglich der Bearbeitung und sammeln dabei Erfahrungen in der Umsetzung.

Zielgruppe

  • (IT-)Architekt
  • (IT-)Entwickler

Voraussetzungen

  • Praktische Erfahrung in der IT-Informationsverarbeitung
  • Grundkenntnisse zu Hadoop
  • Anwendung von Programmiersprachen

Agenda

Hadoop-Sandbox

In dem ersten Modul wird die Hadoop-Sandbox vorgestellt und gemeinsam evaluiert.

Überblick Hadoop Distributed File System (HDFS)

Das Kernstück von Hadoop ist ein leistungsstarkes, robustes und extrem skalierbares Dateisystem. In diesem Abschnitt werden die wichtigsten Elemente für den Datenaustausch mit HDFS evaluiert.

Überblick MapReduce

Die Java-basierte Klassenbibliothek für MapReduce ist der Maschinenraum von Hadoop. In diesem Abschnitt erhalten Sie einen Überblick über das von Google eingeführte Programmier-modell für nebenläufige Berechnungen.

Aufbereitung von Daten unter Anwendung von MapReduce

In diesem Abschnitt evaluieren Sie die Anwendung von MapReduce, um verschiedene Ausgangsdaten aufzubereiten.

Überblick Mahout

Mit Mahout steht in Hadoop ein Werkzeug für Data Mining Fragestellungen zur Verfügung.

Anwendung von Mahout für Vorhersagen auf der Basis der Cluster-Methode

In diesem Abschnitt wenden Sie die Mining Methode des Clusterings an, um mit Hilfe von Mahout Vorhersagen auf der Grundlage der Cluster-Zugehörigkeit abzuleiten.

Anwendung von Mahout für die Erstellung von Empfehlungen

In diesem Abschnitt evaluieren Sie verschiedene Ansätze mit Mahout, um Empfehlungen abzuleiten.

Überblick Test und Optimierung der Lösung in Hadoop

Es wird ein Überblick zum Testen und Optimieren in Hadoop gegeben und welche Werkzeuge dafür zur Verfügung stehen.

Testen und Optimieren der Lösung in Hadoop

In diesem Abschnitt sammeln Sie erste Erfahrungen im Testen und Optimieren der erstellten Lösungen.

Zusammenfassung und Verallgemeinerung

Zum Abschluss werden die Ergebnisse zusammengefasst und die durchgeführten Übungen auf ihre Praxistauglichkeit untersucht sowie ein Vorgehensmodell für Vorhersagen mit Hadoop abgeleitet.

Ziele

Dieser Kurs behandelt die Lösungsfindung sowie deren Umsetzung. Anhand praktischer Aufgabenstellungen diskutieren Sie unterschiedliche Möglichkeiten bezüglich der Bearbeitung und sammeln dabei Erfahrungen in der Umsetzung.

Zielgruppe

  • (IT-)Architekt
  • (IT-)Entwickler

Voraussetzungen

  • Praktische Erfahrung in der IT-Informationsverarbeitung
  • Grundkenntnisse zu Hadoop
  • Anwendung von Programmiersprachen

Agenda

Hadoop-Sandbox

In dem ersten Modul wird die Hadoop-Sandbox vorgestellt und gemeinsam evaluiert.

Überblick Hadoop Distributed File System (HDFS)

Das Kernstück von Hadoop ist ein leistungsstarkes, robustes und extrem skalierbares Dateisystem. In diesem Abschnitt werden die wichtigsten Elemente für den Datenaustausch mit HDFS evaluiert.

Überblick MapReduce

Die Java-basierte Klassenbibliothek für MapReduce ist der Maschinenraum von Hadoop. In diesem Abschnitt erhalten Sie einen Überblick über das von Google eingeführte Programmier-modell für nebenläufige Berechnungen.

Aufbereitung von Daten unter Anwendung von MapReduce

In diesem Abschnitt evaluieren Sie die Anwendung von MapReduce, um verschiedene Ausgangsdaten aufzubereiten.

Überblick Mahout

Mit Mahout steht in Hadoop ein Werkzeug für Data Mining Fragestellungen zur Verfügung.

Anwendung von Mahout für Vorhersagen auf der Basis der Cluster-Methode

In diesem Abschnitt wenden Sie die Mining Methode des Clusterings an, um mit Hilfe von Mahout Vorhersagen auf der Grundlage der Cluster-Zugehörigkeit abzuleiten.

Anwendung von Mahout für die Erstellung von Empfehlungen

In diesem Abschnitt evaluieren Sie verschiedene Ansätze mit Mahout, um Empfehlungen abzuleiten.

Überblick Test und Optimierung der Lösung in Hadoop

Es wird ein Überblick zum Testen und Optimieren in Hadoop gegeben und welche Werkzeuge dafür zur Verfügung stehen.

Testen und Optimieren der Lösung in Hadoop

In diesem Abschnitt sammeln Sie erste Erfahrungen im Testen und Optimieren der erstellten Lösungen.

Zusammenfassung und Verallgemeinerung

Zum Abschluss werden die Ergebnisse zusammengefasst und die durchgeführten Übungen auf ihre Praxistauglichkeit untersucht sowie ein Vorgehensmodell für Vorhersagen mit Hadoop abgeleitet.

Tags

Diese Seite weiterempfehlen