Big Data - Hands On für Predictive Analytics
Classroom Schulung | Deutsch | Anspruch
Schulungsdauer: 2 Tage
Ziele
Dieser Kurs behandelt die Lösungsfindung sowie deren Umsetzung. Anhand praktischer Aufgabenstellungen diskutieren Sie unterschiedliche Möglichkeiten bezüglich der Bearbeitung und sammeln dabei Erfahrungen in der Umsetzung.
Zielgruppe
- (IT-)Architekt
- (IT-)Entwickler
Voraussetzungen
- Praktische Erfahrung in der IT-Informationsverarbeitung
- Grundkenntnisse zu Hadoop
- Anwendung von Programmiersprachen
Agenda
Hadoop-Sandbox
In dem ersten Modul wird die Hadoop-Sandbox vorgestellt und gemeinsam evaluiert.
Überblick Hadoop Distributed File System (HDFS)
Das Kernstück von Hadoop ist ein leistungsstarkes, robustes und extrem skalierbares Dateisystem. In diesem Abschnitt werden die wichtigsten Elemente für den Datenaustausch mit HDFS evaluiert.
Überblick MapReduce
Die Java-basierte Klassenbibliothek für MapReduce ist der Maschinenraum von Hadoop. In diesem Abschnitt erhalten Sie einen Überblick über das von Google eingeführte Programmier-modell für nebenläufige Berechnungen.
Aufbereitung von Daten unter Anwendung von MapReduce
In diesem Abschnitt evaluieren Sie die Anwendung von MapReduce, um verschiedene Ausgangsdaten aufzubereiten.
Überblick Mahout
Mit Mahout steht in Hadoop ein Werkzeug für Data Mining Fragestellungen zur Verfügung.
Anwendung von Mahout für Vorhersagen auf der Basis der Cluster-Methode
In diesem Abschnitt wenden Sie die Mining Methode des Clusterings an, um mit Hilfe von Mahout Vorhersagen auf der Grundlage der Cluster-Zugehörigkeit abzuleiten.
Anwendung von Mahout für die Erstellung von Empfehlungen
In diesem Abschnitt evaluieren Sie verschiedene Ansätze mit Mahout, um Empfehlungen abzuleiten.
Überblick Test und Optimierung der Lösung in Hadoop
Es wird ein Überblick zum Testen und Optimieren in Hadoop gegeben und welche Werkzeuge dafür zur Verfügung stehen.
Testen und Optimieren der Lösung in Hadoop
In diesem Abschnitt sammeln Sie erste Erfahrungen im Testen und Optimieren der erstellten Lösungen.
Zusammenfassung und Verallgemeinerung
Zum Abschluss werden die Ergebnisse zusammengefasst und die durchgeführten Übungen auf ihre Praxistauglichkeit untersucht sowie ein Vorgehensmodell für Vorhersagen mit Hadoop abgeleitet.
Ziele
Dieser Kurs behandelt die Lösungsfindung sowie deren Umsetzung. Anhand praktischer Aufgabenstellungen diskutieren Sie unterschiedliche Möglichkeiten bezüglich der Bearbeitung und sammeln dabei Erfahrungen in der Umsetzung.
Zielgruppe
- (IT-)Architekt
- (IT-)Entwickler
Voraussetzungen
- Praktische Erfahrung in der IT-Informationsverarbeitung
- Grundkenntnisse zu Hadoop
- Anwendung von Programmiersprachen
Agenda
Hadoop-Sandbox
In dem ersten Modul wird die Hadoop-Sandbox vorgestellt und gemeinsam evaluiert.
Überblick Hadoop Distributed File System (HDFS)
Das Kernstück von Hadoop ist ein leistungsstarkes, robustes und extrem skalierbares Dateisystem. In diesem Abschnitt werden die wichtigsten Elemente für den Datenaustausch mit HDFS evaluiert.
Überblick MapReduce
Die Java-basierte Klassenbibliothek für MapReduce ist der Maschinenraum von Hadoop. In diesem Abschnitt erhalten Sie einen Überblick über das von Google eingeführte Programmier-modell für nebenläufige Berechnungen.
Aufbereitung von Daten unter Anwendung von MapReduce
In diesem Abschnitt evaluieren Sie die Anwendung von MapReduce, um verschiedene Ausgangsdaten aufzubereiten.
Überblick Mahout
Mit Mahout steht in Hadoop ein Werkzeug für Data Mining Fragestellungen zur Verfügung.
Anwendung von Mahout für Vorhersagen auf der Basis der Cluster-Methode
In diesem Abschnitt wenden Sie die Mining Methode des Clusterings an, um mit Hilfe von Mahout Vorhersagen auf der Grundlage der Cluster-Zugehörigkeit abzuleiten.
Anwendung von Mahout für die Erstellung von Empfehlungen
In diesem Abschnitt evaluieren Sie verschiedene Ansätze mit Mahout, um Empfehlungen abzuleiten.
Überblick Test und Optimierung der Lösung in Hadoop
Es wird ein Überblick zum Testen und Optimieren in Hadoop gegeben und welche Werkzeuge dafür zur Verfügung stehen.
Testen und Optimieren der Lösung in Hadoop
In diesem Abschnitt sammeln Sie erste Erfahrungen im Testen und Optimieren der erstellten Lösungen.
Zusammenfassung und Verallgemeinerung
Zum Abschluss werden die Ergebnisse zusammengefasst und die durchgeführten Übungen auf ihre Praxistauglichkeit untersucht sowie ein Vorgehensmodell für Vorhersagen mit Hadoop abgeleitet.