Big Data - Hands On für Sentiment Analytics
Classroom Schulung | Deutsch | Anspruch
Schulungsdauer: 2 Tage
Ziele
In diesem Kurs betrachten Sie Lösungsfindung und deren Umsetzung. Anhand praktischer Aufgabenstellungen wird kritisch auf verschiedene Möglichkeiten ihrer Bearbeitung eingegangen. Außerdem erhalten Sie dabei einen nähreren Einblick in die Umsetzung.
Zielgruppe
- (IT-)Architekten
- (IT-)Entwickler
Voraussetzungen
- Praktische Erfahrung in der IT-Informationsverarbeitung
- Grundkenntnisse zu Hadoop
- Anwendung von Programmiersprachen
Agenda
Hadoop-Sandbox
In dem ersten Modul wird die Hadoop-Sandbox vorgestellt und gemeinsam evaluiert.
Überblick Hadoop Distributed File System (HDFS)
Das Kernstück von Hadoop ist ein leistungsstarkes, robustes und extrem skalierbares Dateisystem. In diesem Abschnitt werden die wichtigsten Elemente für den Datenaustausch mit HDFS vorgestellt.
Überblick MapReduce
Die Java-basierte Klassenbibliothek für MapReduce ist der Maschinenraum von Hadoop. In diesem Abschnitt erhalten Sie einen Überblick über das von Google eingeführte Programmier-modell für nebenläufige Berechnungen.
Aufbereitung von Daten unter Anwendung von MapReduce
In diesem Abschnitt evaluieren Sie die Anwendung von MapReduce, um verschiedene Ausgangsdaten aufzubereiten.
Überblick Mahout
Mit Mahout steht in Hadoop ein Werkzeug für Data Mining Fragestellungen zur Verfügung.
Anwendung von Mahout und anderen Tools für verschiedene Fragestellungen
In diesem Abschnitt evaluieren Sie verschiedene praktische Fragestellungen wie beispielsweise die Evaluierung der Stimmung.
Überblick Test und Optimierung der Lösung in Hadoop
Es wird ein Überblick zum Testen und Optimieren in Hadoop gegeben und welche Werkzeuge dafür zur Verfügung stehen.
Testen und Optimieren der Lösung in hadoop
In diesem Abschnitt sammeln Sie erste Erfahrungen im Testen und Optimieren der erstellten Lösungen.
Zusammenfassung und Verallgemeinerung
Zum Abschluss werden die Ergebnisse zusammengefasst und die durchgeführten Übungen auf ihre Praxistauglichkeit untersucht sowie ein Vorgehensmodell für die Stimmungsanalyse mit Hadoop abgeleitet.
Ziele
In diesem Kurs betrachten Sie Lösungsfindung und deren Umsetzung. Anhand praktischer Aufgabenstellungen wird kritisch auf verschiedene Möglichkeiten ihrer Bearbeitung eingegangen. Außerdem erhalten Sie dabei einen nähreren Einblick in die Umsetzung.
Zielgruppe
- (IT-)Architekten
- (IT-)Entwickler
Voraussetzungen
- Praktische Erfahrung in der IT-Informationsverarbeitung
- Grundkenntnisse zu Hadoop
- Anwendung von Programmiersprachen
Agenda
Hadoop-Sandbox
In dem ersten Modul wird die Hadoop-Sandbox vorgestellt und gemeinsam evaluiert.
Überblick Hadoop Distributed File System (HDFS)
Das Kernstück von Hadoop ist ein leistungsstarkes, robustes und extrem skalierbares Dateisystem. In diesem Abschnitt werden die wichtigsten Elemente für den Datenaustausch mit HDFS vorgestellt.
Überblick MapReduce
Die Java-basierte Klassenbibliothek für MapReduce ist der Maschinenraum von Hadoop. In diesem Abschnitt erhalten Sie einen Überblick über das von Google eingeführte Programmier-modell für nebenläufige Berechnungen.
Aufbereitung von Daten unter Anwendung von MapReduce
In diesem Abschnitt evaluieren Sie die Anwendung von MapReduce, um verschiedene Ausgangsdaten aufzubereiten.
Überblick Mahout
Mit Mahout steht in Hadoop ein Werkzeug für Data Mining Fragestellungen zur Verfügung.
Anwendung von Mahout und anderen Tools für verschiedene Fragestellungen
In diesem Abschnitt evaluieren Sie verschiedene praktische Fragestellungen wie beispielsweise die Evaluierung der Stimmung.
Überblick Test und Optimierung der Lösung in Hadoop
Es wird ein Überblick zum Testen und Optimieren in Hadoop gegeben und welche Werkzeuge dafür zur Verfügung stehen.
Testen und Optimieren der Lösung in hadoop
In diesem Abschnitt sammeln Sie erste Erfahrungen im Testen und Optimieren der erstellten Lösungen.
Zusammenfassung und Verallgemeinerung
Zum Abschluss werden die Ergebnisse zusammengefasst und die durchgeführten Übungen auf ihre Praxistauglichkeit untersucht sowie ein Vorgehensmodell für die Stimmungsanalyse mit Hadoop abgeleitet.