Big Data Fortgeschrittenenkurs
Classroom training | German | Claim
Duration of training: 1 day
Objectives
In diesem Kurs werden Ihnen ergänzend zum Big Data Grundkurs weitere Komponenten vorgestellt und Demos aufgezeigt.
Target audience
- Entscheider
- (Fach-)Anwender
- Projektmanager
Requirements
- IT-Grundkenntnisse sowie Grundkenntnisse
- Big Data Grundkurs oder vergleichbares Wissen
Agenda
Überblick
In diesem Abschnitt wird der Inhalt aus dem Big Data Grundkurs zusammen gefasst.
YARN
Die massive Parallelisierung in Hadoop erfordert eine leistungsfähige Steuerung. Diese war in der ersten Version limitiert und primär auf MapReduce fokussiert. Die aktuelle Version weist deutliche Verbesserungen auf, die in diesem Abschnitt vorgestellt werden.
Pig
Pig ist ein Mechanismus, um stapelorientierte Datenfluss-Operationen in Hadoop auszuführen und wird oft in Verbindung mit Hive eingesetzt. In diesem Abschnitt lernen Sie die Möglichkeiten von Pig kennen. Es wird die Anwendung von Pig demonstriert.
HCatalog
HCatalog ist eine Metadatenverwaltung für strukturierte Daten in Hadoop, die von Hive und Pig genutzt wird. In diesem Abschnitt lernen Sie HCatalog erfolgreich einzusetzen.
Es wird die Anwendung von HCatalog demonstriert.
HBase
HBase ist eine Datenbank für Hadoop, allerdings keine im klassisch relationalen Sinne. In diesem Abschnitt lernen Sie HBase und die möglichen Stolperfallen, die dem in der relationalen Welt erfahrenen Anwender begegnen können, kennen. Es wird die Anwendung von HBase demonstriert.
Weitere Komponenten
Hadoop ist ein Framework und unter dem Schirm der Apache Foundation existieren eine Vielzahl von Projekten mit zum Teil konkurrierenden Lösungen. In diesem Abschnitt erhalten Sie einen Überblick über weitere interessante Komponenten aus Hadoop. Es wird die Anwendung weiterer Komponenten demonstriert.
"Big Data" und der Datenschutz
Technisch ist mit "Big Data" vieles möglich, wenngleich es natürlich auch hier physische Grenzen für die Datensammlung gibt. Weitreichender sind mögliche rechtliche Rahmenbedingungen, unter denen "Big Data" betrieben werden kann. Sie erhalten einen Überblick über Möglichkeiten, Grenzen sowie rechtliche Aspekte.
Objectives
In diesem Kurs werden Ihnen ergänzend zum Big Data Grundkurs weitere Komponenten vorgestellt und Demos aufgezeigt.
Target audience
- Entscheider
- (Fach-)Anwender
- Projektmanager
Requirements
- IT-Grundkenntnisse sowie Grundkenntnisse
- Big Data Grundkurs oder vergleichbares Wissen
Agenda
Überblick
In diesem Abschnitt wird der Inhalt aus dem Big Data Grundkurs zusammen gefasst.
YARN
Die massive Parallelisierung in Hadoop erfordert eine leistungsfähige Steuerung. Diese war in der ersten Version limitiert und primär auf MapReduce fokussiert. Die aktuelle Version weist deutliche Verbesserungen auf, die in diesem Abschnitt vorgestellt werden.
Pig
Pig ist ein Mechanismus, um stapelorientierte Datenfluss-Operationen in Hadoop auszuführen und wird oft in Verbindung mit Hive eingesetzt. In diesem Abschnitt lernen Sie die Möglichkeiten von Pig kennen. Es wird die Anwendung von Pig demonstriert.
HCatalog
HCatalog ist eine Metadatenverwaltung für strukturierte Daten in Hadoop, die von Hive und Pig genutzt wird. In diesem Abschnitt lernen Sie HCatalog erfolgreich einzusetzen.
Es wird die Anwendung von HCatalog demonstriert.
HBase
HBase ist eine Datenbank für Hadoop, allerdings keine im klassisch relationalen Sinne. In diesem Abschnitt lernen Sie HBase und die möglichen Stolperfallen, die dem in der relationalen Welt erfahrenen Anwender begegnen können, kennen. Es wird die Anwendung von HBase demonstriert.
Weitere Komponenten
Hadoop ist ein Framework und unter dem Schirm der Apache Foundation existieren eine Vielzahl von Projekten mit zum Teil konkurrierenden Lösungen. In diesem Abschnitt erhalten Sie einen Überblick über weitere interessante Komponenten aus Hadoop. Es wird die Anwendung weiterer Komponenten demonstriert.
"Big Data" und der Datenschutz
Technisch ist mit "Big Data" vieles möglich, wenngleich es natürlich auch hier physische Grenzen für die Datensammlung gibt. Weitreichender sind mögliche rechtliche Rahmenbedingungen, unter denen "Big Data" betrieben werden kann. Sie erhalten einen Überblick über Möglichkeiten, Grenzen sowie rechtliche Aspekte.