Hortonworks Data Plattform (HDP) Administration

Classroom Schulung | Deutsch | Anspruch

Schulungsdauer: 5 Tage

Ziele

Dieses fünftägige Hortonworks Workshop richtet sich an System-Administratoren, die für das Aufsetzen, die Installation und das Management eines Hadoop-Clusters mit der Hortonworks Data Platform (HDP) verantwortlich sind. Das Seminar ist auch für die Vorbereitung auf die Zertifizierung zum HDP Certified Administrator (HDPCA) geeignet.

Zielgruppe

Administratoren & DevOps, die verantwortlich sind für die Installation, den Betrieb und den Support von Hadoop-Clustern auf Basis der Hortonworks Data Platform (HDP) mit Apache Ambari

Voraussetzungen

  • Basiskenntnisse in Linux werden vorausgesetzt
  • Grundkenntnisse in Apache Hadoop sind hilfreich, aber nicht zwingend erforderlich

Agenda

Einführung in Hadoop

  • Big Data Skalierbarkeit von Datenmanagagment
  • Performace Aspekte
  • Data-Warehouse-Systeme vs. Data-Lake-Systeme
  • Hadoop Distributed File System (HDFS)
  • Batch Systeme mit Hadoop
  • Echtzeit und Interaktive Systeme mit Spark
  • NoSQL-Datenbank Versus RSBMS
  • NoSQL-Datenbank Typen

Aufsetzen der Trainingsumgebung

  • Interaktive Installation von HDP mit Ambari
  • Automatisertes Deployment von HDP mittels Blueprints
  • HDP-Upgrade-Prozess
  • Management von Hadoop Services
  • Konfiguration von Rack Awareness
  • Ausführung von YARN-Applikationen

Service Verwaltung

  • Service Installation
  • Service Konfiguration
  • Konfiguration versionisieren
  • Host Verwaltung
  • Skalierbarkeit
  • Hinzufügen und Entfernen von Worker Nodes

Resourcenverwaltung und Sicherheit

  • Hochverfügbarkeit von HDP Services
  • Überblick das Ressourcenmanagement mit YARN
  • Details der YARN-Architektur und des –Betriebs
  • HDP Komponenten für die Sicherheit
  • Management von Ambari-Benutzern und –Gruppen

Tests und Verwaltungen

  • Apache HDFS
  • Apache HIVE
  • Apache SPARK
  • Installationen und Version
  • Durchführung eines HDP Upgrades
  • Versionen Verwaltung

Jeder Teilnehmer bekommt für die Dauer des Trainings ein Cluster mit 4 knoten über Amazon AWS zur Verfügung gestellt. Worauf in dem Training die HDP 2.6 oder 3.0 (nach einem Auswahl) installiert und administriert wird. Daher benötigen die Teilnehmer lediglich einen standardmäßigen Rechner zum Verbinden mit dieser Umgebung. Z.B Windows oder Linux Rechner mit Firefox, Chrome oder Safari (Internet Explorer wird aktuell nicht unterstützt)und ssh Client (z.B.: Putty für Windows)

Über den Dozenten

Hamza Mehammed

Ziele

Dieses fünftägige Hortonworks Workshop richtet sich an System-Administratoren, die für das Aufsetzen, die Installation und das Management eines Hadoop-Clusters mit der Hortonworks Data Platform (HDP) verantwortlich sind. Das Seminar ist auch für die Vorbereitung auf die Zertifizierung zum HDP Certified Administrator (HDPCA) geeignet.

Zielgruppe

Administratoren & DevOps, die verantwortlich sind für die Installation, den Betrieb und den Support von Hadoop-Clustern auf Basis der Hortonworks Data Platform (HDP) mit Apache Ambari

Voraussetzungen

  • Basiskenntnisse in Linux werden vorausgesetzt
  • Grundkenntnisse in Apache Hadoop sind hilfreich, aber nicht zwingend erforderlich

Agenda

Einführung in Hadoop

  • Big Data Skalierbarkeit von Datenmanagagment
  • Performace Aspekte
  • Data-Warehouse-Systeme vs. Data-Lake-Systeme
  • Hadoop Distributed File System (HDFS)
  • Batch Systeme mit Hadoop
  • Echtzeit und Interaktive Systeme mit Spark
  • NoSQL-Datenbank Versus RSBMS
  • NoSQL-Datenbank Typen

Aufsetzen der Trainingsumgebung

  • Interaktive Installation von HDP mit Ambari
  • Automatisertes Deployment von HDP mittels Blueprints
  • HDP-Upgrade-Prozess
  • Management von Hadoop Services
  • Konfiguration von Rack Awareness
  • Ausführung von YARN-Applikationen

Service Verwaltung

  • Service Installation
  • Service Konfiguration
  • Konfiguration versionisieren
  • Host Verwaltung
  • Skalierbarkeit
  • Hinzufügen und Entfernen von Worker Nodes

Resourcenverwaltung und Sicherheit

  • Hochverfügbarkeit von HDP Services
  • Überblick das Ressourcenmanagement mit YARN
  • Details der YARN-Architektur und des –Betriebs
  • HDP Komponenten für die Sicherheit
  • Management von Ambari-Benutzern und –Gruppen

Tests und Verwaltungen

  • Apache HDFS
  • Apache HIVE
  • Apache SPARK
  • Installationen und Version
  • Durchführung eines HDP Upgrades
  • Versionen Verwaltung

Jeder Teilnehmer bekommt für die Dauer des Trainings ein Cluster mit 4 knoten über Amazon AWS zur Verfügung gestellt. Worauf in dem Training die HDP 2.6 oder 3.0 (nach einem Auswahl) installiert und administriert wird. Daher benötigen die Teilnehmer lediglich einen standardmäßigen Rechner zum Verbinden mit dieser Umgebung. Z.B Windows oder Linux Rechner mit Firefox, Chrome oder Safari (Internet Explorer wird aktuell nicht unterstützt)und ssh Client (z.B.: Putty für Windows)

Über den Dozenten

Hamza Mehammed

Tags

Diese Seite weiterempfehlen