Big Data Lösungen mit AWS

Classroom Schulung | Deutsch | Anspruch

Schulungsdauer: 3 Tage

Ziele

In diesem Kurs erfahren Sie mehr über Cloud-basierte Big Data-Lösungen wie Amazon EMR, Amazon Redshift, Amazon Kinesis und den weiteren Bestandteilen der AWS-Big-Data-Plattform. Lernen Sie, Amazon EMR zur Verarbeitung von Daten zu verwenden mit dem breiten Ökosystem von Hadoop-Tools wie Hive und Hue, das Erstellen von Big Data-Umgebungen, die Arbeit mit Amazon DynamoDB, Amazon Redshift, Amazon QuickSight, Amazon Athena und Amazon Kinesis, sowie die Big Data-Umgebungen für Sicherheit und Kosteneffizienz zu entwerfen.

In diesem Kurs werden Sie:

  • Apache Hadoop mit Amazon EMR verwenden
  • Amazon EMR-Cluster starten und konfigurieren
  • Gemeinsame Programmier-Frameworks für Amazon EMR verwenden, einschließlich Hive, Pig und Streaming
  • Hue verwenden, um die Benutzerfreundlichkeit von Amazon EMR zu verbessern
  • Verwenden von In-Memory-Analysen mit Spark auf Amazon EMR
  • Verstehen, wie Services wie AWS Glue, Amazon Kinesis, Amazon Redshift, Amazon Athena und Amazon QuickSight mit Big Data-Workloads verwendet werden können

Dieser Kurs wird mit der offiziellen AWS Unterlage und Systemumgebung durchgeführt. Die Unterlage und Lab sind im Preis enthalten.

Zielgruppe

  • Solutions Architekten
  • SysOps-Administratoren
  • Data Scientists
  • Datenanalysten

Voraussetzungen

  • Grundkenntnisse mit Big Data Technologien, inkl. Apache Hadoop, HDFS, SQL, NoSQL abfragen
  • Kenntnisse mit Big Data Technologien wie Pig, Hive und MapReduce sind vorteilhaft, werden jedoch nicht vorausgesetzt
  • Erfahrung mit AWS Services und Implementierung einer Public Cloud
  • Teilnahme an der Schulung AWS technischer Grundlagenkurs oder vergleichbare Kenntnisse
  • Grundlegendes Verständnis von Data Warehousing, relationalen Datenbanksystemen und Datenbankdesign

Agenda

Überblick über Big Data

  • Was ist Big Data
  • Die Big-Data-Pipeline
  • Big-Data-Architekturprinzipien

Big Data-Ingestion und -Transfer

  • Überblick: Dateneingabe
  • Übertragen von Daten

Big-Data-Streaming und Amazon Kinesis

  • Stream-Verarbeitung von Big Data
  • Amazon Kinesis
  • Amazon Kinesis Daten-Firehose
  • Amazon Kinesis Video-Streams
  • Amazon Kinesis Data Analytics

Big-Data-Speicherlösungen

  • AWS-Datenspeicheroptionen
  • Konzepte für Speicherlösungen
  • Faktoren bei der Auswahl eines Datenspeichers

Big-Data-Verarbeitung und -Analytik

  • Big Data-Verarbeitung und -Analysen
  • Amazon Athena

Apache Hadoop und Amazon EMR

  • Einführung in Amazon EMR und Apache Hadoop
  • Bewährte Verfahren für das Einlesen von Daten
  • Amazon EMR
  • Amazon EMR-Architektur

Verwendung von Amazon EMR

  • Entwickeln und Ausführen Ihrer Anwendung
  • Starten Ihres Clusters
  • Umgang mit der Ausgabe Ihrer abgeschlossenen Aufträge

Hadoop-Programmier-Frameworks

  • Hadoop-Frameworks
  • Andere Frameworks für den Einsatz auf Amazon EMR

Webschnittstellen auf Amazon EMR

  • Hue auf Amazon EMR
  • Überwachung Ihres Clusters

Apache Spark auf Amazon EMR

  • Apache Spark
  • Verwenden von Spark

Verwenden von AWS Glue zum Automatisieren von ETL-Arbeitslasten

  • Was ist AWS Glue?
  • AWS Glue: Job-Orchestrierung

Amazon Redshift und Big Data

  • Data Warehouses vs. traditionelle Datenbanken
  • Amazon Redshift
  • Architektur von Amazon Redshift

Absicherung Ihrer Amazon-Bereitstellungen

  • Absicherung Ihrer Amazon-Bereitstellungen
  • Überblick über die Sicherheit von Amazon EMR
  • Überblick über AWS Identity and Access Management (IAM)
  • Sichern von Daten
  • Amazon Kinesis-Sicherheitsüberblick
  • Amazon DynamoDB-Sicherheitsübersicht
  • Amazon Redshift-Sicherheitsüberblick

Verwalten von Big Data-Kosten

  • Gesamtkostenüberlegungen für Amazon EMR
  • Amazon EC2-Preismodelle
  • Amazon Kinesis-Preismodelle
  • Kostenüberlegungen für Amazon DynamoDB
  • Kostenüberlegungen und Preismodelle für Amazon Redshift
  • Kostenoptimierung mit AWS

Visualisierung und Orchestrierung von Big Data

  • Visualisierung von Big Data
  • Amazon QuickSight
  • Orchestrierung eines Big-Data-Workflows

Big-Data-Entwurfsmuster

  • Gemeinsame Architekturen

Kurs Zusammenfassung

Ziele

In diesem Kurs erfahren Sie mehr über Cloud-basierte Big Data-Lösungen wie Amazon EMR, Amazon Redshift, Amazon Kinesis und den weiteren Bestandteilen der AWS-Big-Data-Plattform. Lernen Sie, Amazon EMR zur Verarbeitung von Daten zu verwenden mit dem breiten Ökosystem von Hadoop-Tools wie Hive und Hue, das Erstellen von Big Data-Umgebungen, die Arbeit mit Amazon DynamoDB, Amazon Redshift, Amazon QuickSight, Amazon Athena und Amazon Kinesis, sowie die Big Data-Umgebungen für Sicherheit und Kosteneffizienz zu entwerfen.

In diesem Kurs werden Sie:

  • Apache Hadoop mit Amazon EMR verwenden
  • Amazon EMR-Cluster starten und konfigurieren
  • Gemeinsame Programmier-Frameworks für Amazon EMR verwenden, einschließlich Hive, Pig und Streaming
  • Hue verwenden, um die Benutzerfreundlichkeit von Amazon EMR zu verbessern
  • Verwenden von In-Memory-Analysen mit Spark auf Amazon EMR
  • Verstehen, wie Services wie AWS Glue, Amazon Kinesis, Amazon Redshift, Amazon Athena und Amazon QuickSight mit Big Data-Workloads verwendet werden können

Dieser Kurs wird mit der offiziellen AWS Unterlage und Systemumgebung durchgeführt. Die Unterlage und Lab sind im Preis enthalten.

Zielgruppe

  • Solutions Architekten
  • SysOps-Administratoren
  • Data Scientists
  • Datenanalysten

Voraussetzungen

  • Grundkenntnisse mit Big Data Technologien, inkl. Apache Hadoop, HDFS, SQL, NoSQL abfragen
  • Kenntnisse mit Big Data Technologien wie Pig, Hive und MapReduce sind vorteilhaft, werden jedoch nicht vorausgesetzt
  • Erfahrung mit AWS Services und Implementierung einer Public Cloud
  • Teilnahme an der Schulung AWS technischer Grundlagenkurs oder vergleichbare Kenntnisse
  • Grundlegendes Verständnis von Data Warehousing, relationalen Datenbanksystemen und Datenbankdesign

Agenda

Überblick über Big Data

  • Was ist Big Data
  • Die Big-Data-Pipeline
  • Big-Data-Architekturprinzipien

Big Data-Ingestion und -Transfer

  • Überblick: Dateneingabe
  • Übertragen von Daten

Big-Data-Streaming und Amazon Kinesis

  • Stream-Verarbeitung von Big Data
  • Amazon Kinesis
  • Amazon Kinesis Daten-Firehose
  • Amazon Kinesis Video-Streams
  • Amazon Kinesis Data Analytics

Big-Data-Speicherlösungen

  • AWS-Datenspeicheroptionen
  • Konzepte für Speicherlösungen
  • Faktoren bei der Auswahl eines Datenspeichers

Big-Data-Verarbeitung und -Analytik

  • Big Data-Verarbeitung und -Analysen
  • Amazon Athena

Apache Hadoop und Amazon EMR

  • Einführung in Amazon EMR und Apache Hadoop
  • Bewährte Verfahren für das Einlesen von Daten
  • Amazon EMR
  • Amazon EMR-Architektur

Verwendung von Amazon EMR

  • Entwickeln und Ausführen Ihrer Anwendung
  • Starten Ihres Clusters
  • Umgang mit der Ausgabe Ihrer abgeschlossenen Aufträge

Hadoop-Programmier-Frameworks

  • Hadoop-Frameworks
  • Andere Frameworks für den Einsatz auf Amazon EMR

Webschnittstellen auf Amazon EMR

  • Hue auf Amazon EMR
  • Überwachung Ihres Clusters

Apache Spark auf Amazon EMR

  • Apache Spark
  • Verwenden von Spark

Verwenden von AWS Glue zum Automatisieren von ETL-Arbeitslasten

  • Was ist AWS Glue?
  • AWS Glue: Job-Orchestrierung

Amazon Redshift und Big Data

  • Data Warehouses vs. traditionelle Datenbanken
  • Amazon Redshift
  • Architektur von Amazon Redshift

Absicherung Ihrer Amazon-Bereitstellungen

  • Absicherung Ihrer Amazon-Bereitstellungen
  • Überblick über die Sicherheit von Amazon EMR
  • Überblick über AWS Identity and Access Management (IAM)
  • Sichern von Daten
  • Amazon Kinesis-Sicherheitsüberblick
  • Amazon DynamoDB-Sicherheitsübersicht
  • Amazon Redshift-Sicherheitsüberblick

Verwalten von Big Data-Kosten

  • Gesamtkostenüberlegungen für Amazon EMR
  • Amazon EC2-Preismodelle
  • Amazon Kinesis-Preismodelle
  • Kostenüberlegungen für Amazon DynamoDB
  • Kostenüberlegungen und Preismodelle für Amazon Redshift
  • Kostenoptimierung mit AWS

Visualisierung und Orchestrierung von Big Data

  • Visualisierung von Big Data
  • Amazon QuickSight
  • Orchestrierung eines Big-Data-Workflows

Big-Data-Entwurfsmuster

  • Gemeinsame Architekturen

Kurs Zusammenfassung

Tags

Diese Seite weiterempfehlen