Big Data Lösungen mit AWS
Classroom Schulung | Deutsch | Anspruch
Schulungsdauer: 3 Tage
Ziele
In diesem Kurs erfahren Sie mehr über Cloud-basierte Big Data-Lösungen wie Amazon EMR, Amazon Redshift, Amazon Kinesis und den weiteren Bestandteilen der AWS-Big-Data-Plattform. Lernen Sie, Amazon EMR zur Verarbeitung von Daten zu verwenden mit dem breiten Ökosystem von Hadoop-Tools wie Hive und Hue, das Erstellen von Big Data-Umgebungen, die Arbeit mit Amazon DynamoDB, Amazon Redshift, Amazon QuickSight, Amazon Athena und Amazon Kinesis, sowie die Big Data-Umgebungen für Sicherheit und Kosteneffizienz zu entwerfen.
In diesem Kurs werden Sie:
- Apache Hadoop mit Amazon EMR verwenden
- Amazon EMR-Cluster starten und konfigurieren
- Gemeinsame Programmier-Frameworks für Amazon EMR verwenden, einschließlich Hive, Pig und Streaming
- Hue verwenden, um die Benutzerfreundlichkeit von Amazon EMR zu verbessern
- Verwenden von In-Memory-Analysen mit Spark auf Amazon EMR
- Verstehen, wie Services wie AWS Glue, Amazon Kinesis, Amazon Redshift, Amazon Athena und Amazon QuickSight mit Big Data-Workloads verwendet werden können
Dieser Kurs wird mit der offiziellen AWS Unterlage und Systemumgebung durchgeführt. Die Unterlage und Lab sind im Preis enthalten.
Zielgruppe
- Solutions Architekten
- SysOps-Administratoren
- Data Scientists
- Datenanalysten
Voraussetzungen
- Grundkenntnisse mit Big Data Technologien, inkl. Apache Hadoop, HDFS, SQL, NoSQL abfragen
- Kenntnisse mit Big Data Technologien wie Pig, Hive und MapReduce sind vorteilhaft, werden jedoch nicht vorausgesetzt
- Erfahrung mit AWS Services und Implementierung einer Public Cloud
- Teilnahme an der Schulung AWS technischer Grundlagenkurs oder vergleichbare Kenntnisse
- Grundlegendes Verständnis von Data Warehousing, relationalen Datenbanksystemen und Datenbankdesign
Agenda
Überblick über Big Data
- Was ist Big Data
- Die Big-Data-Pipeline
- Big-Data-Architekturprinzipien
Big Data-Ingestion und -Transfer
- Überblick: Dateneingabe
- Übertragen von Daten
Big-Data-Streaming und Amazon Kinesis
- Stream-Verarbeitung von Big Data
- Amazon Kinesis
- Amazon Kinesis Daten-Firehose
- Amazon Kinesis Video-Streams
- Amazon Kinesis Data Analytics
Big-Data-Speicherlösungen
- AWS-Datenspeicheroptionen
- Konzepte für Speicherlösungen
- Faktoren bei der Auswahl eines Datenspeichers
Big-Data-Verarbeitung und -Analytik
- Big Data-Verarbeitung und -Analysen
- Amazon Athena
Apache Hadoop und Amazon EMR
- Einführung in Amazon EMR und Apache Hadoop
- Bewährte Verfahren für das Einlesen von Daten
- Amazon EMR
- Amazon EMR-Architektur
Verwendung von Amazon EMR
- Entwickeln und Ausführen Ihrer Anwendung
- Starten Ihres Clusters
- Umgang mit der Ausgabe Ihrer abgeschlossenen Aufträge
Hadoop-Programmier-Frameworks
- Hadoop-Frameworks
- Andere Frameworks für den Einsatz auf Amazon EMR
Webschnittstellen auf Amazon EMR
- Hue auf Amazon EMR
- Überwachung Ihres Clusters
Apache Spark auf Amazon EMR
- Apache Spark
- Verwenden von Spark
Verwenden von AWS Glue zum Automatisieren von ETL-Arbeitslasten
- Was ist AWS Glue?
- AWS Glue: Job-Orchestrierung
Amazon Redshift und Big Data
- Data Warehouses vs. traditionelle Datenbanken
- Amazon Redshift
- Architektur von Amazon Redshift
Absicherung Ihrer Amazon-Bereitstellungen
- Absicherung Ihrer Amazon-Bereitstellungen
- Überblick über die Sicherheit von Amazon EMR
- Überblick über AWS Identity and Access Management (IAM)
- Sichern von Daten
- Amazon Kinesis-Sicherheitsüberblick
- Amazon DynamoDB-Sicherheitsübersicht
- Amazon Redshift-Sicherheitsüberblick
Verwalten von Big Data-Kosten
- Gesamtkostenüberlegungen für Amazon EMR
- Amazon EC2-Preismodelle
- Amazon Kinesis-Preismodelle
- Kostenüberlegungen für Amazon DynamoDB
- Kostenüberlegungen und Preismodelle für Amazon Redshift
- Kostenoptimierung mit AWS
Visualisierung und Orchestrierung von Big Data
- Visualisierung von Big Data
- Amazon QuickSight
- Orchestrierung eines Big-Data-Workflows
Big-Data-Entwurfsmuster
- Gemeinsame Architekturen
Kurs Zusammenfassung
Ziele
In diesem Kurs erfahren Sie mehr über Cloud-basierte Big Data-Lösungen wie Amazon EMR, Amazon Redshift, Amazon Kinesis und den weiteren Bestandteilen der AWS-Big-Data-Plattform. Lernen Sie, Amazon EMR zur Verarbeitung von Daten zu verwenden mit dem breiten Ökosystem von Hadoop-Tools wie Hive und Hue, das Erstellen von Big Data-Umgebungen, die Arbeit mit Amazon DynamoDB, Amazon Redshift, Amazon QuickSight, Amazon Athena und Amazon Kinesis, sowie die Big Data-Umgebungen für Sicherheit und Kosteneffizienz zu entwerfen.
In diesem Kurs werden Sie:
- Apache Hadoop mit Amazon EMR verwenden
- Amazon EMR-Cluster starten und konfigurieren
- Gemeinsame Programmier-Frameworks für Amazon EMR verwenden, einschließlich Hive, Pig und Streaming
- Hue verwenden, um die Benutzerfreundlichkeit von Amazon EMR zu verbessern
- Verwenden von In-Memory-Analysen mit Spark auf Amazon EMR
- Verstehen, wie Services wie AWS Glue, Amazon Kinesis, Amazon Redshift, Amazon Athena und Amazon QuickSight mit Big Data-Workloads verwendet werden können
Dieser Kurs wird mit der offiziellen AWS Unterlage und Systemumgebung durchgeführt. Die Unterlage und Lab sind im Preis enthalten.
Zielgruppe
- Solutions Architekten
- SysOps-Administratoren
- Data Scientists
- Datenanalysten
Voraussetzungen
- Grundkenntnisse mit Big Data Technologien, inkl. Apache Hadoop, HDFS, SQL, NoSQL abfragen
- Kenntnisse mit Big Data Technologien wie Pig, Hive und MapReduce sind vorteilhaft, werden jedoch nicht vorausgesetzt
- Erfahrung mit AWS Services und Implementierung einer Public Cloud
- Teilnahme an der Schulung AWS technischer Grundlagenkurs oder vergleichbare Kenntnisse
- Grundlegendes Verständnis von Data Warehousing, relationalen Datenbanksystemen und Datenbankdesign
Agenda
Überblick über Big Data
- Was ist Big Data
- Die Big-Data-Pipeline
- Big-Data-Architekturprinzipien
Big Data-Ingestion und -Transfer
- Überblick: Dateneingabe
- Übertragen von Daten
Big-Data-Streaming und Amazon Kinesis
- Stream-Verarbeitung von Big Data
- Amazon Kinesis
- Amazon Kinesis Daten-Firehose
- Amazon Kinesis Video-Streams
- Amazon Kinesis Data Analytics
Big-Data-Speicherlösungen
- AWS-Datenspeicheroptionen
- Konzepte für Speicherlösungen
- Faktoren bei der Auswahl eines Datenspeichers
Big-Data-Verarbeitung und -Analytik
- Big Data-Verarbeitung und -Analysen
- Amazon Athena
Apache Hadoop und Amazon EMR
- Einführung in Amazon EMR und Apache Hadoop
- Bewährte Verfahren für das Einlesen von Daten
- Amazon EMR
- Amazon EMR-Architektur
Verwendung von Amazon EMR
- Entwickeln und Ausführen Ihrer Anwendung
- Starten Ihres Clusters
- Umgang mit der Ausgabe Ihrer abgeschlossenen Aufträge
Hadoop-Programmier-Frameworks
- Hadoop-Frameworks
- Andere Frameworks für den Einsatz auf Amazon EMR
Webschnittstellen auf Amazon EMR
- Hue auf Amazon EMR
- Überwachung Ihres Clusters
Apache Spark auf Amazon EMR
- Apache Spark
- Verwenden von Spark
Verwenden von AWS Glue zum Automatisieren von ETL-Arbeitslasten
- Was ist AWS Glue?
- AWS Glue: Job-Orchestrierung
Amazon Redshift und Big Data
- Data Warehouses vs. traditionelle Datenbanken
- Amazon Redshift
- Architektur von Amazon Redshift
Absicherung Ihrer Amazon-Bereitstellungen
- Absicherung Ihrer Amazon-Bereitstellungen
- Überblick über die Sicherheit von Amazon EMR
- Überblick über AWS Identity and Access Management (IAM)
- Sichern von Daten
- Amazon Kinesis-Sicherheitsüberblick
- Amazon DynamoDB-Sicherheitsübersicht
- Amazon Redshift-Sicherheitsüberblick
Verwalten von Big Data-Kosten
- Gesamtkostenüberlegungen für Amazon EMR
- Amazon EC2-Preismodelle
- Amazon Kinesis-Preismodelle
- Kostenüberlegungen für Amazon DynamoDB
- Kostenüberlegungen und Preismodelle für Amazon Redshift
- Kostenoptimierung mit AWS
Visualisierung und Orchestrierung von Big Data
- Visualisierung von Big Data
- Amazon QuickSight
- Orchestrierung eines Big-Data-Workflows
Big-Data-Entwurfsmuster
- Gemeinsame Architekturen