Data Warehouse Lösung mit AWS
Classroom Schulung | Deutsch | Anspruch
Schulungsdauer: 3 Tage Durchführung gesichert
Ziele
In dieser 3-tägigen Schulung "Data Warehousing on AWS" lernen Sie die Konzepte, Strategien und Best Practices für das Entwerfen einer cloudbasierten Data Warehousing-Lösung mit Amazon Redshift kennen, dem Data Warehouse im Petabyte-Bereich in AWS. Der Kurs zeigt Ihnen, wie Sie Daten für das Data Warehouse sammeln, speichern und vorbereiten, indem Sie AWS-Services wie Amazon DynamoDB, Amazon EMR, Amazon Kinesis und Amazon S3 verwenden. Zusätzlich wird Ihnen gezeigt, wie Sie Amazon QuickSight nutzen können, um Analysen mit Ihren Daten durchzuführen.
Die Inhalte des Kurses umfassen die Diskussion der Kernkonzepte des Data Warehousing und der Überschneidung zwischen Data Warehousing und Big Data-Lösungen. Sie werden einen Amazon Redshift-Cluster starten und die Komponenten, Merkmale und Funktionen nutzen, um ein Data Warehouse in der Cloud zu implementieren. Weiterhin lernen Sie, wie andere AWS-Daten- und Analyseservices wie Amazon DynamoDB, Amazon EMR, Amazon Kinesis und Amazon S3 zur Data-Warehousing-Lösung beitragen können.
Sie werden die Data Warehouse-Architektur verstehen und in der Lage sein, Leistungsprobleme zu identifizieren, Abfragen zu optimieren und die Datenbank für eine bessere Leistung abzustimmen. Zudem erfahren Sie, wie Sie Amazon Redshift Spectrum verwenden können, um Daten direkt aus einem Amazon S3-Bucket zu analysieren, und wie Sie Amazon QuickSight für Datenanalyse- und Visualisierungsaufgaben mit dem Data Warehouse einsetzen.
Zielgruppe
- Datenbank-Architekten
- Datenbank-Administratoren
- Datenbank-Entwickler
- Datenanalysten
- Datenwissenschaftler
Voraussetzungen
- Teilnahme an der Schulung AWS technischer Grundkurs, oder vergleichbares Wissen
- Erfahrung mit relationalen Datenbanken und dem Designen von Datenbanken
Agenda
Einführung in Data Warehousing
- Relationale Datenbanken
- Data-Warehousing-Konzepte
- Der Schnittpunkt von Data Warehousing und Big Data
- Überblick über das Datenmanagement in AWS
- Hands-on Lab 1: Einführung in Amazon Redshift
Einführung in Amazon Redshift
- Konzeptioneller Überblick
- Anwendungsfälle aus der Praxis
- Hands-on Lab 2: Starten eines Amazon Redshift-Clusters
Starten von Clustern
- Aufbau des Clusters
- Verbinden mit dem Cluster
- Kontrolle des Zugriffs
- Datenbank-Sicherheit
- Daten laden
- Hands-on Lab 3: Optimieren von Datenbankschemata
Entwerfen des Datenbankschemas
- Schemas und Datentypen
- Spaltenweise Komprimierung
- Datenverteilungsstile
- Methoden zur Datensortierung
Identifizieren von Datenquellen
- Datenquellen im Überblick
- Amazon S3
- Amazon DynamoDB
- Amazon EMR
- Amazon Kinesis Daten-Firehose
- AWS Lambda-Datenbanklader für Amazon Redshift
- Hands-on Lab 4: Laden von Echtzeitdaten in eine Amazon Redshift-Datenbank
Laden von Daten
- Vorbereiten von Daten
- Laden von Daten mit COPY
- Pflegen von Tabellen
- Gleichzeitige Schreibzugriffe
- Troubleshooting bei Ladeproblemen
- Hands-on Lab 5: Laden von Daten mit dem COPY-Befehl
Schreiben von Abfragen und Tuning für die Leistung
- Amazon Redshift SQL
- Benutzerdefinierte Funktionen (UDFs)
- Faktoren, die die Abfrageleistung beeinflussen
- Der EXPLAIN-Befehl und Abfragepläne
- Arbeitslast-Verwaltung (WLM)
- Hands-on Lab 6: Konfigurieren der Arbeitslastverwaltung
Amazon Redshift Spectrum
- Amazon Redshift Spektrum
- Konfigurieren von Daten für Amazon Redshift Spectrum
- Abfragen von Amazon Redshift Spectrum
- Hands-on Lab 7: Verwenden von Amazon Redshift Spectrum
Wartung von Clustern
- Audit-Protokollierung
- Leistungsüberwachung
- Ereignisse und Benachrichtigungen
- Hands-on Lab: Auditing und Überwachung von Clustern
- Größenänderung von Clustern
- Sichern und Wiederherstellen von Clustern
- Ressourcenkennzeichnung, Limits und Beschränkungen
- Hands-on Lab 9: Sichern, Wiederherstellen und Größenänderung von Clustern
Analysieren und Visualisieren von Daten
- Leistung von Visualisierungen
- Erstellen von Dashboards
- Amazon QuickSight-Editionen und -Funktionen
Ziele
In dieser 3-tägigen Schulung "Data Warehousing on AWS" lernen Sie die Konzepte, Strategien und Best Practices für das Entwerfen einer cloudbasierten Data Warehousing-Lösung mit Amazon Redshift kennen, dem Data Warehouse im Petabyte-Bereich in AWS. Der Kurs zeigt Ihnen, wie Sie Daten für das Data Warehouse sammeln, speichern und vorbereiten, indem Sie AWS-Services wie Amazon DynamoDB, Amazon EMR, Amazon Kinesis und Amazon S3 verwenden. Zusätzlich wird Ihnen gezeigt, wie Sie Amazon QuickSight nutzen können, um Analysen mit Ihren Daten durchzuführen.
Die Inhalte des Kurses umfassen die Diskussion der Kernkonzepte des Data Warehousing und der Überschneidung zwischen Data Warehousing und Big Data-Lösungen. Sie werden einen Amazon Redshift-Cluster starten und die Komponenten, Merkmale und Funktionen nutzen, um ein Data Warehouse in der Cloud zu implementieren. Weiterhin lernen Sie, wie andere AWS-Daten- und Analyseservices wie Amazon DynamoDB, Amazon EMR, Amazon Kinesis und Amazon S3 zur Data-Warehousing-Lösung beitragen können.
Sie werden die Data Warehouse-Architektur verstehen und in der Lage sein, Leistungsprobleme zu identifizieren, Abfragen zu optimieren und die Datenbank für eine bessere Leistung abzustimmen. Zudem erfahren Sie, wie Sie Amazon Redshift Spectrum verwenden können, um Daten direkt aus einem Amazon S3-Bucket zu analysieren, und wie Sie Amazon QuickSight für Datenanalyse- und Visualisierungsaufgaben mit dem Data Warehouse einsetzen.
Zielgruppe
- Datenbank-Architekten
- Datenbank-Administratoren
- Datenbank-Entwickler
- Datenanalysten
- Datenwissenschaftler
Voraussetzungen
- Teilnahme an der Schulung AWS technischer Grundkurs, oder vergleichbares Wissen
- Erfahrung mit relationalen Datenbanken und dem Designen von Datenbanken
Agenda
Einführung in Data Warehousing
- Relationale Datenbanken
- Data-Warehousing-Konzepte
- Der Schnittpunkt von Data Warehousing und Big Data
- Überblick über das Datenmanagement in AWS
- Hands-on Lab 1: Einführung in Amazon Redshift
Einführung in Amazon Redshift
- Konzeptioneller Überblick
- Anwendungsfälle aus der Praxis
- Hands-on Lab 2: Starten eines Amazon Redshift-Clusters
Starten von Clustern
- Aufbau des Clusters
- Verbinden mit dem Cluster
- Kontrolle des Zugriffs
- Datenbank-Sicherheit
- Daten laden
- Hands-on Lab 3: Optimieren von Datenbankschemata
Entwerfen des Datenbankschemas
- Schemas und Datentypen
- Spaltenweise Komprimierung
- Datenverteilungsstile
- Methoden zur Datensortierung
Identifizieren von Datenquellen
- Datenquellen im Überblick
- Amazon S3
- Amazon DynamoDB
- Amazon EMR
- Amazon Kinesis Daten-Firehose
- AWS Lambda-Datenbanklader für Amazon Redshift
- Hands-on Lab 4: Laden von Echtzeitdaten in eine Amazon Redshift-Datenbank
Laden von Daten
- Vorbereiten von Daten
- Laden von Daten mit COPY
- Pflegen von Tabellen
- Gleichzeitige Schreibzugriffe
- Troubleshooting bei Ladeproblemen
- Hands-on Lab 5: Laden von Daten mit dem COPY-Befehl
Schreiben von Abfragen und Tuning für die Leistung
- Amazon Redshift SQL
- Benutzerdefinierte Funktionen (UDFs)
- Faktoren, die die Abfrageleistung beeinflussen
- Der EXPLAIN-Befehl und Abfragepläne
- Arbeitslast-Verwaltung (WLM)
- Hands-on Lab 6: Konfigurieren der Arbeitslastverwaltung
Amazon Redshift Spectrum
- Amazon Redshift Spektrum
- Konfigurieren von Daten für Amazon Redshift Spectrum
- Abfragen von Amazon Redshift Spectrum
- Hands-on Lab 7: Verwenden von Amazon Redshift Spectrum
Wartung von Clustern
- Audit-Protokollierung
- Leistungsüberwachung
- Ereignisse und Benachrichtigungen
- Hands-on Lab: Auditing und Überwachung von Clustern
- Größenänderung von Clustern
- Sichern und Wiederherstellen von Clustern
- Ressourcenkennzeichnung, Limits und Beschränkungen
- Hands-on Lab 9: Sichern, Wiederherstellen und Größenänderung von Clustern
Analysieren und Visualisieren von Daten
- Leistung von Visualisierungen
- Erstellen von Dashboards
- Amazon QuickSight-Editionen und -Funktionen