Einstieg in Big Data mit Hadoop

nicht mehr verfügbar

Classroom Schulung | Deutsch | Anspruch

Schulungsdauer: 3 Tage

Ziele

In diesem Kurs erhalten Sie einen Überblick über die Funktionsweise von Apache Hadoop.

Zielgruppe

  • IT Architekten
  • Applikations-Entwickler und -Verantwortliche
  • Datenbank Entwickler und Administratoren

Voraussetzungen

  • Linux Grundkenntnisse
  • Java Grundkenntnisse
  • Scripting Grundkenntnisse
    • shell
    • python
    • perl
  • SQL Grundkenntnisse

Agenda

 

Theorie

  • Entstehung Hadoop
  • Wie funktioniert MapReduce? Was sind die Vor- und Nachteile?
  • Aufbau eines Hadoop Clusters (fertige Distributionen und Eigenbau, Hardware Anforderungen)
  • Funktion des HDFS (Hadoop Distributed File System)

Praxis

  • Hadoop Streaming (schreiben von Beispiel Jobs mit einfachen Shell Scripten)
  • Hive - ein Tool, das SQL ähnliche Anweisungen in skalierbare Hadoop Jobs übersetzt
  • Kurzvorstellung von weiteren Tools (z.B. HBase, Pig, ...)- Theorie: Java Entwicklung mit/für Hadoop
  • Praxisbeispiele

Ziele

In diesem Kurs erhalten Sie einen Überblick über die Funktionsweise von Apache Hadoop.

Zielgruppe

  • IT Architekten
  • Applikations-Entwickler und -Verantwortliche
  • Datenbank Entwickler und Administratoren

Voraussetzungen

  • Linux Grundkenntnisse
  • Java Grundkenntnisse
  • Scripting Grundkenntnisse
    • shell
    • python
    • perl
  • SQL Grundkenntnisse

Agenda

 

Theorie

  • Entstehung Hadoop
  • Wie funktioniert MapReduce? Was sind die Vor- und Nachteile?
  • Aufbau eines Hadoop Clusters (fertige Distributionen und Eigenbau, Hardware Anforderungen)
  • Funktion des HDFS (Hadoop Distributed File System)

Praxis

  • Hadoop Streaming (schreiben von Beispiel Jobs mit einfachen Shell Scripten)
  • Hive - ein Tool, das SQL ähnliche Anweisungen in skalierbare Hadoop Jobs übersetzt
  • Kurzvorstellung von weiteren Tools (z.B. HBase, Pig, ...)- Theorie: Java Entwicklung mit/für Hadoop
  • Praxisbeispiele

Tags