Data Mining und Data Science mit MongoDB und Apache Spark

Classroom Schulung | deutsch | Anspruch

Schulungsdauer: 2 Tage

Ziele

In diesem Kurs lernen Sie MongoDB als Datenspeicher unter Spark zu betreiben, typische Data Mining und Data Science Workflows umzusetzen und dabei die Perfomancevorteile von MongoDB zu nutzen.

Zielgruppe

  • Data Mining Spezialisten
  • Data Science Spezialisten

Voraussetzungen

  • Datenbank-Grundwissen
  • Datenanalyse-Grundwissen
  • Kenntnisse im Bereich Data Mining und/oder Data Science
  • Kenntnisse der Programmiersprachen Scala, Python, Java, R

Agenda

Grundlagen

  • Spark
  • MongoDB
  • MongoDB Spark Connector

Hands-On: Testumgebung

  • MongoDB Installation
  • Spark Installation
  • Spark Connector
    • Installation
    • Konfiguration

MongoDB Performance und Indexierung

  • Erstellen von Indexen
  • Arten von Indexen
  • Performanceoptimierung durch Indexierung
  • Aggregation Framework und Aggregation Pipelines

Spark Connector und Scala

  • In MongoDB schreiben
  • Von MongoDB lesen
  • Filter und Aggregationen
  • Datasets und SQL
  • Spark Streaming

Spark Connector und Java

  • In MongoDB schreiben
  • Von MongoDB lesen
  • Aggregationen
  • Datasets und SQL

Spark Connector und Python

  • In MongoDB schreiben
  • Von MongoDB lesen
  • Aggregationen
  • Filter und SQL

Spark Connector und R

  • In MongoDB schreiben
  • Von MongoDB lesen
  • Aggregationen
  • Filter und SQL

Ziele

In diesem Kurs lernen Sie MongoDB als Datenspeicher unter Spark zu betreiben, typische Data Mining und Data Science Workflows umzusetzen und dabei die Perfomancevorteile von MongoDB zu nutzen.

Zielgruppe

  • Data Mining Spezialisten
  • Data Science Spezialisten

Voraussetzungen

  • Datenbank-Grundwissen
  • Datenanalyse-Grundwissen
  • Kenntnisse im Bereich Data Mining und/oder Data Science
  • Kenntnisse der Programmiersprachen Scala, Python, Java, R

Agenda

Grundlagen

  • Spark
  • MongoDB
  • MongoDB Spark Connector

Hands-On: Testumgebung

  • MongoDB Installation
  • Spark Installation
  • Spark Connector
    • Installation
    • Konfiguration

MongoDB Performance und Indexierung

  • Erstellen von Indexen
  • Arten von Indexen
  • Performanceoptimierung durch Indexierung
  • Aggregation Framework und Aggregation Pipelines

Spark Connector und Scala

  • In MongoDB schreiben
  • Von MongoDB lesen
  • Filter und Aggregationen
  • Datasets und SQL
  • Spark Streaming

Spark Connector und Java

  • In MongoDB schreiben
  • Von MongoDB lesen
  • Aggregationen
  • Datasets und SQL

Spark Connector und Python

  • In MongoDB schreiben
  • Von MongoDB lesen
  • Aggregationen
  • Filter und SQL

Spark Connector und R

  • In MongoDB schreiben
  • Von MongoDB lesen
  • Aggregationen
  • Filter und SQL

Diese Seite weiterempfehlen