MOC 20773 Analyzing Big Data with Microsoft R

Classroom Schulung | deutsch | Anspruch

Schulungsdauer: 3 Tage

Ziele

In dieser 3-tägigen Schulung lernen die Teilnehmer das Analysieren großer Datasets mithilfe von Microsoft R Server sowie dessen Verwendung im Big Data Bereich, wie Hadoop oder Spark Cluster oder einer SQL Server Datenbank.

Zielgruppe

Data Professionals

Voraussetzungen

  • Kenntnisse im Programmieren mit R
  • Statistik- und Datenanalysekenntnisse
  • Microsoft Windows Betriebssystem Erfahrunge

Agenda

Microsoft R Server und R Client

  • Was ist Microsoft R Server?
  • Verwendung von Microsoft R Client
  • Die ScaleR Funktionen

Big Data erforschen

  • ScaleR Datenquellen verstehen
  • Einlesen von Daten in ein XDF Objekt
  • Zusammenfassen von Daten in ein XDF Objekt

Big Data visualisieren

  • Visualisierung von In-memory Daten
  • Visualisierung von Big Data

Big Data bearbeiten

  • Big Data umwandeln
  • Datasets verwalten

Analysis Operations parallelisieren

  • Verwenden des RxLocalParallel compute context mit rxExec
  • Verwenden des revoPemaR package

Regressionsmodelle erstellen und evaluieren

  • Clustering Big Data
  • Generieren von Regressionsmodellen und Vorhersagen

Partitioning Models erstellen und evaluieren

  • Erstellen von Partitioning Models basierend auf Entscheidungsbäumen
  • Testen von Partitioning Models mithilfe von Vorhersagen

Big Data in SQL Server und Hadoop

  • R in SQL Server verwenden
  • Hadoop Map/Reduce verwenden
  • Hadoop Spark verwenden

Ziele

In dieser 3-tägigen Schulung lernen die Teilnehmer das Analysieren großer Datasets mithilfe von Microsoft R Server sowie dessen Verwendung im Big Data Bereich, wie Hadoop oder Spark Cluster oder einer SQL Server Datenbank.

Zielgruppe

Data Professionals

Voraussetzungen

  • Kenntnisse im Programmieren mit R
  • Statistik- und Datenanalysekenntnisse
  • Microsoft Windows Betriebssystem Erfahrunge

Agenda

Microsoft R Server und R Client

  • Was ist Microsoft R Server?
  • Verwendung von Microsoft R Client
  • Die ScaleR Funktionen

Big Data erforschen

  • ScaleR Datenquellen verstehen
  • Einlesen von Daten in ein XDF Objekt
  • Zusammenfassen von Daten in ein XDF Objekt

Big Data visualisieren

  • Visualisierung von In-memory Daten
  • Visualisierung von Big Data

Big Data bearbeiten

  • Big Data umwandeln
  • Datasets verwalten

Analysis Operations parallelisieren

  • Verwenden des RxLocalParallel compute context mit rxExec
  • Verwenden des revoPemaR package

Regressionsmodelle erstellen und evaluieren

  • Clustering Big Data
  • Generieren von Regressionsmodellen und Vorhersagen

Partitioning Models erstellen und evaluieren

  • Erstellen von Partitioning Models basierend auf Entscheidungsbäumen
  • Testen von Partitioning Models mithilfe von Vorhersagen

Big Data in SQL Server und Hadoop

  • R in SQL Server verwenden
  • Hadoop Map/Reduce verwenden
  • Hadoop Spark verwenden

Diese Seite weiterempfehlen