MOC 20773 Analyzing Big Data with Microsoft R

Classroom Schulung | deutsch | Anspruch

Schulungsdauer: 3 Tage

Ziele

In diesem Kurs lernen Sie Datasets mit dem Microsoft R Server zu analysieren und diese im Big Data Bereich zu verwenden.

Zielgruppe

Data Professionals

Voraussetzungen

  • Programmierkenntnisse mit R
  • Statistik- und Datenanalysekenntnisse
  • Erfahrungen mit dem Microsoft Windows Betriebssystem

Agenda

Microsoft R Server und R Client

  • Microsoft R Server
  • Verwendung von Microsoft R Client
  • Die ScaleR Funktionen

Erforschung von Big Data 

  • ScaleR Datenquellen verstehen
  • Einlesen von Daten in ein XDF Objekt
  • Zusammenfassen von Daten in ein XDF Objekt

Visualisierung von Big Data

  • Visualisierung von In-memory Daten
  • Visualisierung von Big Data

Big Data bearbeiten

  • Big Data umwandeln
  • Datasets verwalten

Analysis Operations parallelisieren

  • Verwenden des RxLocalParallel compute context mit rxExec
  • Verwenden des revoPemaR package

Regressionsmodelle erstellen und evaluieren

  • Clustering Big Data
  • Generieren von Regressionsmodellen und Vorhersagen

Partitioning Models erstellen und evaluieren

  • Partitioning Modelle basierend auf Entscheidungsbäumen erstellen
  • Testen von Partitioning Models mithilfe von Vorhersagen

Big Data in SQL Server und Hadoop

  • Verwendung von R in SQL Server
  • Hadoop Map/Reduce verwenden
  • Hadoop Spark verwenden

Ziele

In diesem Kurs lernen Sie Datasets mit dem Microsoft R Server zu analysieren und diese im Big Data Bereich zu verwenden.

Zielgruppe

Data Professionals

Voraussetzungen

  • Programmierkenntnisse mit R
  • Statistik- und Datenanalysekenntnisse
  • Erfahrungen mit dem Microsoft Windows Betriebssystem

Agenda

Microsoft R Server und R Client

  • Microsoft R Server
  • Verwendung von Microsoft R Client
  • Die ScaleR Funktionen

Erforschung von Big Data 

  • ScaleR Datenquellen verstehen
  • Einlesen von Daten in ein XDF Objekt
  • Zusammenfassen von Daten in ein XDF Objekt

Visualisierung von Big Data

  • Visualisierung von In-memory Daten
  • Visualisierung von Big Data

Big Data bearbeiten

  • Big Data umwandeln
  • Datasets verwalten

Analysis Operations parallelisieren

  • Verwenden des RxLocalParallel compute context mit rxExec
  • Verwenden des revoPemaR package

Regressionsmodelle erstellen und evaluieren

  • Clustering Big Data
  • Generieren von Regressionsmodellen und Vorhersagen

Partitioning Models erstellen und evaluieren

  • Partitioning Modelle basierend auf Entscheidungsbäumen erstellen
  • Testen von Partitioning Models mithilfe von Vorhersagen

Big Data in SQL Server und Hadoop

  • Verwendung von R in SQL Server
  • Hadoop Map/Reduce verwenden
  • Hadoop Spark verwenden

Diese Seite weiterempfehlen