Einführung in R

Classroom Schulung | Deutsch | Anspruch

Schulungsdauer: 3 Tage

Ziele

R ist mit über zwei Millionen Nutzern weltweit eine der meistverwendeten Programmiersprachen im data science. Als eine der de-facto data science Programmiersprachen (neben Python) bieten viele data science Softwareanbieter Schnittstellen zu R an. Die Teilnehmer lernen einen Überblick über verwendete Algorithmik, um Data Science Ergebnisse besser zu verstehen und kritisch hinterfragen zu lernen. Die Grundlagen der Programmiersprache R werden erlernt, so dass ein selbstständiges Arbeiten möglich ist.

Im Seminar ist wenig theoretischer Input. Überwiegend arbeiten die Teilnehmer selbstständig mit Unterstützung des Trainers, um das Erlernte direkt umzusetzen und anzuwenden.

Zielgruppe

Fach- und Führungskräfte aus dem Bereich Data Science

Voraussetzungen

  • Programmiersprachen oder VBA-Programmierung Grundlagenkennisse
  • Grundlagenwissen in Statistik

Agenda

Warum ist R eine der meistverwendeten Data Science Programmiersprachen?

  • Geschichte und Hintergrund von R
  • Anwendungsmöglichkeiten und Einbindung von R
  • Überblick über die wichtigsten data structures in R (vector, list, matrix, data frame, factors)
  • Hands-On: Erste Schritte mit R

Data.table - Einführung (data.table)

  • Einführung in die Besonderheit vom data.table Paket
  • Erzeugen eines data.table
  • Subsetting
  • Indexierung

Daten einlesen und Schreiben (foreign)

  • Welche Möglichkeiten gibt es, verschiedene Datenformate einzulesen?
  • Einlesen und Schrieben in RData
  • Einlesen und Schreiben aus anderen Formaten (xls, csv, dat,...)

Datenmanipulation (data.table)

  • Manipulation auf einem data.table bei Zeilen und Spalten
  • Zusammenfassen und Filtern von Daten
  • Neue Variablen anhängen
  • Fehlende Werte ersetzen
  • Summary Funktionen

Grundlagen der Datenvisualisierung

  • Struktur der Befehle bei der Benutzung von ggplot2
  • Die Layer von ggplot2
  • Einfache Plots (Scatter, Line, Boxplot, Kernel Density)

Grundlegende Statistiken und Tests (stats)

  • Wichtige grundlegende Statistiken
  • Korrelationen (Spearman, Pearson)
  • Gebräuchliche Test (t-test, Kolmogorov-Smirnox,...)
  • Erzeugen von Zufallszahlen aus verschiedenen Verteilungen

Fortgeschrittene Benutzung eines data.tables (data.table)

  • Wichtige grundlegende Statistiken
  • Korrelationen (Spearman, Pearson)
  • Gebräuchliche Tests (t-test, Kolmogorov)

Control Flows

  • Control Flows in R
  • If und if-else
  • For Schleifen
  • Eine eigene Funktion schreiben

Die Mächtigkeit von Machine Learning Algorithmen

  • Technischer Überblick über Machine Learning Algorithmen (supervised, unsupervised)
  • Vertiefung einzelner ML Algorithmen
  • Validierungsmöglichkeiten: Wie bestimme ich die Generalisierung meiner Lösung?

Hands-On: Algorithmen mit R

  • Einführung wie Algorithmen in R verwendet werden
  • Hands-On: Eigenständiges Arbeiten, um verschiedene Algorithmen zu testen und zu validieren

Hands-On: Fallbeispiel

  • Eigenständiges Arbeiten, um das bisher gelernte anhand eines Fallbeispiels anzuwenden

Ziele

R ist mit über zwei Millionen Nutzern weltweit eine der meistverwendeten Programmiersprachen im data science. Als eine der de-facto data science Programmiersprachen (neben Python) bieten viele data science Softwareanbieter Schnittstellen zu R an. Die Teilnehmer lernen einen Überblick über verwendete Algorithmik, um Data Science Ergebnisse besser zu verstehen und kritisch hinterfragen zu lernen. Die Grundlagen der Programmiersprache R werden erlernt, so dass ein selbstständiges Arbeiten möglich ist.

Im Seminar ist wenig theoretischer Input. Überwiegend arbeiten die Teilnehmer selbstständig mit Unterstützung des Trainers, um das Erlernte direkt umzusetzen und anzuwenden.

Zielgruppe

Fach- und Führungskräfte aus dem Bereich Data Science

Voraussetzungen

  • Programmiersprachen oder VBA-Programmierung Grundlagenkennisse
  • Grundlagenwissen in Statistik

Agenda

Warum ist R eine der meistverwendeten Data Science Programmiersprachen?

  • Geschichte und Hintergrund von R
  • Anwendungsmöglichkeiten und Einbindung von R
  • Überblick über die wichtigsten data structures in R (vector, list, matrix, data frame, factors)
  • Hands-On: Erste Schritte mit R

Data.table - Einführung (data.table)

  • Einführung in die Besonderheit vom data.table Paket
  • Erzeugen eines data.table
  • Subsetting
  • Indexierung

Daten einlesen und Schreiben (foreign)

  • Welche Möglichkeiten gibt es, verschiedene Datenformate einzulesen?
  • Einlesen und Schrieben in RData
  • Einlesen und Schreiben aus anderen Formaten (xls, csv, dat,...)

Datenmanipulation (data.table)

  • Manipulation auf einem data.table bei Zeilen und Spalten
  • Zusammenfassen und Filtern von Daten
  • Neue Variablen anhängen
  • Fehlende Werte ersetzen
  • Summary Funktionen

Grundlagen der Datenvisualisierung

  • Struktur der Befehle bei der Benutzung von ggplot2
  • Die Layer von ggplot2
  • Einfache Plots (Scatter, Line, Boxplot, Kernel Density)

Grundlegende Statistiken und Tests (stats)

  • Wichtige grundlegende Statistiken
  • Korrelationen (Spearman, Pearson)
  • Gebräuchliche Test (t-test, Kolmogorov-Smirnox,...)
  • Erzeugen von Zufallszahlen aus verschiedenen Verteilungen

Fortgeschrittene Benutzung eines data.tables (data.table)

  • Wichtige grundlegende Statistiken
  • Korrelationen (Spearman, Pearson)
  • Gebräuchliche Tests (t-test, Kolmogorov)

Control Flows

  • Control Flows in R
  • If und if-else
  • For Schleifen
  • Eine eigene Funktion schreiben

Die Mächtigkeit von Machine Learning Algorithmen

  • Technischer Überblick über Machine Learning Algorithmen (supervised, unsupervised)
  • Vertiefung einzelner ML Algorithmen
  • Validierungsmöglichkeiten: Wie bestimme ich die Generalisierung meiner Lösung?

Hands-On: Algorithmen mit R

  • Einführung wie Algorithmen in R verwendet werden
  • Hands-On: Eigenständiges Arbeiten, um verschiedene Algorithmen zu testen und zu validieren

Hands-On: Fallbeispiel

  • Eigenständiges Arbeiten, um das bisher gelernte anhand eines Fallbeispiels anzuwenden

Tags

R

Diese Seite weiterempfehlen