Einführung in R

Classroom Schulung | deutsch | Anspruch

Schulungsdauer: 3 Tage

Ziele

In diesem Kurs erhalten Sie einen Überblick über verwendete Algorithmik, um Data Science Ergebnisse besser verstehen und kritisch hinterfragen zu können.

Zielgruppe

Fach- und Führungskräfte aus dem Bereich Data Science

Voraussetzungen

  • Programmiersprachen oder VBA-Programmierung Grundlagenkennisse
  • Grundlagenwissen in Statistik

Agenda

R: eine der meistverwendeten Data Science Programmiersprachen

  • Geschichte
  • Hintergrund
  • Anwendungsmöglichkeiten
  • Einbindung
  • Überblick über die wichtigsten data structures in R
    • vector
    • list
    • matrix
    • data frame
    • factors
  • Erste Schritte mit R

Einführung data.table

  • Einführung in die Besonderheit des data.table Pakets
  • Erzeugung eines data.table
  • Subsetting
  • Indexierung

Daten einlesen und schreiben (foreign)

  • Möglichkeiten verschiedene Datenformate einzulesen
  • Einlesen und schreiben
    • in RData
    • aus anderen Formaten

Datenmanipulation (data.table)

  • Manipulation auf einem data.table bei
    • Zeilen
    • Spalten
  • Daten
    • Zusammenfassen
    • Filtern
  • Neue Variablen anhängen
  • Ersetzen fehlender Werte
  • Summary Funktionen

Grundlagen Datenvisualisierung

  • Struktur der Befehle bei der Benutzung von ggplot2
  • Layer von ggplot2
  • Einfache Plots
    • Scatter
    • Line
    • Boxplot
    • Kernel Density

Grundlegende Statistiken und Tests (stats)

  • Wichtige grundlegende Statistiken
  • Korrelationen
    • Spearman
    • Pearson
  • Gebräuchliche Test
  • Zufallszahlen aus verschiedenen Verteilungen erzeugen

Fortgeschrittene Benutzung eines data.tables (data.table)

  • Wichtige grundlegende Statistiken
  • Korrelationen
    • Spearman
    • Pearson
  • Gebräuchliche Tests
    • t-test
    • Kolmogorov

Control Flows

  • Control Flows in R
  • If und if-else
  • For-Schleifen
  • Schreiben einer eigenen Funktion

Machine Learning Algorithmen

  • Technischer Überblick Machine Learning Algorithmen
    • supervised
    • unsupervised
  • Vertiefung einzelner ML Algorithmen
  • Validierungsmöglichkeiten

Algorithmen mit R

  • Einführung Algorithmen in R
  • Eigenständiges Arbeiten, um verschiedene Algorithmen zu testen und zu validieren

Fallbeispiel

Ziele

In diesem Kurs erhalten Sie einen Überblick über verwendete Algorithmik, um Data Science Ergebnisse besser verstehen und kritisch hinterfragen zu können.

Zielgruppe

Fach- und Führungskräfte aus dem Bereich Data Science

Voraussetzungen

  • Programmiersprachen oder VBA-Programmierung Grundlagenkennisse
  • Grundlagenwissen in Statistik

Agenda

R: eine der meistverwendeten Data Science Programmiersprachen

  • Geschichte
  • Hintergrund
  • Anwendungsmöglichkeiten
  • Einbindung
  • Überblick über die wichtigsten data structures in R
    • vector
    • list
    • matrix
    • data frame
    • factors
  • Erste Schritte mit R

Einführung data.table

  • Einführung in die Besonderheit des data.table Pakets
  • Erzeugung eines data.table
  • Subsetting
  • Indexierung

Daten einlesen und schreiben (foreign)

  • Möglichkeiten verschiedene Datenformate einzulesen
  • Einlesen und schreiben
    • in RData
    • aus anderen Formaten

Datenmanipulation (data.table)

  • Manipulation auf einem data.table bei
    • Zeilen
    • Spalten
  • Daten
    • Zusammenfassen
    • Filtern
  • Neue Variablen anhängen
  • Ersetzen fehlender Werte
  • Summary Funktionen

Grundlagen Datenvisualisierung

  • Struktur der Befehle bei der Benutzung von ggplot2
  • Layer von ggplot2
  • Einfache Plots
    • Scatter
    • Line
    • Boxplot
    • Kernel Density

Grundlegende Statistiken und Tests (stats)

  • Wichtige grundlegende Statistiken
  • Korrelationen
    • Spearman
    • Pearson
  • Gebräuchliche Test
  • Zufallszahlen aus verschiedenen Verteilungen erzeugen

Fortgeschrittene Benutzung eines data.tables (data.table)

  • Wichtige grundlegende Statistiken
  • Korrelationen
    • Spearman
    • Pearson
  • Gebräuchliche Tests
    • t-test
    • Kolmogorov

Control Flows

  • Control Flows in R
  • If und if-else
  • For-Schleifen
  • Schreiben einer eigenen Funktion

Machine Learning Algorithmen

  • Technischer Überblick Machine Learning Algorithmen
    • supervised
    • unsupervised
  • Vertiefung einzelner ML Algorithmen
  • Validierungsmöglichkeiten

Algorithmen mit R

  • Einführung Algorithmen in R
  • Eigenständiges Arbeiten, um verschiedene Algorithmen zu testen und zu validieren

Fallbeispiel

Diese Seite weiterempfehlen