Einführung in R
Classroom Schulung | Deutsch | Anspruch
Schulungsdauer: 3 Tage
Ziele
R ist mit über zwei Millionen Nutzern weltweit eine der meistverwendeten Programmiersprachen im data science. Als eine der de-facto data science Programmiersprachen (neben Python) bieten viele data science Softwareanbieter Schnittstellen zu R an. Die Teilnehmer lernen einen Überblick über verwendete Algorithmik, um Data Science Ergebnisse besser zu verstehen und kritisch hinterfragen zu lernen. Die Grundlagen der Programmiersprache R werden erlernt, so dass ein selbstständiges Arbeiten möglich ist.
Im Seminar ist wenig theoretischer Input. Überwiegend arbeiten die Teilnehmer selbstständig mit Unterstützung des Trainers, um das Erlernte direkt umzusetzen und anzuwenden.
Zielgruppe
Fach- und Führungskräfte aus dem Bereich Data Science
Voraussetzungen
- Programmiersprachen oder VBA-Programmierung Grundlagenkennisse
- Grundlagenwissen in Statistik
Agenda
Warum ist R eine der meistverwendeten Data Science Programmiersprachen?
- Geschichte und Hintergrund von R
- Anwendungsmöglichkeiten und Einbindung von R
- Überblick über die wichtigsten data structures in R (vector, list, matrix, data frame, factors)
- Hands-On: Erste Schritte mit R
Data.table - Einführung (data.table)
- Einführung in die Besonderheit vom data.table Paket
- Erzeugen eines data.table
- Subsetting
- Indexierung
Daten einlesen und Schreiben (foreign)
- Welche Möglichkeiten gibt es, verschiedene Datenformate einzulesen?
- Einlesen und Schrieben in RData
- Einlesen und Schreiben aus anderen Formaten (xls, csv, dat,...)
Datenmanipulation (data.table)
- Manipulation auf einem data.table bei Zeilen und Spalten
- Zusammenfassen und Filtern von Daten
- Neue Variablen anhängen
- Fehlende Werte ersetzen
- Summary Funktionen
Grundlagen der Datenvisualisierung
- Struktur der Befehle bei der Benutzung von ggplot2
- Die Layer von ggplot2
- Einfache Plots (Scatter, Line, Boxplot, Kernel Density)
Grundlegende Statistiken und Tests (stats)
- Wichtige grundlegende Statistiken
- Korrelationen (Spearman, Pearson)
- Gebräuchliche Test (t-test, Kolmogorov-Smirnox,...)
- Erzeugen von Zufallszahlen aus verschiedenen Verteilungen
Fortgeschrittene Benutzung eines data.tables (data.table)
- Wichtige grundlegende Statistiken
- Korrelationen (Spearman, Pearson)
- Gebräuchliche Tests (t-test, Kolmogorov)
Control Flows
- Control Flows in R
- If und if-else
- For Schleifen
- Eine eigene Funktion schreiben
Die Mächtigkeit von Machine Learning Algorithmen
- Technischer Überblick über Machine Learning Algorithmen (supervised, unsupervised)
- Vertiefung einzelner ML Algorithmen
- Validierungsmöglichkeiten: Wie bestimme ich die Generalisierung meiner Lösung?
Hands-On: Algorithmen mit R
- Einführung wie Algorithmen in R verwendet werden
- Hands-On: Eigenständiges Arbeiten, um verschiedene Algorithmen zu testen und zu validieren
Hands-On: Fallbeispiel
- Eigenständiges Arbeiten, um das bisher gelernte anhand eines Fallbeispiels anzuwenden
Ziele
R ist mit über zwei Millionen Nutzern weltweit eine der meistverwendeten Programmiersprachen im data science. Als eine der de-facto data science Programmiersprachen (neben Python) bieten viele data science Softwareanbieter Schnittstellen zu R an. Die Teilnehmer lernen einen Überblick über verwendete Algorithmik, um Data Science Ergebnisse besser zu verstehen und kritisch hinterfragen zu lernen. Die Grundlagen der Programmiersprache R werden erlernt, so dass ein selbstständiges Arbeiten möglich ist.
Im Seminar ist wenig theoretischer Input. Überwiegend arbeiten die Teilnehmer selbstständig mit Unterstützung des Trainers, um das Erlernte direkt umzusetzen und anzuwenden.
Zielgruppe
Fach- und Führungskräfte aus dem Bereich Data Science
Voraussetzungen
- Programmiersprachen oder VBA-Programmierung Grundlagenkennisse
- Grundlagenwissen in Statistik
Agenda
Warum ist R eine der meistverwendeten Data Science Programmiersprachen?
- Geschichte und Hintergrund von R
- Anwendungsmöglichkeiten und Einbindung von R
- Überblick über die wichtigsten data structures in R (vector, list, matrix, data frame, factors)
- Hands-On: Erste Schritte mit R
Data.table - Einführung (data.table)
- Einführung in die Besonderheit vom data.table Paket
- Erzeugen eines data.table
- Subsetting
- Indexierung
Daten einlesen und Schreiben (foreign)
- Welche Möglichkeiten gibt es, verschiedene Datenformate einzulesen?
- Einlesen und Schrieben in RData
- Einlesen und Schreiben aus anderen Formaten (xls, csv, dat,...)
Datenmanipulation (data.table)
- Manipulation auf einem data.table bei Zeilen und Spalten
- Zusammenfassen und Filtern von Daten
- Neue Variablen anhängen
- Fehlende Werte ersetzen
- Summary Funktionen
Grundlagen der Datenvisualisierung
- Struktur der Befehle bei der Benutzung von ggplot2
- Die Layer von ggplot2
- Einfache Plots (Scatter, Line, Boxplot, Kernel Density)
Grundlegende Statistiken und Tests (stats)
- Wichtige grundlegende Statistiken
- Korrelationen (Spearman, Pearson)
- Gebräuchliche Test (t-test, Kolmogorov-Smirnox,...)
- Erzeugen von Zufallszahlen aus verschiedenen Verteilungen
Fortgeschrittene Benutzung eines data.tables (data.table)
- Wichtige grundlegende Statistiken
- Korrelationen (Spearman, Pearson)
- Gebräuchliche Tests (t-test, Kolmogorov)
Control Flows
- Control Flows in R
- If und if-else
- For Schleifen
- Eine eigene Funktion schreiben
Die Mächtigkeit von Machine Learning Algorithmen
- Technischer Überblick über Machine Learning Algorithmen (supervised, unsupervised)
- Vertiefung einzelner ML Algorithmen
- Validierungsmöglichkeiten: Wie bestimme ich die Generalisierung meiner Lösung?
Hands-On: Algorithmen mit R
- Einführung wie Algorithmen in R verwendet werden
- Hands-On: Eigenständiges Arbeiten, um verschiedene Algorithmen zu testen und zu validieren
Hands-On: Fallbeispiel
- Eigenständiges Arbeiten, um das bisher gelernte anhand eines Fallbeispiels anzuwenden