Data Science mit Python

Classroom Schulung | Deutsch | Anspruch

Schulungsdauer: 3 Tage Durchführung gesichert

Ziele

Python ist neben R die Programmiersprache, die am häufigsten im Zusammenhang mit Data Science, Datenanalyse und Machine Learning genutzt wird. Nach dem Seminar verstehen Sie Python im Kontext von Data Science einzusetzen. Sie erlernen die grundlegenden Funktionen von Algorithmen im python-gestützten Machine Learning und wissen, wie Sie weitergehende Algorithmen entwickeln. Einlesen, Aufbereiten und Visualiseren von Daten verschiedener Herkunft ist Ihnen nach diesem Seminar ebenfalls vertraut.

Zielgruppe

Fach- und Führungskräfte, Projektleiter für Data Science Projekte

Voraussetzungen

Grundkenntnisse in Python, Grundwissen Statistik

Agenda

Python-Entwicklungsumgebung

  • Installieren neuer Pakete
  • Hands-On: Erste Schritte mit Python
  • Virtuelle Umgebungen mit venv für projekt-spezifische Software-Entwicklung

Einführung in NumPy

  • Listen, Arrays und NumPy-Datentypen
  • Berechnungen in Arrays
  • Broadcasting
  • Fancy Indexing

Einführung in Pandas

  • Datenaufbereitung
  • Indexierung und Slicing eines DataFrames
  • Hands-On: Eigenständiges Arbeiten mit Datenstrukturen

Daten einlesen

  • Unterschiedliche Datenformate
  • Konvertieren von Daten
  • Objekte in Pandas (Series Object, DataFrame Object, Index Object)
  • Universal Function (ufunc) mit Pandas
  • Hierarchical Indexing
  • Arbeiten mit Datasets (Merge, Join)
  • Aggregation von Datasets (Grouping)
  • Hands-On: Eigenständiges Arbeiten, um Daten verschiedener Formate einzulesen und zu konvertieren

Grundlegende Statistiken (pandas)

  • Erstellen von grundlegenden, deskriptiven Statistiken
  • Kontingenztafeln erstellen
  • Hands-On: Eigenständiges Arbeiten, um Daten verschiedener Formate einzulesen, zu konvertieren und erste Statistiken zu erstellen

Datenvisualisierung (matplotlib)

  • Typische Datenvisualisierungen
  • Datenvisualisierung in Python
  • Datenanalyse mit matplotlib
  • Histogramme
  • Anpassen von Legenden, Farben, Anmerkungen
  • Hands-On: Eigenständiges Arbeiten mit Visualisierungen in Python

Machine Learning Algorithmen

  • Feature Engineering
  • Technischer Überblick über Machine Learning Algorithmen (supervised, unsupervised)
  • Supervised Learning
    • Regression
    • Decision Trees und Random Forests
    • Support Vector Machines
  • Unsupervised Learning
    • K-Means-Clustering
    • Principal Component Analysis
    • Gaussian Mixture Models
  • Vertiefung einzelner ML Algorithmen
  • Validierungsmöglichkeiten: Wie bestimme ich die Generalisierung meiner Lösung

Hands-On: Algorithmen in Python (scikit-learn und tensorflow)

  • Einführung: wie Python Algorithmen verwendet
  • Hands-On: Eigenständiges Arbeiten, um verschiedene Algorithmen zu testen und zu validieren
  • Beispiele in Frameworks scikit-learn und tensorflow für supervised und unsupervised learning

Ziele

Python ist neben R die Programmiersprache, die am häufigsten im Zusammenhang mit Data Science, Datenanalyse und Machine Learning genutzt wird. Nach dem Seminar verstehen Sie Python im Kontext von Data Science einzusetzen. Sie erlernen die grundlegenden Funktionen von Algorithmen im python-gestützten Machine Learning und wissen, wie Sie weitergehende Algorithmen entwickeln. Einlesen, Aufbereiten und Visualiseren von Daten verschiedener Herkunft ist Ihnen nach diesem Seminar ebenfalls vertraut.

Zielgruppe

Fach- und Führungskräfte, Projektleiter für Data Science Projekte

Voraussetzungen

Grundkenntnisse in Python, Grundwissen Statistik

Agenda

Python-Entwicklungsumgebung

  • Installieren neuer Pakete
  • Hands-On: Erste Schritte mit Python
  • Virtuelle Umgebungen mit venv für projekt-spezifische Software-Entwicklung

Einführung in NumPy

  • Listen, Arrays und NumPy-Datentypen
  • Berechnungen in Arrays
  • Broadcasting
  • Fancy Indexing

Einführung in Pandas

  • Datenaufbereitung
  • Indexierung und Slicing eines DataFrames
  • Hands-On: Eigenständiges Arbeiten mit Datenstrukturen

Daten einlesen

  • Unterschiedliche Datenformate
  • Konvertieren von Daten
  • Objekte in Pandas (Series Object, DataFrame Object, Index Object)
  • Universal Function (ufunc) mit Pandas
  • Hierarchical Indexing
  • Arbeiten mit Datasets (Merge, Join)
  • Aggregation von Datasets (Grouping)
  • Hands-On: Eigenständiges Arbeiten, um Daten verschiedener Formate einzulesen und zu konvertieren

Grundlegende Statistiken (pandas)

  • Erstellen von grundlegenden, deskriptiven Statistiken
  • Kontingenztafeln erstellen
  • Hands-On: Eigenständiges Arbeiten, um Daten verschiedener Formate einzulesen, zu konvertieren und erste Statistiken zu erstellen

Datenvisualisierung (matplotlib)

  • Typische Datenvisualisierungen
  • Datenvisualisierung in Python
  • Datenanalyse mit matplotlib
  • Histogramme
  • Anpassen von Legenden, Farben, Anmerkungen
  • Hands-On: Eigenständiges Arbeiten mit Visualisierungen in Python

Machine Learning Algorithmen

  • Feature Engineering
  • Technischer Überblick über Machine Learning Algorithmen (supervised, unsupervised)
  • Supervised Learning
    • Regression
    • Decision Trees und Random Forests
    • Support Vector Machines
  • Unsupervised Learning
    • K-Means-Clustering
    • Principal Component Analysis
    • Gaussian Mixture Models
  • Vertiefung einzelner ML Algorithmen
  • Validierungsmöglichkeiten: Wie bestimme ich die Generalisierung meiner Lösung

Hands-On: Algorithmen in Python (scikit-learn und tensorflow)

  • Einführung: wie Python Algorithmen verwendet
  • Hands-On: Eigenständiges Arbeiten, um verschiedene Algorithmen zu testen und zu validieren
  • Beispiele in Frameworks scikit-learn und tensorflow für supervised und unsupervised learning

Tags

Diese Seite weiterempfehlen