Data Mining mit Python Einführungskurs
Classroom Schulung | Deutsch | Anspruch
Schulungsdauer: 3 Tage Durchführung gesichert
Ziele
Python ist eine der weitverbreitesten Programmiersprachen, welche im Data Science Bereich Fuß fasst. Neben R ist sie derzeit eine der meist benutzten Data Science Programmiersprachen. Die Teilnehmer lernen einen Überblick über verwendete Algorithmik, um Data Science Ergebnisse besser zu verstehen und kritisch hinterfragen zu lernen. Die Grundlagen der Programmiersprache Python werden erlernt, so dass ein selbstständiges Arbeiten möglich ist.
Zielgruppe
- technisch interessierte Fach- und Führungskräfte
Voraussetzungen
- Grundlagenkennisse in Programmiersprachen oder VBA-Programmierung
- Grundlagenwissen in Statistik
Agenda
Hintergrund von Python
- Geschichte und Hintergrund von Python
- Installieren von neuen Paketen
- Hands-On: Erste Schritte mit Python
- Cross Industry Standard Process for Data Mining (CRISP-DM)
Hands-On: Data handling (pandas)
- Einführung in grundlegende Datenstrukturen
- Indexierung und Slicing eines DataFrames
- Hands-On: Eigenständiges Arbeiten mit Datenstrukturen
Hands-On: Daten einlesen
- Welche Möglichkeiten gibt es, Datenformate einzulesen?
- Konvertieren von Daten
- Hands-On: Eigenständiges Arbeiten, um Daten verschiedener Formate einzulesen und zu konvertieren
Hands-On: Grundlegende Statistiken (pandas)
- Erstellen von grundlegenden, deskriptiven Statistiken
- Kontingenztafeln erstellen
- Hands-On: Eigenständiges Arbeiten, um Daten verschiedener Formate einzulesen, zu konvertieren und erste Statistiken zu erstellen
Hands-On: Datenvisualisierung (matplotlib)
- Vertiefung und Wiederholung von typischen Datenvisualisierungen
- Datenvisualisierung in Python
- Hands-On: Eigenständiges Arbeiten mit Visualisierungen in Python
Die Mächtigkeit von Machine Learning Algorithmen
- Technischer Überblick über Machine Learning Algorithmen (supervised, unsupervised)
- Vertiefung einzelner ML Algorithmen
- Validierungsmöglichkeiten: Wie bestimme ich die Generalisierung meiner Lösung
Hands-On: Algorithmen in Python (scikit-learn)
- Einführung: wie Python Algorithmen verwendet
- Hands-On: Eigenständiges Arbeiten, um verschiedene Algorithmen zu testen und zu validieren
Hands-On: Fallbeispiel
Zusammenfassung und Abschlussdiskusion
Ziele
Python ist eine der weitverbreitesten Programmiersprachen, welche im Data Science Bereich Fuß fasst. Neben R ist sie derzeit eine der meist benutzten Data Science Programmiersprachen. Die Teilnehmer lernen einen Überblick über verwendete Algorithmik, um Data Science Ergebnisse besser zu verstehen und kritisch hinterfragen zu lernen. Die Grundlagen der Programmiersprache Python werden erlernt, so dass ein selbstständiges Arbeiten möglich ist.
Zielgruppe
- technisch interessierte Fach- und Führungskräfte
Voraussetzungen
- Grundlagenkennisse in Programmiersprachen oder VBA-Programmierung
- Grundlagenwissen in Statistik
Agenda
Hintergrund von Python
- Geschichte und Hintergrund von Python
- Installieren von neuen Paketen
- Hands-On: Erste Schritte mit Python
- Cross Industry Standard Process for Data Mining (CRISP-DM)
Hands-On: Data handling (pandas)
- Einführung in grundlegende Datenstrukturen
- Indexierung und Slicing eines DataFrames
- Hands-On: Eigenständiges Arbeiten mit Datenstrukturen
Hands-On: Daten einlesen
- Welche Möglichkeiten gibt es, Datenformate einzulesen?
- Konvertieren von Daten
- Hands-On: Eigenständiges Arbeiten, um Daten verschiedener Formate einzulesen und zu konvertieren
Hands-On: Grundlegende Statistiken (pandas)
- Erstellen von grundlegenden, deskriptiven Statistiken
- Kontingenztafeln erstellen
- Hands-On: Eigenständiges Arbeiten, um Daten verschiedener Formate einzulesen, zu konvertieren und erste Statistiken zu erstellen
Hands-On: Datenvisualisierung (matplotlib)
- Vertiefung und Wiederholung von typischen Datenvisualisierungen
- Datenvisualisierung in Python
- Hands-On: Eigenständiges Arbeiten mit Visualisierungen in Python
Die Mächtigkeit von Machine Learning Algorithmen
- Technischer Überblick über Machine Learning Algorithmen (supervised, unsupervised)
- Vertiefung einzelner ML Algorithmen
- Validierungsmöglichkeiten: Wie bestimme ich die Generalisierung meiner Lösung
Hands-On: Algorithmen in Python (scikit-learn)
- Einführung: wie Python Algorithmen verwendet
- Hands-On: Eigenständiges Arbeiten, um verschiedene Algorithmen zu testen und zu validieren