Machine und Deep Learning: Verfahren zur Analyse von Zeitreihen und Prozessdaten

Classroom Schulung | deutsch | Anspruch

Schulungsdauer: 4 Tage

Ziele

Ziel ist es, den Teilnehmerinnen und Teilnehmern State-of-the Art Verfahren zur Aufbereitung und Analyse von Prozessdaten zu vermitteln, mit der sich Vorhersagen für den Geschäftsalltag erstellen lassen.

Das Seminar stellt aktuelle Machine- und Deep-Learning Verfahren zur Verarbeitung von Zeitreihendaten vor. Dabei werden statistische und konzeptuelle Hintergründe vorgestellt und vertieft. Der Schwerpunkt liegt jedoch auf der praktischen Arbeit mit den Daten und den relevanten Python-Bibliotheken wie Pandas, Scikit-Learn, Statsmodels und Tensorflow/Keras, die sich zur Verarbeitung von Zeitreihendaten einsetzen lassen.

Zeitreihen- und Prozessdaten entstehen im Zuge der Digitalisierung der Wirtschaft und der Produktion in einer Vielzahl von Bereichen. Die Besonderheit und der Wert solcher Daten liegt im zeitlichen Charakter der aufgezeichneten Informationen. Messwerte einer Zeitreihe informieren nicht nur über unabhängige Zustände, sie bilden fortlaufende Prozesse ab, die sich unter bestimmten Bedingungen in die Zukunft fortschreiben lassen und aus denen sich Prognosen für die Zukunft ableiten lassen:

a) Sensordaten, die den Verschleiß eines oder mehrerer Teile in einer Produktionsmaschine oder eine Turbine ankündigen.
b) Die Historie der Verkaufszahlen eines Produkts, die Auskunft über die Verkaufszahlen dieses Produkts in einem Zeitfenster in der Zukunft geben.
c) Den Verlauf des Kurses einer Aktie, der Auskunft über den Kurs dieser Aktie in einer Woche oder einem Monat geben.

Zielgruppe

Technisch interessierte Fachkräfte, die über solide Grundkenntnisse in Python verfügen (Kontrollstrukturen, Schleifen, Funktionen schreiben/aufrufen) und einen Einstieg in fortgeschrittene Machine Learning Techniken zur Analyse von Zeitreihen- und Prozessdaten suchen. Kenntnis grundlegender statistische Konzepte (z.B. Mittelwert, Standardabweichung, Normalverteilung, Korrelation) werden vorausgesetzt.

Voraussetzungen

Solide Grundkenntnisse in Python. Grundkenntnisse statistischer Konzepte wie Mittelwert, Standardabweichung, lineare Regression.

Agenda

1. Strukturierung und Vorbereitung von Zeitreihendaten
  • Laden von Daten und grundlegende Datenverarbeitung mit Pandas.
  • Lückenlose Zeitreihen erstellen.
  • Mit gleitenden Mittelwerten arbeiten (rolling/moving means).
  • Strategien zur Behandlung fehlender Werte.
  • Zeitfenster definieren und extrahieren.
  • Graphische Darstellung von Zeitreihen mit Matplotlib.
2. Anwendung klassischer Machine Learning Verfahren auf Zeitreihen
  • Hintergrund: Klassifzierungs- und Schätzverfahren.
  • Lineare Regression.
  • Logistische Regression und Softmax.
  • Polynomiale Regression.
  • Workflow: Train-/Testdaten, Daten extrahieren, speichern und laden angelernter Modelle.
3. Spezielle Verfahren zur Vorhersage des zukünftigen Verlaufs einer Zeitreihe
  • Komponenten einer Zeitreihe: Saison, Trend & Residuen.
  • Zeitreihen stationär machen.
  • Autokorrelation und partielle Autokorrelation.
  • Trends und Saisonale Effekte behandeln.
  • Integrierte Modelle zur Prognose des Verlaufs in der Zukunft:
    • ARMA und Seasonal ARIMA.
4. Deep Learning für Zeitreihen
  • Hintergrund Deep Learning und rekurrente Netze.
  • Einfache Deep-Learning Verfahren mit Keras anwenden.
  • Aufbau und Funktionsweise rekurrenter neuronaler Netze (RNN) für Zeitreihen.
  • Vorbereitung der Daten und Training mit LSTM/GRU-Layern.
  • Evaluation eines angelernten Modells.
  • Overfitting verhindern.
  • Mit Generatoren anlernen.

Ziele

Ziel ist es, den Teilnehmerinnen und Teilnehmern State-of-the Art Verfahren zur Aufbereitung und Analyse von Prozessdaten zu vermitteln, mit der sich Vorhersagen für den Geschäftsalltag erstellen lassen.

Das Seminar stellt aktuelle Machine- und Deep-Learning Verfahren zur Verarbeitung von Zeitreihendaten vor. Dabei werden statistische und konzeptuelle Hintergründe vorgestellt und vertieft. Der Schwerpunkt liegt jedoch auf der praktischen Arbeit mit den Daten und den relevanten Python-Bibliotheken wie Pandas, Scikit-Learn, Statsmodels und Tensorflow/Keras, die sich zur Verarbeitung von Zeitreihendaten einsetzen lassen.

Zeitreihen- und Prozessdaten entstehen im Zuge der Digitalisierung der Wirtschaft und der Produktion in einer Vielzahl von Bereichen. Die Besonderheit und der Wert solcher Daten liegt im zeitlichen Charakter der aufgezeichneten Informationen. Messwerte einer Zeitreihe informieren nicht nur über unabhängige Zustände, sie bilden fortlaufende Prozesse ab, die sich unter bestimmten Bedingungen in die Zukunft fortschreiben lassen und aus denen sich Prognosen für die Zukunft ableiten lassen:

a) Sensordaten, die den Verschleiß eines oder mehrerer Teile in einer Produktionsmaschine oder eine Turbine ankündigen.
b) Die Historie der Verkaufszahlen eines Produkts, die Auskunft über die Verkaufszahlen dieses Produkts in einem Zeitfenster in der Zukunft geben.
c) Den Verlauf des Kurses einer Aktie, der Auskunft über den Kurs dieser Aktie in einer Woche oder einem Monat geben.

Zielgruppe

Technisch interessierte Fachkräfte, die über solide Grundkenntnisse in Python verfügen (Kontrollstrukturen, Schleifen, Funktionen schreiben/aufrufen) und einen Einstieg in fortgeschrittene Machine Learning Techniken zur Analyse von Zeitreihen- und Prozessdaten suchen. Kenntnis grundlegender statistische Konzepte (z.B. Mittelwert, Standardabweichung, Normalverteilung, Korrelation) werden vorausgesetzt.

Voraussetzungen

Solide Grundkenntnisse in Python. Grundkenntnisse statistischer Konzepte wie Mittelwert, Standardabweichung, lineare Regression.

Agenda

1. Strukturierung und Vorbereitung von Zeitreihendaten
  • Laden von Daten und grundlegende Datenverarbeitung mit Pandas.
  • Lückenlose Zeitreihen erstellen.
  • Mit gleitenden Mittelwerten arbeiten (rolling/moving means).
  • Strategien zur Behandlung fehlender Werte.
  • Zeitfenster definieren und extrahieren.
  • Graphische Darstellung von Zeitreihen mit Matplotlib.
2. Anwendung klassischer Machine Learning Verfahren auf Zeitreihen
  • Hintergrund: Klassifzierungs- und Schätzverfahren.
  • Lineare Regression.
  • Logistische Regression und Softmax.
  • Polynomiale Regression.
  • Workflow: Train-/Testdaten, Daten extrahieren, speichern und laden angelernter Modelle.
3. Spezielle Verfahren zur Vorhersage des zukünftigen Verlaufs einer Zeitreihe
  • Komponenten einer Zeitreihe: Saison, Trend & Residuen.
  • Zeitreihen stationär machen.
  • Autokorrelation und partielle Autokorrelation.
  • Trends und Saisonale Effekte behandeln.
  • Integrierte Modelle zur Prognose des Verlaufs in der Zukunft:
    • ARMA und Seasonal ARIMA.
4. Deep Learning für Zeitreihen
  • Hintergrund Deep Learning und rekurrente Netze.
  • Einfache Deep-Learning Verfahren mit Keras anwenden.
  • Aufbau und Funktionsweise rekurrenter neuronaler Netze (RNN) für Zeitreihen.
  • Vorbereitung der Daten und Training mit LSTM/GRU-Layern.
  • Evaluation eines angelernten Modells.
  • Overfitting verhindern.
  • Mit Generatoren anlernen.

Tags

Diese Seite weiterempfehlen