von Christoph Heckner
Forum: Allgemeines
ich habe einen Datensatz mit den folgenden Infos;
ID Job
ID Person
Status
Timestamp
Is Current status (Wenn ja, dann yes)
Skipped status (Nur in den not skipped eintragen war die Person auch)
Ich möchte aus der Tabellen nun die durchschnittliche Verweildauer für jeden Status herausfinden.
WIe stelle ich das am besten an?
Viele Grüße
Christoph
Es gibt 3 Antworten
https://www.holistics.io/blog/the-three-types-of-fact-tables/#:~:text=Unlike%20periodic%20snapshot%20tables%2C%20accumulating%20snapshot,Data%20Warehouse%20Toolkit%20was%20first%20written.&text=Unlike%20periodic%20snapshot%20tables%2C,Toolkit%20was%20first%20written.&text=snapshot%20tables%2C%20accumulating%20snapshot,Data%20Warehouse%20Toolkit%20was
Willst du die Lösung ausschließlich in Power Query bauen, oder kannst du das in einem Data Warehouse machen?
Filtern Sie die Daten, um nur die relevanten Status-Einträge zu erhalten, indem Sie die Zeilen auswählen, in denen der "Is Current status" als "yes" markiert ist.
Gruppieren Sie die Daten nach dem Status und berechnen Sie die Differenz zwischen dem frühesten und dem spätesten Zeitstempel für jeden Status. Dadurch erhalten Sie die Verweildauer für jeden Status. Stellen Sie sicher, dass Sie nur die Differenzen berechnen, wenn es mindestens einen "Skipped status" für die entsprechende Person gibt.
Berechnen Sie den Durchschnitt der Verweildauer für jeden Status, indem Sie die Verweildauerwerte für jeden Status summieren und durch die Anzahl der Statuswerte teilen.
Diese Schritte können in verschiedenen Programmiersprachen oder Tools wie Python, R, SQL oder Excel durchgeführt werden. Sie benötigen eine Möglichkeit, Ihre Daten zu filtern, zu gruppieren und die Zeitdifferenzen zu berechnen.
Die genaue Implementierung hängt von der von Ihnen gewählten Programmiersprache oder dem von Ihnen verwendeten Tool ab.
Muster Antwort KI