Apache Spark for Azure HDInsight - Schulungen, Online Kurse, Experten, Community
Apache Spark for Azure HDInsight Definition
Bei Spark für Azure HDInsight handelt es sich um ein Open Source-Projekt im Apache-Ökosystem, das sich aufgrund seiner Möglichkeit, Anwendungen für umfangreiche Datenanalysen speicherintern auszuführen, immer größerer Beliebtheit erfreut. Mit Spark können Abfragen bis zu 100-schneller verarbeitet werden als bei traditionellen Big Data-Lösungen. Diese Lösung bietet ein einheitliches Ausführungsmodell für verschiedene Aufgaben, die für Daten in Azure Storage ausgeführt werden. Dazu zählen u. a. ETL-Prozesse (Extract, Transform, Load), Batchabfragen, interaktive Abfragen, Echtzeitstreaming, Machine Learning und die Verarbeitung von Diagrammen. Mit der Azure-Cloud lässt sich Spark problemlos und kosteneffektiv bereitstellen, ohne dass Sie zu diesem Zweck Hardware erwerben oder Software konfigurieren müssen. Darüber hinaus ist Spark in Microsoft Power BI und weitere beliebte BI-Tools anderer Anbieter sowie in Open Source-Notebooks integriert. So können Sie zusätzlich zur Verarbeitung von Big Data auch interaktive BI-Vorgänge ausführen.