by Marc-David Militz
Forum: Neuigkeiten
- Artikel von Dj Walker-Morgan
- MongoDB 4.2
- MongoDB Atlas Data Lake
englischer Originalartikel
https://www.mongodb.com/blog/post/mongodb-atlas-data-lake-debuts-at-mongodb-world
Übersetzung mit freundlicher Genehmigung von MongoDB
Im Moment läuft ja die MongoDB World in New York. Hier nun die ersten größeren Neuerungen die dort verkündet wurden.
Seit der Version 4.0 beherrscht MongoDB reguläre ACID-Transaktionen. Ab Version 4.2 sind diese nun auch in einem Sharded Cluster möglich.
Wer sich dafür interessiert wie das technisch funktioniert, der kann sich in der Serie "Hintergrundwissen Transaktionen" dazu schlau machen.
Hintergrundwissen Transaktionen: Logische Sessions in MongoDB
https://www.qualiero.com/community/mongodb/mongodb-theorie/hintergrundwissen-transaktionen-logische-sessions-in-mongodb.html
Hintergrundwissen Transaktionen: Lesen lokaler Snapshots
https://www.qualiero.com/community/mongodb/mongodb-theorie/hintergrundwissen-transaktionen-lesen-lokaler-snapshots.html
Hintergrundwissen Transaktionen: Die globale logische Uhr
https://www.qualiero.com/community/mongodb/mongodb-theorie/hintergrundwissen-transaktionen-die-globale-logische-uhr.html
Ein weiteres Feature sind Platzhalter-Indizes bzw. Wildcard-Indizes. Diese können genutzt werden um in unstrukturierten Daten, anhand eines Filters, nur die Dokumente zu indexieren, die den Filterkriterien entsprechen.
Informationen dazu findet man im MongoDB Blog https://www.mongodb.com/blog/post/coming-in-mongodb-42--1-wildcard-indexes
Ein weiteres Feature auf der Liste ist eine clientseitige Verschlüsselung von Daten in einzelnen Feldern. Die Verschlüsselung findet mittels eines sog. Treibers statt, bevor die Daten an den Server gesendet werden. Mit welchem Algorithmus und Verschlüsselungsdienst das Ganze funktionieren soll kann der Nutzer selbst festlegen. Zum Start wird die Schlüsselverwaltung von AWS unterstützt. Die entsprechenden Dienste von Google und Microsoft Azure sollen bald folgen.
Als viertes wurden sog. "On-Demand Materialized Views" angekündigt. Aggregationen konnten bisher schon über den $out Operator in eine neue Collection angelegt werden. Wollte man die Aggregation aktualisieren mussten alle Daten nochmals verarbeitet werden. Mit dem neuen $merge Operator wird es möglich sein, Aggregationen zu updaten. Dabei erhält der Nutzer die Möglichkeit festzulegen wie Änderungen und neue Dokumente verarbeitet werden sollen. Zusätzlich können diese Collections nun auch gesharded werden.
Eine Übersicht über alle Neuerungen findet sich hier
https://www.mongodb.com/blog/post/mongodb-42-previewed-at-mongodb-world
Die nächste große Ankündigung ist der MongoDB Atlas Data Lake, der ab sofort als "public beta" verfügbar ist. Der MongoDB Atlas Data Lake ist als "on demand" Dienst sofort verfügbar und benötigt keinen Setup-Prozess.
Daten können darin in JSON, BSON, CVS; TSV, Avro und Parquet Formaten abgelegt werden, eine Transformation der Daten ist nicht nötig. Die Abfragen erfolgen über die bekannt MongoDB Query Language.
MongoDB stellt eine Übersicht über die Data Lake Architektur zur Verfügung
Die Bildrechte liegen bei mongodb.com
Weitere Details zum MongoDB Data Lake gibt es hier
https://www.mongodb.com/blog/post/mongodb-atlas-data-lake-debuts-at-mongodb-world
Mehr Hintergrundwissen zum Thema MongoDB Cluster bietet das Qualiero Sharded Cluster Administrator Classroom Training https://www.qualiero.com/lerninhalte/classroom-trainings/mongodb-fuer-sharded-cluster-administrator-kurs.html