MongoDB

MongoDB ist die führende Open-Source, Document Datenbank die für einfache Entwicklung und Skalierung aber auch für Big Data Szenarien entwickelt wurde.

Tuning von MongoDB & Linux für zehntausende von Verbindungen

Experte

17 Okt
2019

von Marc-David Militz Forum: MongoDB Theorie

Artikel von Henrik Ingo

https://www.mongodb.com/blog/post/tuning-mongodb--linux-to-allow-for-tens-of-thousands-connections

MongoDB Konfiguration

https://docs.mongodb.com/manual/reference/configuration-options/#net.maxIncomingConnections

# mongod.conf

net:

  maxIncomingConnections: 999999

https://docs.mongodb.com/manual/reference/configuration-options/#net.serviceExecutor

net:

  serviceExecutor: adaptive

Linux Konfiguration

Alles ist eine Datei. Insbesondere TCP / IP-Verbindungen sind für ulimit offene Dateien.
Aus historischen Gründen ist nproc wirklich die Anzahl der Threads. In der Vergangenheit bestand ein Linux-Prozess aus einem einzelnen Thread, und gleichzeitig aus mehreren Prozessen.
Threads ordnen Speicher aus dem Stapel zu, der auch eine maximale Größe hat.

# Connections are files because in Unix everything is a file.

echo "ec2-user           soft    nofile          9999999" | sudo tee -a /etc/security/limits.conf

echo "ec2-user           hard    nofile          9999999" | sudo tee -a /etc/security/limits.conf

# nproc is really number of threads.

echo "ec2-user           soft    nproc           9999999" | sudo tee -a /etc/security/limits.conf

echo "ec2-user           hard    nproc           9999999" | sudo tee -a /etc/security/limits.conf

# Threads need memory from the stack.

echo "ec2-user           soft    stack           9999999" | sudo tee -a /etc/security/limits.conf

echo "ec2-user           hard    stack           9999999" | sudo tee -a /etc/security/limits.conf

https://docs.mongodb.com/manual/reference/ulimit/#recommended-ulimit-settings

http://man7.org/linux/man-pages/man2/mmap.2.html

echo 9999999 > /proc/sys/vm/max_map_count

# If you want to persist across reboots

echo "vm.max_map_count=9999999" | sudo tee -a /etc/sysctl.conf

echo 1024 65530 > /proc/sys/net/ipv4/ip_local_port_range

# If you want to persist across reboots

echo "net.ipv4.ip_local_port_range = 1024 65530" | sudo tee -a /etc/sysctl.conf

EC2 Konfiguration

Zusammenfassung

# This assumes a fresh Linux host from standard Amazon Linux 2 images.

# Adaptable to Centos/RHEL too.



sudo su



sed -i .orig 's/net\:/net\:\n  maxIncomingConnections: 999999/' /etc/mongod.conf



# Connections are files because in Unix everything is a file.

echo "ec2-user           soft    nofile          9999999" | sudo tee -a /etc/security/limits.conf

echo "ec2-user           hard    nofile          9999999" | sudo tee -a /etc/security/limits.conf

# nproc is really number of threads.

echo "ec2-user           soft    nproc           9999999" | sudo tee -a /etc/security/limits.conf

echo "ec2-user           hard    nproc           9999999" | sudo tee -a /etc/security/limits.conf

# Threads need memory from the stack.

echo "ec2-user           soft    stack           9999999" | sudo tee -a /etc/security/limits.conf

echo "ec2-user           hard    stack           9999999" | sudo tee -a /etc/security/limits.conf



# Threads allocate memory with mmap

echo 9999999 > /proc/sys/vm/max_map_count

# If you want to persist across reboots

echo "vm.max_map_count=9999999" | sudo tee -a /etc/sysctl.conf



# Needed for outgoing connections (on client)

echo 1024 65530 > /proc/sys/net/ipv4/ip_local_port_range

echo "net.ipv4.ip_local_port_range = 1024 65530" | sudo tee -a /etc/sysctl.conf



# Checks EC2 instance type but doesn't do anything about it

curl http://169.254.169.254/latest/meta-data/instance-type

Forum

Titel

Beitrag

[list]Artikel von Henrik Ingo[list]
englischer Originalartikel
[link]https://www.mongodb.com/blog/post/tuning-mongodb--linux-to-allow-for-tens-of-thousands-connections[link]
Übersetzung mit freundlicher Genehmigung von MongoDB

"Böse Zungen" (und manche sagen, ich hätte auch so eine) in der IT beschreiben Red Hat (RHEL) gerne als "für die Beratung optimiert". (Implizit sind dies auch Centos und Amazon Linux.) Aus irgendeinem Grund wird RHEL mit Standard-"ulimit" und anderen für Ihren Laptop geeigneten Konfigurationen ausgeliefert. Damit Sie die volle Leistung eines großen Produktionsservers erhalten, müssen sie viel tunen, um verschiedene Limits und Puffer zu erhöhen. Dies schafft einen lukrativen Markt für Berater, die alle Drehknöpfe kennen, die gedreht werden müssen. Vielleicht ist das der Grund warum im Grunde jede Firma, bei der ich bisher das Thema MongoDB mit eingeführt habe, unbedingt auf RHEL setzen wollte.

Die folgenden Erkenntnisse stammen aus einem Benchmarking, wie sich MongoDB bei einer großen Anzahl von Verbindungen verhält. Um das zu erreichen und um eine große Anzahl von Verbindungen und Threads auf einem Linux-Server zu erstellen, musste an einigen Schrauben gedreht werden.

[list]MongoDB Konfiguration[list]
Auch MongoDB selbst hat die Möglichkeit, die maximale Anzahl eingehender Verbindungen zu begrenzen. Der Standardwert ist 64 KB.
[link]https://docs.mongodb.com/manual/reference/configuration-options/#net.maxIncomingConnections[link]
[php]# mongod.conf
net:
  maxIncomingConnections: 999999[php]
Dabei gilt es zu beachten, dass MongoDB standardmäßig einen dedizierten Arbeitsthread für jede eingehende Verbindung erstellt. Um diese Standardeinstellung testen, muss man jedoch darauf hinweisen, dass eine verwandte Einstellung in einem Worker-Pool-Modell geändert werden muss. 
[link]https://docs.mongodb.com/manual/reference/configuration-options/#net.serviceExecutor[link]
Dies ermöglicht vermutlich eine größere Anzahl eingehender Verbindungen und die Verwendung weniger Threads. Beachten Sie, dass diese Option auch dann als experimentell gekennzeichnet ist, wenn sie offiziell dokumentiert ist:
[php]net:
  serviceExecutor: adaptive[php]
Für die Tests werden wir einen Thread pro Verbindung erstellen, daher wurde auch die folgende Konfiguration benötigt ...

[list]Linux Konfiguration[list]
Um die "ulimits" richtig zu setzen, muss man sich erstmal an alle grundlegenden Unix-Prinzipien erinnern:
[list]Alles ist eine Datei. Insbesondere TCP / IP-Verbindungen sind für ulimit offene Dateien.
Aus historischen Gründen ist nproc wirklich die Anzahl der Threads. In der Vergangenheit bestand ein Linux-Prozess aus einem einzelnen Thread, und gleichzeitig aus mehreren Prozessen.
Threads ordnen Speicher aus dem Stapel zu, der auch eine maximale Größe hat.[list]

[php]# Connections are files because in Unix everything is a file.
echo "ec2-user           soft    nofile          9999999" | sudo tee -a /etc/security/limits.conf
echo "ec2-user           hard    nofile          9999999" | sudo tee -a /etc/security/limits.conf
# nproc is really number of threads.
echo "ec2-user           soft    nproc           9999999" | sudo tee -a /etc/security/limits.conf
echo "ec2-user           hard    nproc           9999999" | sudo tee -a /etc/security/limits.conf
# Threads need memory from the stack.
echo "ec2-user           soft    stack           9999999" | sudo tee -a /etc/security/limits.conf
echo "ec2-user           hard    stack           9999999" | sudo tee -a /etc/security/limits.conf[php]
Weitere Informationen finden Sie in der MongoDB-Dokumentation zu den ulimit-Einstellungen.
[link]https://docs.mongodb.com/manual/reference/ulimit/#recommended-ulimit-settings[link]

Doch einen Augenblick noch, es gibt noch mehr! Das Erstellen von Threads verwendet mmap, um Speicher zuzuweisen. 
[link]http://man7.org/linux/man-pages/man2/mmap.2.html[link]
Und auf der Kernel-Ebene gibt es eine Einstellung für die maximale Anzahl von mmapped Speicherblöcken pro Prozess, die ebenfalls erhöht werden muss:
[php]echo 9999999 > /proc/sys/vm/max_map_count
# If you want to persist across reboots
echo "vm.max_map_count=9999999" | sudo tee -a /etc/sysctl.conf[php]
Schließlich wurden, auf dem Benchmark-Client, TCP / IP auf Einschränkungen festgestellt. Im TCP-Protokoll wird ein Socket mit dem Tupel (lokale Adresse, lokaler Port, entfernte Adresse, entfernter Port) identifiziert, und dieses Tupel muss pro Socket eindeutig sein. Die Portnummern reichen von 1 bis 65535, daher kann man von einem einzelnen Benchmark-Client nur 65535 ausgehende Verbindungen erstellen. Um mit mehr Verbindungen zu arbeiten, gibt es nur die Möglichkeit mehr als einen Client-Host oder mindestens mehr als eine IP-Adresse für den Client zu haben. Auf der Serverseite ist der Port natürlich der bekannte mongod Port 27017.

Etwas überraschend war die Erkenntnis, dass Linux standardmäßig nicht einmal die gesamte Palette von 65k-Ports nutzen würde, die TCP ermöglicht. Auch das musste konfiguriert werden:
[php]echo 1024 65530 > /proc/sys/net/ipv4/ip_local_port_range
# If you want to persist across reboots
echo "net.ipv4.ip_local_port_range = 1024 65530" | sudo tee -a /etc/sysctl.conf[php]
Die beiden Zahlen sind die min. Und max. Werte für ausgehende Ports. Beachten Sie, dass diese Konfiguration auf einem Server NICHT erforderlich ist, sondern nur auf dem Benchmark-Client.

[list]EC2 Konfiguration[list]
Bei AWS gab es erstmal folgende Erkenntnisse: In der M5-Familie von EC2-Instanzen (getestet bis zu m5.2xlarge) lassen sich nur 32k-Verbindungen und -Threads erstellen. Mit genau der gleichen Konfiguration, aber mit dem Wechsel zum Instanztyp c3.8xlarge, ist es möglich mehr als das erstellen und die von "ip_local_port_range" nach oben vorgegebene Grenze von fast 65.000 zu erreichen. Es scheint dazu keine AWS-Dokumentation zu geben, die das bestätigt. Der AWS Support hat dies auch nicht bestätigt. Es könnte also auch ein Fehler in der getesteten Konfiguration sein.

[list]Zusammenfassung[list]
Hier sind also alle Schritte in einem Copy & Paste Skript. Dieses wurde speziell für AWS-Instanzen entwickelt, auf denen Amazon Linux 2 ausgeführt wird. Möglicherweise müssen Sie Anpassungen für andere Linux-Versionen vornehmen. Insbesondere bei Centos und RHEL müssen Sie den Benutzernamen von "ec2-user" in "root" ändern.

[php]# This assumes a fresh Linux host from standard Amazon Linux 2 images.
# Adaptable to Centos/RHEL too.

sudo su

sed -i .orig 's/net\:/net\:\n  maxIncomingConnections: 999999/' /etc/mongod.conf

# Connections are files because in Unix everything is a file.
echo "ec2-user           soft    nofile          9999999" | sudo tee -a /etc/security/limits.conf
echo "ec2-user           hard    nofile          9999999" | sudo tee -a /etc/security/limits.conf
# nproc is really number of threads.
echo "ec2-user           soft    nproc           9999999" | sudo tee -a /etc/security/limits.conf
echo "ec2-user           hard    nproc           9999999" | sudo tee -a /etc/security/limits.conf
# Threads need memory from the stack.
echo "ec2-user           soft    stack           9999999" | sudo tee -a /etc/security/limits.conf
echo "ec2-user           hard    stack           9999999" | sudo tee -a /etc/security/limits.conf

# Threads allocate memory with mmap
echo 9999999 > /proc/sys/vm/max_map_count
# If you want to persist across reboots
echo "vm.max_map_count=9999999" | sudo tee -a /etc/sysctl.conf

# Needed for outgoing connections (on client)
echo 1024 65530 > /proc/sys/net/ipv4/ip_local_port_range
echo "net.ipv4.ip_local_port_range = 1024 65530" | sudo tee -a /etc/sysctl.conf

# Checks EC2 instance type but doesn't do anything about it
curl http://169.254.169.254/latest/meta-data/instance-type[php]

Schlagworte

Bilder und Dateien (*.jpeg, *.jpg, *.png, *.gif, *.pdf)

Dateiname	Titel	Galerie	Aktionen
2018-04-12_09-56-02_686.jpeg	Tuning von MongoDB & Linux für zehntausende von Verbindungen

Verfügbare HTML-Tags:

[quote]Zitat[quote]
[link]www.ihre-url.de[link]
[list]
Punkt 1
Punkt 2
...
[list]
[img]Qualiero Bild-ID[img]
Hinweis: Wenn Du Bilder hochladen möchtest, musst Du Deinen Beitrag abspeichern, bevor Dir die Qualiero Bild-ID zur Verfügung stehen.
Weitere Tags zur Quellcode-Hervorhebung:[html], [css], [js], [php], [java], [perl], [python], [c-like], [sql], [ruby]

Tuning von MongoDB & Linux für zehntausende von Verbindungen

Tags

Diesen Community Beitrag weiterempfehlen