🥇Kernelparameter konfigurieren Linux für PostgreSQL-Optimierung

Optimale PostgreSQL-Performance hängt von korrekt konfigurierten Betriebssystemparametern ab. Falsch konfigurierte Kernelparameter können die Leistung des Datenbankservers beeinträchtigen. Daher ist es unerlässlich, diese Parameter entsprechend dem Datenbankserver und seiner Arbeitslast zu konfigurieren. In diesem Beitrag werden wir einige wichtige Kernelparameter erläutern. Linux, was sich auf die Leistung des Datenbankservers und dessen Konfiguration auswirken kann.

SHMMAX / SHMALL

SHMMAX — ist ein Kernelparameter, der verwendet wird, um die maximale Größe eines einzelnen gemeinsam genutzten Speichersegments zu bestimmen, das ein Prozess belegen kann. LinuxVor Version 9.2 nutzte PostgreSQL System V (SysV), wofür die SHMMAX-Einstellung erforderlich war. Ab Version 9.2 verwendet PostgreSQL POSIX Shared Memory. Dadurch wird nun deutlich weniger System-V-Shared-Memory benötigt.

Vor Version 9.3 war SHMMAX der wichtigste Kernel-Parameter. Der SHMMAX-Wert wird in Bytes angegeben.

In ähnlicher Weise SCHMALL ist ein weiterer Kernel-Parameter, der zur Bestimmung verwendet wird
systemweites Volumen gemeinsam genutzter Speicherseiten. Um die aktuellen SHMMAX-, SHMALL- oder SHMMIN-Werte anzuzeigen, verwenden Sie den Befehl ipcs.

SHM* Details — Linux

$ ipcs -lm

------ Shared Memory Limits --------
max number of segments = 4096
max seg size (kbytes) = 1073741824
max total shared memory (kbytes) = 17179869184
min seg size (bytes) = 1

SHM*-Details – MacOS X

$ ipcs -M
IPC status from  as of Thu Aug 16 22:20:35 PKT 2018
shminfo:
	shmmax: 16777216	(max shared memory segment size)
	shmmin:       1	(min shared memory segment size)
	shmmni:      32	(max number of shared memory identifiers)
	shmseg:       8	(max shared memory segments per process)
	shmall:    1024	(max amount of shared memory in pages)

PostgreSQL verwendet System V-IPC um gemeinsamen Speicher zuzuweisen. Dieser Parameter ist einer der wichtigsten Kernel-Parameter. Wenn Sie die folgenden Fehlermeldungen erhalten, bedeutet dies, dass Sie eine ältere Version von PostgreSQL haben und Ihr SHMMAX-Wert sehr niedrig ist. Von Benutzern wird erwartet, dass sie den Wert entsprechend dem gemeinsam genutzten Speicher, den sie verwenden möchten, anpassen und erhöhen.

Mögliche Fehlkonfigurationsfehler

Wenn SHMMAX nicht richtig konfiguriert ist, erhalten Sie möglicherweise eine Fehlermeldung, wenn Sie versuchen, einen PostgreSQL-Cluster mit dem Befehl zu initialisieren initdb.

initdb-Fehler
DETAIL: Failed system call was shmget(key=1, size=2072576, 03600).

HINWEIS: Dieser Fehler bedeutet normalerweise, dass die Anforderung von PostgreSQL für ein gemeinsam genutztes Speichersegment den SHMMAX-Parameter Ihres Kernels überschritten hat.
Sie können entweder die Anforderungsgröße reduzieren oder den Kernel mit einem größeren SHMMAX neu konfigurieren. Um die Anforderungsgröße zu reduzieren (derzeit 2072576 Bytes),
Reduzieren Sie die Nutzung des gemeinsam genutzten Speichers von PostgreSQL, beispielsweise durch Reduzierung von shared_buffers oder max_connections.

Wenn die Anforderungsgröße bereits klein ist, ist es möglich, dass sie kleiner ist als der SHMMIN-Parameter Ihres Kernels.
In diesem Fall ist eine Erhöhung der Anforderungsgröße oder eine Neukonfiguration von SHMMIN erforderlich.

Die PostgreSQL-Dokumentation enthält weitere Informationen zur Konfiguration des gemeinsam genutzten Speichers. untergeordneter Prozess wurde mit Exitcode 1 beendet

Ebenso kann es sein, dass Sie beim Starten des PostgreSQL-Servers mit dem Befehl eine Fehlermeldung erhalten pg_ctl.

pg_ctl-Fehler
DETAIL: Failed system call was shmget(key=5432001, size=14385152, 03600).

HINWEIS: Dieser Fehler bedeutet normalerweise, dass die Anforderung von PostgreSQL für ein gemeinsam genutztes Speichersegment den SHMMAX-Parameter Ihres Kernels überschritten hat.

Sie können entweder die Anforderungsgröße reduzieren oder den Kernel mit einem größeren SHMMAX neu konfigurieren.; Um die Anforderungsgröße (derzeit 14385152 Bytes) zu verringern, reduzieren Sie die gemeinsame Speichernutzung von PostgreSQL, beispielsweise durch Reduzierung von shared_buffers oder max_connections.

Die PostgreSQL-Dokumentation enthält weitere Informationen zur Konfiguration des gemeinsam genutzten Speichers.

Die Unterschiede in den Definitionen verstehen

Die Definition der SHMMAX/SHMALL-Parameter ist geringfügig anders in Linux und MacOS X:

Linux: kernel.shmmax, kernel.shmall
MacOS X: kern.sysv.shmmax, kern.sysv.shmall

Team sysctl kann verwendet werden, um den Wert vorübergehend zu ändern. Um konstante Werte festzulegen, fügen Sie einen Eintrag hinzu /etc/sysctl.conf. Einzelheiten finden Sie weiter unten.

Ändern der Kernel-Einstellungen unter MacOS X

# Get the value of SHMMAX
sudo sysctl kern.sysv.shmmax
kern.sysv.shmmax: 4096

# Get the value of SHMALL
sudo sysctl kern.sysv.shmall 
kern.sysv.shmall: 4096

# Set the value of SHMMAX
sudo sysctl -w kern.sysv.shmmax=16777216
kern.sysv.shmmax: 4096 -> 16777216

# Set the value of SHMALL 
sudo sysctl -w kern.sysv.shmall=16777216
kern.sysv.shmall: 4096 -> 16777216

Ändern von Kernelparametern auf Linux

# Get the value of SHMMAX
sudo sysctl kernel.shmmax
kernel.shmmax: 4096

# Get the value of SHMALL
sudo sysctl kernel.shmall
kernel.shmall: 4096

# Set the value of SHMMAX
sudo sysctl -w kernel.shmmax=16777216
kernel.shmmax: 4096 -> 16777216

# Set the value of SHMALL 
sudo sysctl -w kernel.shmall=16777216
kernel.shmall: 4096 -> 16777216

Vergessen Sie nicht: Um Änderungen dauerhaft zu machen, fügen Sie diese Werte zu /etc/sysctl.conf hinzu

Riesige Seiten

В Linux Standardmäßig werden in BSD 4 KB große Speicherseiten verwendet. Super-SeitenUnd in Windows - Große Seiten. Eine Seite ist ein Teil des RAM, der einem Prozess zugewiesen ist. Ein Prozess kann je nach Speicherbedarf mehrere Seiten haben. Je mehr Speicher ein Prozess benötigt, desto mehr Seiten werden ihm zugewiesen. Das Betriebssystem verwaltet eine Seitenzuordnungstabelle für Prozesse. Je kleiner die Seitengröße, desto größer die Tabelle, desto länger dauert es, eine Seite in dieser Seitentabelle zu finden. Große Seiten ermöglichen daher die Nutzung großer Speichermengen bei geringerem Overhead; weniger Seitenaufrufe, weniger Seitenfehler, schnellere Lese-/Schreibvorgänge über größere Puffer. Das Ergebnis ist eine verbesserte Leistung.

PostgreSQL unterstützt große Seiten nur in Linux. Default Linux Es werden 4 KB Speicherseiten verwendet. Bei vielen Speicheroperationen ist es daher notwendig, größere Seiten festzulegen. Leistungssteigerungen werden durch die Verwendung von 2 MB bis hin zu 1 GB großen Seiten erzielt. Die Seitengröße kann beim Systemstart festgelegt werden. Sie können die Einstellungen für die großen Seiten und deren Nutzung einfach auf Ihrem System überprüfen. Linux-Computer, der den Befehl verwendet cat /proc/meminfo | grep -i riesig.

Informationen über große Seiten erhalten (nur auf Linux)

Note: This is only for Linux, for other OS this operation is ignored$ cat /proc/meminfo | grep -i huge
AnonHugePages:         0 kB
ShmemHugePages:        0 kB
HugePages_Total:       0
HugePages_Free:        0
HugePages_Rsvd:        0
HugePages_Surp:        0
Hugepagesize:       2048 kB

Obwohl in diesem Beispiel die große Seitengröße auf 2048 (2 MB) eingestellt ist, ist die Gesamtzahl der großen Seiten auf 0 gesetzt. Dies bedeutet, dass große Seiten deaktiviert sind.

Skript zur Ermittlung der Anzahl großer Seiten

Dieses einfache Skript liefert die benötigte Anzahl großer Seiten. Führen Sie das Skript auf Ihrem Server aus. LinuxWährend PostgreSQL läuft, stellen Sie sicher, dass die Umgebungsvariable $PGDATA Das PostgreSQL-Datenverzeichnis ist angegeben.

Ermitteln der Anzahl der erforderlichen großen Seiten

#!/bin/bash
pid=`head -1 $PGDATA/postmaster.pid`
echo "Pid:            $pid"
peak=`grep ^VmPeak /proc/$pid/status | awk '{ print $2 }'`
echo "VmPeak:            $peak kB"
hps=`grep ^Hugepagesize /proc/meminfo | awk '{ print $2 }'`
echo "Hugepagesize:   $hps kB"
hp=$((peak/hps))
echo Set Huge Pages:     $hp

Die Skriptausgabe sieht folgendermaßen aus:

Skriptausgabe

Pid:            12737
VmPeak:         180932 kB
Hugepagesize:   2048 kB
Set Huge Pages: 88

Der empfohlene Wert für große Seiten beträgt 88, daher sollten Sie ihn auf 88 einstellen.

Große Seiten installieren

sysctl -w vm.nr_hugepages=88

Überprüfen Sie jetzt große Seiten. Sie werden feststellen, dass keine großen Seiten verwendet werden (HugePages_Free = HugePages_Total).

Weitere Informationen zu großen Seiten (nur auf Linux)

$ cat /proc/meminfo | grep -i huge
AnonHugePages:         0 kB
ShmemHugePages:        0 kB
HugePages_Total:      88
HugePages_Free:       88
HugePages_Rsvd:        0
HugePages_Surp:        0
Hugepagesize:       2048 kB

Setzen Sie nun den Parameter huge_pages in $PGDATA/postgresql.conf auf „on“ und starten Sie den Server neu.

Und hier noch einmal Informationen zu großen Seiten (nur auf Linux)

$ cat /proc/meminfo | grep -i huge
AnonHugePages:         0 kB
ShmemHugePages:        0 kB
HugePages_Total:      88
HugePages_Free:       81
HugePages_Rsvd:       64
HugePages_Surp:        0
Hugepagesize:       2048 kB

Jetzt können Sie sehen, dass nur sehr wenige große Seiten verwendet werden. Versuchen wir nun, einige Daten zur Datenbank hinzuzufügen.

Einige Datenbankoperationen zum Recycling großer Seiten

postgres=# CREATE TABLE foo(a INTEGER);
CREATE TABLE
postgres=# INSERT INTO foo VALUES(generate_Series(1,10000000));
INSERT 0 10000000

Mal sehen, ob wir jetzt mehr große Seiten als zuvor verwenden.

Nochmals Informationen zu großen Seiten (nur auf Linux)

$ cat /proc/meminfo | grep -i huge
AnonHugePages:         0 kB
ShmemHugePages:        0 kB
HugePages_Total:      88
HugePages_Free:       18
HugePages_Rsvd:        1
HugePages_Surp:        0
Hugepagesize:       2048 kB

Jetzt können Sie sehen, dass die meisten großen Seiten verwendet werden.

Hinweis: Der hier verwendete geschätzte Wert für HugePages ist sehr niedrig, was kein normaler Wert für einen Computer ist, auf dem eine Produktumgebung ausgeführt wird. Bitte schätzen Sie die benötigte Seitenanzahl für Ihr System ab und stellen Sie diese je nach Auslastung und Ressourcen entsprechend ein.

vm.swappiness

vm.swappiness — ist ein weiterer Kernelparameter, der die Datenbankleistung beeinflussen kann. Dieser Parameter wird verwendet, um das Auslagerungsverhalten (das Ein- und Auslagern von Seiten in den Speicher) zu steuern. LinuxDer Wert liegt zwischen 0 und 100. Er bestimmt, wie viel Speicher ausgelagert wird. Null bedeutet keine Auslagerung, 100 bedeutet aggressive Auslagerung.

Sie können eine gute Leistung erzielen, indem Sie niedrigere Werte einstellen.

Das Setzen des Wertes auf 0 in neueren Kerneln kann dazu führen, dass der OOM-Killer (Speicherbereinigungsprozess) ausgelöst wird. Linux) wird den Prozess beenden. Daher können Sie den Wert bedenkenlos auf 1 setzen, wenn Sie das Auslagern minimieren möchten. Der Standardwert ist Linux - 60. Ein höherer Wert führt dazu, dass die MMU (Speicherverwaltungseinheit) mehr Auslagerungsspeicher als RAM verwendet, während ein niedrigerer Wert mehr Daten/Code im Speicher hält.

Ein niedrigerer Wert ist eine gute Wahl für eine verbesserte Leistung in PostgreSQL.

vm.overcommit_memory / vm.overcommit_ratio

Anwendungen erwerben Speicher und geben ihn frei, wenn er nicht mehr benötigt wird. In manchen Fällen erhält die Anwendung jedoch zu viel Speicher und gibt ihn nicht frei. Dies kann zu einem OOM-Killer führen. Hier sind die möglichen Parameterwerte vm.overcommit_memory mit jeweils einer Beschreibung:

Heuristisches Overcommit (Standard); Kernelbasierte Heuristik
Overcommit trotzdem zulassen
Übertreiben Sie es nicht und überschreiten Sie nicht das Overcommit-Verhältnis.

Link: https://www.kernel.org/doc/Documentation/vm/overcommit-accounting

vm.overcommit_ratio – Prozentsatz des für Überlastung verfügbaren RAM. Ein Wert von 50 % auf einem System mit 2 GB RAM kann bis zu 3 GB RAM zuweisen.

Ein Wert von 2 für vm.overcommit_memory bietet eine bessere Leistung für PostgreSQL. Dieser Wert maximiert die RAM-Nutzung des Serverprozesses, ohne dass ein nennenswertes Risiko besteht, vom OOM-Killerprozess getötet zu werden. Die Anwendung kann neu geladen werden, jedoch nur innerhalb der Grenzen des Überlaufs, wodurch das Risiko verringert wird, dass ein OOM-Killer den Prozess abbricht. Daher bietet ein Wert von 2 eine bessere Leistung als der Standardwert von 0. Die Zuverlässigkeit kann jedoch verbessert werden, indem sichergestellt wird, dass der Speicher außerhalb des zulässigen Bereichs nicht überlastet wird. Dadurch wird das Risiko eliminiert, dass der Prozess durch einen OOM-Killer abgebrochen wird.

Auf Systemen ohne Swapping kann ein Problem auftreten, wenn vm.overcommit_memory gleich 2 ist.

https://www.postgresql.org/docs/current/static/kernel-resources.html#LINUX-MEMORY-OVERCOMMIT

vm.dirty_background_ratio / vm.dirty_background_bytes

vm.dirty_background_ratio Dies ist der Prozentsatz des Speichers, der mit geänderten Seiten belegt ist, die auf die Festplatte geschrieben werden müssen. Dieser Vorgang erfolgt im Hintergrund. Der Wert dieses Parameters liegt zwischen 0 und 100; Werte unter 5 können jedoch wirkungslos sein, und einige Kernel unterstützen diesen Wert nicht. Der Standardwert ist auf den meisten Systemen 10. LinuxDie Leistung bei schreibintensiven Operationen lässt sich durch ein kleineres Verhältnis verbessern, was bedeutet, dass Linux Wird das Löschen geänderter Seiten im Hintergrund durchführen.

Sie müssen den Wert festlegen vm.dirty_background_bytes Abhängig von der Geschwindigkeit Ihres Laufwerks.

Für diese beiden Parameter gibt es keine „guten“ Werte, da beide hardwareabhängig sind. Wenn Sie jedoch vm.dirty_background_ratio auf 5 und vm.dirty_background_bytes auf 25 % der Festplattengeschwindigkeit setzen, verbessert sich die Leistung in den meisten Fällen auf etwa 25 %.

vm.dirty_ratio/dirty_bytes

Dies ist das gleiche wie vm.dirty_background_ratio/dirty_background_bytes, mit der Ausnahme, dass das Zurücksetzen in einer Worker-Sitzung durchgeführt wird und die Anwendung blockiert. Daher sollte vm.dirty_ratio höher sein als vm.dirty_background_ratio. Dadurch wird sichergestellt, dass Hintergrundprozesse früher starten, um eine Blockierung der Anwendung möglichst zu vermeiden. Sie können den Unterschied zwischen diesen beiden Verhältnissen je nach Festplatten-E/A-Last anpassen.

Ergebnis

Sie können andere Einstellungen anpassen, um die Leistung zu verbessern, aber die Verbesserungen werden minimal sein und Sie werden keinen großen Nutzen sehen. Wir müssen bedenken, dass nicht alle Optionen für alle Arten von Anwendungen gelten. Einige Apps funktionieren besser, wenn wir einige Einstellungen anpassen, andere nicht. Sie müssen das richtige Gleichgewicht zwischen der Konfiguration dieser Einstellungen für Ihre erwartete Arbeitslast und Ihren Anwendungstyp finden und bei der Optimierung auch das Betriebssystemverhalten berücksichtigen. Das Konfigurieren von Kernel-Parametern ist nicht so einfach wie das Konfigurieren von Datenbankparametern; es ist schwieriger, Empfehlungen abzugeben.

Source: habr.com