Apache Cloudberry 2.0.0 ist die neueste Version des verteilten DBMS und setzt die Entwicklung des Open-Source-Codes des Greenplum DBMS fort, der nach der Übernahme von VMware von Broadcom als Closed Source freigegeben wurde. Apache Cloudberry 2.0.0 ist die erste Version des Projekts nach der Übertragung des Codes an die Apache-Community. Das Projekt befindet sich derzeit im Apache Incubator und wird zu einem primären Apache-Projekt ausgebaut, sobald Infrastruktur und Betreuer bereit sind.
Cloudberry DBMS ist eine verteilte Edition des Open-Source-Datenbankmanagementsystems PostgreSQL, optimiert für die Ausführung analytischer Abfragen auf großen Datensätzen (Data Warehouse). Für die parallele Datenverarbeitung nutzt es eine Architektur für massiv parallele Verarbeitung (MPP), die eine Speicherskalierbarkeit auf Petabytes ermöglicht, indem Daten in Segmente unterteilt und ein Datencluster für Speicherung und Verarbeitung verwendet wird. Server.
Zu den Verbesserungen in Apache Cloudberry 2.0.0 gehören:
- Der Übergang zur PostgreSQL 14-Codebasis wurde abgeschlossen (Greenplum basierte auf PostgreSQL 12).
- Unterstützung für dynamische Tabellen hinzugefügt, sodass Sie Abfrageergebnisse automatisch aktualisieren können. Diese neue Funktion ist nützlich, wenn Sie mit aktuellen Daten arbeiten müssen, z. B. bei Echtzeit-Datenanalysen, Lakehouse-Architekturen und automatisierten ETL-Prozessoren (Extrahieren, Transformieren, Laden).
- Das neue hybride Speicherformat PAX (Partition Attributes Across) wurde implementiert und kombiniert die Funktionen von zeilen- und spaltenbasierter Speicherung. Das PAX-Format ermöglicht eine hohe Leistung sowohl bei hoher Schreiblast als auch bei der Ausführung analytischer Abfragen.
- Die Planung und Ausführung verteilter Abfragen wurde deutlich optimiert.
- Verbessertes Ressourcenmanagement: Erhöhte Effizienz bei der Arbeit mit Speicher und CPU auf Clusterknoten.
- Verbesserte Datenverteilung über Knoten und parallele Abfrageverarbeitung.
- Erweiterte Backup-Strategien in verteilten Umgebungen.
- Lizenzinformationen und Header-Formatierung der Codedateien wurden angepasst, um den Anforderungen der Apache Foundation zu entsprechen. Binäre Artefakte wurden aus den Quellcode-Versionen entfernt.
- Der Prozess zum Erstellen von Projektkomponenten in C++ und Python wurde verbessert.
Source: opennet.ru
