آپاچی کلودبری ۲.۰.۰ آخرین نسخه از DBMS توزیعشده است که توسعه کدبیس DBMS متنباز Greenplum را ادامه میدهد، که پس از خرید VMware توسط Broadcom، به صورت متنباز بسته شد. آپاچی کلودبری ۲.۰.۰ اولین نسخه از این پروژه پس از انتقال کد به جامعه آپاچی است. این پروژه در حال حاضر در مرکز رشد آپاچی قرار دارد و پس از آماده شدن زیرساختها و پشتیبانان، به یک پروژه اصلی آپاچی ارتقا خواهد یافت.
Cloudberry DBMS یک نسخه توزیعشده از PostgreSQL DBMS متنباز است که برای اجرای پرسوجوهای تحلیلی روی مجموعه دادههای بزرگ (Data Warehouse) بهینهسازی شده است. برای پردازش موازی دادهها، از معماری پردازش موازی گسترده (MPP) استفاده میکند و با تقسیم دادهها به بخشها و استفاده از خوشهای از دادهها برای ذخیرهسازی و پردازش، امکان مقیاسپذیری ذخیرهسازی تا پتابایت را فراهم میکند. سرورها.
بهبودهای آپاچی کلودبری ۲.۰.۰ شامل موارد زیر است:
- انتقال به پایگاه کد PostgreSQL 14 تکمیل شد (Greenplum بر اساس PostgreSQL 12 بود).
- پشتیبانی از جداول پویا اضافه شده است که به شما امکان میدهد نتایج پرسوجو را بهطور خودکار بهروزرسانی کنید. این ویژگی جدید زمانی مفید است که نیاز به کار با دادههای بهروز، مانند تجزیهوتحلیل دادههای بلادرنگ، معماریهای Lakehouse و پردازندههای خودکار ETL (استخراج، تبدیل، بارگذاری) دارید.
- یک فرمت ذخیرهسازی ترکیبی جدید، PAX (Partition Attributes Across)، پیادهسازی شده است که قابلیتهای ذخیرهسازی مبتنی بر سطر و ستون را با هم ترکیب میکند. فرمت PAX امکان دستیابی به عملکرد بالا را هم در شرایط بارگذاری بالای نوشتن و هم هنگام اجرای پرسوجوهای تحلیلی فراهم میکند.
- برنامهریزی و اجرای پرسوجوهای توزیعشده بهطور قابلتوجهی بهینهسازی شده است.
- مدیریت منابع بهبود یافته: افزایش کارایی کار با حافظه و پردازنده در گرههای کلاستر.
- توزیع دادهها در گرهها و پردازش پرسوجوی موازی بهبود یافته است.
- استراتژیهای پشتیبانگیری گسترده در محیطهای توزیعشده
- اطلاعات مجوز و قالببندی هدر فایلهای کد برای مطابقت با الزامات بنیاد آپاچی تنظیم شدهاند. مصنوعات دودویی از نسخههای کد منبع حذف شدهاند.
- فرآیند ساخت اجزای پروژه در C++ و پایتون بهبود یافت.
منبع: opennet.ru
