Опубликован выпуск открытой СУБД Nebula Graph 3.2, предназначенной для эффективного хранения крупных наборов связанных между собой данных, образующих граф, который может насчитывать миллиарды узлов и триллионы связей. Проект написан на языке С++ и распространяется под лицензией Apache 2.0. Клиентские библиотеки для обращения к СУБД подготовлены для языков Go, Python и Java.
В СУБД применяется распределённая архитектура без разделения ресурсов (shared-nothing), подразумевающая запуск независимых и самодостаточных процессов обработки запросов graphd и процессов хранения storaged. Оркестровкой перемещения данных и предоставлением мета-информации о графе занимается мета-сервис. Для обеспечения согласованности данных используется протокол на базе алгоритма RAFT.
Nebula Graph-ի հիմնական առանձնահատկությունները.
- Обеспечение безопасности через предоставление доступа только аутентифицированным пользователям, полномочия которых задаются через систему управления доступа на основе ролей (RBAC).
- Возможность подключения разных типов движков хранения. Поддержка расширения языка формирования запросов новыми алгоритмами.
- Обеспечение минимальных задержек при чтении или записи данных и поддержание высокой пропускной способности. При тестировании в кластере из одного узла graphd и трёх узлов storaged БД размером 632 GB, включающей граф из 1.2 миллиарда вершин и 8.4 миллиарда рёбер задержки были на уровне нескольких миллисекунд, а пропускная способность составила до 140 тысяч запросов в секунду.
- Գծային մասշտաբայնություն.
- SQL-ի նման հարցումների լեզու, որը հզոր է և հեշտ հասկանալի: Աջակցվող գործողությունները ներառում են GO (գրաֆի գագաթների երկկողմանի անցում), GROUP BY, ORDER BY, LIMIT, UNION, UNION DISTINCT, INTERSECT, MINUS, PIPE (օգտագործելով նախորդ հարցման արդյունքը): Աջակցվում են ինդեքսները և օգտագործողի կողմից սահմանված փոփոխականները:
- Բարձր հասանելիության և ձախողումների նկատմամբ կայունության ապահովում:
- Աջակցություն տվյալների շտեմարանի վիճակի մի հատվածով պատկերներ ստեղծելու համար՝ կրկնօրինակների ստեղծումը պարզեցնելու համար:
- Պատրաստ է արդյունաբերական օգտագործման համար (արդեն օգտագործվում է JD, Meituan և Xiaohongshu ենթակառուցվածքներում):
- Տվյալների պահպանման սխեման փոխելու և այն թարմացնելու հնարավորություն՝ առանց ընթացիկ գործողությունների դադարեցման կամ ազդելու:
- TTL աջակցություն՝ տվյալների ժամկետը սահմանափակելու համար:
- Կարգավորումներ և պահեստավորման հոսթեր կառավարելու հրամաններ:
- Աշխատանքի կառավարման և աշխատանքի մեկնարկի ժամանակացույցի գործիքներ (ներկայումս աջակցվող աշխատանքներից են COMPACT և FLUSH):
- Տրված գագաթների միջև ամբողջական ուղին և ամենակարճ ճանապարհը գտնելու գործողություններ:
- OLAP ինտերֆեյս երրորդ կողմի վերլուծական հարթակների հետ ինտեգրվելու համար:
- Կոմունալ ծառայություններ CSV ֆայլերից կամ Spark-ից տվյալների ներմուծման համար:
- Экспорт метрик для мониторинга при помощи Prometheus и Grafana.
- Web-интерфейс Nebula Graph Studio для визуализации операций с графом, навигации по графу, проектирования схемы хранения и загрузки данных.
Նոր թողարկումում.
- Добавлена поддержка функции extract() для извлечения подстроки, соответствующей заданному выражению.
- Оптимизированы настройки в файле конфигурации.
- Добавлены правила оптимизации для удалений бесполезного оператора AppendVertices и отключения применения фильтров рёбер и вершин.
- Сокращён объём данных, копируемых для операции JOIN, а также для операторов Traverse и AppendVertices.
- Оптимизирована производительность SHORTEST PATH и SUBGRAPH
- Улучшено распределение памяти (задействован Arena Allocator).
Source: opennet.ru