Випуск графо-орієнтованої СУБД Nebula Graph 3.2

Опубликован выпуск открытой СУБД Nebula Graph 3.2, предназначенной для эффективного хранения крупных наборов связанных между собой данных, образующих граф, который может насчитывать миллиарды узлов и триллионы связей. Проект написан на языке С++ и распространяется под лицензией Apache 2.0. Клиентские библиотеки для обращения к СУБД подготовлены для языков Go, Python и Java.

В СУБД применяется распределённая архитектура без разделения ресурсов (shared-nothing), подразумевающая запуск независимых и самодостаточных процессов обработки запросов graphd и процессов хранения storaged. Оркестровкой перемещения данных и предоставлением мета-информации о графе занимается мета-сервис. Для обеспечения согласованности данных используется протокол на базе алгоритма RAFT.

Основні особливості Nebula Graph:

  • Обеспечение безопасности через предоставление доступа только аутентифицированным пользователям, полномочия которых задаются через систему управления доступа на основе ролей (RBAC).
  • Возможность подключения разных типов движков хранения. Поддержка расширения языка формирования запросов новыми алгоритмами.
  • Обеспечение минимальных задержек при чтении или записи данных и поддержание высокой пропускной способности. При тестировании в кластере из одного узла graphd и трёх узлов storaged БД размером 632 GB, включающей граф из 1.2 миллиарда вершин и 8.4 миллиарда рёбер задержки были на уровне нескольких миллисекунд, а пропускная способность составила до 140 тысяч запросов в секунду.
  • Лінійна масштабованість.
  • SQL-подібна мова запитів, достатньо потужна і проста для сприйняття. Підтримуються такі операції, як GO (двонаправлений обхід вершин графа), GROUP BY, ORDER BY, LIMIT, UNION, UNION DISTINCT, INTERSECT, MINUS, PIPE (використання результату попереднього запиту). Підтримуються індекси та зумовлені користувачем змінні.
  • Забезпечення високої доступності та стійкість до збоїв.
  • Підтримка створення снапшотів зі зрізом стану БД спрощення створення резервних копій.
  • Готовність для промислового застосування (вже використовується в інфраструктурі компаній JD, Meituan та Xiaohongshu).
  • Можливість зміни схеми зберігання та оновлення даних без зупинки чи впливу на виконувані операції.
  • Підтримка TTL обмеження часу життя даних.
  • Команди для керування налаштуваннями та хостами зберігання.
  • Інструменти для управління роботами та плануванням запуску робіт (з робіт поки підтримуються COMPACT та FLUSH).
  • Операції пошуку повного шляху та найкоротшого шляху між заданими вершинами.
  • Інтерфейс OLAP для інтеграції зі сторонніми платформами аналітики.
  • Утиліти для імпорту даних із файлів CSV або Spark.
  • Экспорт метрик для мониторинга при помощи Prometheus и Grafana.
  • Web-интерфейс Nebula Graph Studio для визуализации операций с графом, навигации по графу, проектирования схемы хранения и загрузки данных.

У новому випуску:

  • Добавлена поддержка функции extract() для извлечения подстроки, соответствующей заданному выражению.
  • Оптимизированы настройки в файле конфигурации.
  • Добавлены правила оптимизации для удалений бесполезного оператора AppendVertices и отключения применения фильтров рёбер и вершин.
  • Сокращён объём данных, копируемых для операции JOIN, а также для операторов Traverse и AppendVertices.
  • Оптимизирована производительность SHORTEST PATH и SUBGRAPH
  • Улучшено распределение памяти (задействован Arena Allocator).

Джерело: opennet.ru

Додати коментар або відгук