BlazingSQL nadaje się do uruchamiania pojedynczych zapytań analitycznych na dużych zbiorach danych (dziesiątki gigabajtów) przechowywanych w formatach tabelarycznych (na przykład logi, statystyki NetFlow itp.). BlazingSQL może uruchamiać zapytania z nieprzetworzonych plików w formatach CSV i Apache Parquet hostowanych w sieciowych i chmurowych systemach plików, takich jak HDSF i AWS S3, bezpośrednio przesyłając wyniki do pamięci GPU. Dzięki zrównoleglenia operacji w GPU i wykorzystaniu szybszej pamięci wideo, zapytania BlazingSQL wykonują się w czasie krótszym niż
Do współpracy z procesorami graficznymi wykorzystywany jest zestaw opracowany przy udziale firmy NVIDIA
BlazingSQL zapewnia możliwość korzystania z SQL zamiast interfejsów API do przetwarzania danych
BlazingSQL znacznie upraszcza pracę z danymi - zamiast setek wywołań funkcji cuDF, możesz użyć jednego zapytania SQL. Zastosowanie języka SQL umożliwia integrację RAPIDS z istniejącymi systemami analitycznymi, bez konieczności pisania konkretnych procesorów i bez uciekania się do pośredniego ładowania danych do dodatkowego DBMS, ale
zachowując pełną kompatybilność ze wszystkimi częściami RAPIDS, tłumacząc istniejącą funkcjonalność na SQL i zapewniając wydajność na poziomie cuDF. Obejmuje to wsparcie integracji z bibliotekami.
Źródło: opennet.ru