BlazingSQL phù hợp để thực hiện các truy vấn phân tích đơn lẻ trên các tập dữ liệu lớn (hàng chục gigabyte) được lưu trữ ở định dạng bảng (ví dụ: nhật ký, thống kê NetFlow, v.v.). BlazingSQL có thể chạy truy vấn từ các tệp thô ở định dạng CSV và Apache Parquet được lưu trữ trên hệ thống tệp mạng và đám mây như HDSF và AWS S3, chuyển trực tiếp kết quả sang bộ nhớ GPU. Nhờ khả năng song song hóa các hoạt động trong GPU và sử dụng bộ nhớ video nhanh hơn, các truy vấn BlazingSQL thực hiện trong thời gian ít hơn
Để hoạt động với GPU, một bộ được phát triển với sự tham gia của NVIDIA được sử dụng
BlazingSQL cung cấp khả năng sử dụng SQL thay vì API xử lý dữ liệu
BlazingSQL đơn giản hóa đáng kể việc làm việc với dữ liệu - thay vì hàng trăm lệnh gọi đến hàm cuDF, bạn có thể sử dụng một truy vấn SQL. Việc sử dụng SQL giúp có thể tích hợp RAPIDS với các hệ thống phân tích hiện có mà không cần ghi các bộ xử lý cụ thể và không cần dùng đến việc tải dữ liệu trung gian vào một DBMS bổ sung, nhưng
đồng thời duy trì khả năng tương thích hoàn toàn với tất cả các phần của RAPIDS, chuyển chức năng hiện có sang SQL và cung cấp hiệu suất ở cấp độ cuDF. Điều này bao gồm hỗ trợ tích hợp với các thư viện.
Nguồn: opennet.ru