BlazingSQL 适合对以表格格式存储的大型数据集(数十 GB)(例如日志、NetFlow 统计信息等)执行单一分析查询。 BlazingSQL 可以对托管在 HDSF 和 AWS S3 等网络和云文件系统上的 CSV 和 Apache Parquet 格式的原始文件运行查询,并将结果直接传输到 GPU 内存。 由于 GPU 中操作的并行化以及更快视频内存的使用,BlazingSQL 中的查询执行次数可达
为了与 GPU 配合使用,使用了 NVIDIA 参与开发的套件
BlazingSQL 提供了使用 SQL 而不是数据处理 API 的能力
BlazingSQL 极大地简化了数据处理 - 您可以使用一个 SQL 查询,而不是数百次调用 cuDF 函数。 SQL 的使用使得将 RAPIDS 与现有分析系统集成成为可能,无需编写特定的处理器,也无需将数据中间加载到额外的 DBMS 中,但是
同时保持与 RAPIDS 所有部分的完全兼容性,将现有功能转换为 SQL 并提供 cuDF 级别的性能。 这包括支持与库集成
来源: opennet.ru