BlazingSQL es adecuado para realizar consultas analíticas individuales en grandes conjuntos de datos (decenas de gigabytes) almacenados en formatos tabulares (por ejemplo, registros, estadísticas de NetFlow, etc.). BlazingSQL puede ejecutar consultas desde archivos sin formato en formatos CSV y Apache Parquet alojados en sistemas de archivos de red y en la nube como HDSF y AWS S3, transfiriendo directamente el resultado a la memoria de la GPU. Gracias a la paralelización de operaciones en la GPU y al uso de una memoria de video más rápida, las consultas BlazingSQL se ejecutan en menos de
Para trabajar con GPU se utiliza un conjunto desarrollado con la participación de NVIDIA
BlazingSQL ofrece la posibilidad de utilizar SQL en lugar de API de procesamiento de datos
BlazingSQL simplifica enormemente el trabajo con datos: en lugar de cientos de llamadas a funciones cuDF, puede utilizar una consulta SQL. El uso de SQL permite integrar RAPIDS con los sistemas de análisis existentes, sin escribir procesadores específicos y sin recurrir a la carga intermedia de datos en un DBMS adicional, pero
manteniendo la compatibilidad total con todas las partes de RAPIDS, traduciendo la funcionalidad existente a SQL y proporcionando rendimiento a nivel cuDF. Esto incluye soporte para la integración con bibliotecas.
Fuente: opennet.ru