BlazingSQL convient pour effectuer des requêtes analytiques uniques sur de grands ensembles de données (des dizaines de gigaoctets) stockés sous forme de tableaux (par exemple, journaux, statistiques NetFlow, etc.). BlazingSQL peut exécuter des requêtes à partir de fichiers bruts aux formats CSV et Apache Parquet hébergés sur des systèmes de fichiers réseau et cloud tels que HDSF et AWS S3, transférant directement le résultat vers la mémoire GPU. Grâce à la parallélisation des opérations dans le GPU et à l'utilisation d'une mémoire vidéo plus rapide, les requêtes dans BlazingSQL sont effectuées jusqu'à
Pour travailler avec les GPU, un ensemble développé avec la participation de NVIDIA est utilisé
BlazingSQL offre la possibilité d'utiliser SQL au lieu des API de traitement de données
BlazingSQL simplifie grandement le travail avec les données : au lieu de centaines d'appels aux fonctions cuDF, vous pouvez utiliser une seule requête SQL. L'utilisation de SQL permet d'intégrer RAPIDS aux systèmes d'analyse existants, sans écrire de processeurs spécifiques et sans recourir à un chargement intermédiaire des données dans un SGBD supplémentaire, mais
tout en maintenant une compatibilité totale avec toutes les parties de RAPIDS, en traduisant les fonctionnalités existantes en SQL et en offrant des performances au niveau cuDF. Cela inclut la prise en charge de l'intégration avec les bibliothèques
Source: opennet.ru