BlazingSQL eignet sich für die Durchführung einzelner analytischer Abfragen für große Datensätze (zig Gigabyte), die in Tabellenformaten gespeichert sind (z. B. Protokolle, NetFlow-Statistiken usw.). BlazingSQL kann Abfragen von Rohdateien in den Formaten CSV und Apache Parquet ausführen, die auf Netzwerk- und Cloud-Dateisystemen wie HDSF und AWS S3 gehostet werden, und das Ergebnis direkt in den GPU-Speicher übertragen. Dank der Parallelisierung von Vorgängen in der GPU und der Verwendung eines schnelleren Videospeichers werden BlazingSQL-Abfragen in weniger als einem Jahr ausgeführt
Für die Arbeit mit GPUs wird ein unter Beteiligung von NVIDIA entwickelter Satz verwendet
BlazingSQL bietet die Möglichkeit, SQL anstelle von Datenverarbeitungs-APIs zu verwenden
BlazingSQL vereinfacht die Arbeit mit Daten erheblich – statt Hunderter Aufrufe von cuDF-Funktionen können Sie eine SQL-Abfrage verwenden. Die Verwendung von SQL ermöglicht die Integration von RAPIDS in bestehende Analysesysteme, ohne dass spezielle Prozessoren geschrieben werden müssen und ohne auf das Zwischenladen von Daten in ein zusätzliches DBMS zurückgreifen zu müssen
Dabei bleibt die volle Kompatibilität mit allen Teilen von RAPIDS erhalten, die vorhandene Funktionalität wird in SQL übersetzt und Leistung auf cuDF-Ebene bereitgestellt. Dazu gehört auch die Unterstützung der Integration mit Bibliotheken
Source: opennet.ru