BlazingSQL is geschikt voor het uitvoeren van enkelvoudige analytische queries op grote datasets (tientallen gigabytes) die zijn opgeslagen in tabelvorm (bijvoorbeeld logs, NetFlow-statistieken, enz.). BlazingSQL kan query's uitvoeren vanuit onbewerkte bestanden in CSV- en Apache Parquet-formaten die worden gehost op netwerk- en cloudbestandssystemen zoals HDSF en AWS S3, en het resultaat rechtstreeks naar GPU-geheugen overbrengen. Dankzij parallellisatie van bewerkingen in de GPU en het gebruik van sneller videogeheugen worden BlazingSQL-query's in minder dan XNUMX uur uitgevoerd
Om met GPU's te werken, wordt een set gebruikt die is ontwikkeld met medewerking van NVIDIA
BlazingSQL biedt de mogelijkheid om SQL te gebruiken in plaats van API's voor gegevensverwerking
BlazingSQL vereenvoudigt het werken met gegevens enorm: in plaats van honderden aanroepen naar cuDF-functies kunt u één SQL-query gebruiken. Het gebruik van SQL maakt het mogelijk om RAPIDS te integreren met bestaande analysesystemen, zonder specifieke processors te schrijven en zonder toevlucht te nemen tot het tussentijds laden van gegevens in een extra DBMS, maar
met behoud van volledige compatibiliteit met alle onderdelen van RAPIDS, vertaling van bestaande functionaliteit naar SQL en prestatie op cuDF-niveau. Dit omvat ondersteuning voor integratie met bibliotheken
Bron: opennet.ru