BlazingSQL è adatto per eseguire singole query analitiche su set di dati di grandi dimensioni (decine di gigabyte) archiviati in formati tabulari (ad esempio log, statistiche NetFlow, ecc.). BlazingSQL può eseguire query da file non elaborati nei formati CSV e Apache Parquet ospitati su file system di rete e cloud come HDSF e AWS S3, trasferendo direttamente il risultato alla memoria della GPU. Grazie alla parallelizzazione delle operazioni nella GPU e all'utilizzo di una memoria video più veloce, le query BlazingSQL vengono eseguite in meno di
Per lavorare con le GPU, viene utilizzato un set sviluppato con la partecipazione di NVIDIA
BlazingSQL offre la possibilità di utilizzare SQL invece delle API di elaborazione dati
BlazingSQL semplifica notevolmente il lavoro con i dati: invece di centinaia di chiamate alle funzioni cuDF, puoi utilizzare una query SQL. L'utilizzo di SQL consente di integrare RAPIDS con i sistemi di analisi esistenti, senza scrivere processori specifici e senza ricorrere al caricamento intermedio dei dati in un DBMS aggiuntivo, ma
pur mantenendo la piena compatibilità con tutte le parti di RAPIDS, traducendo le funzionalità esistenti in SQL e fornendo prestazioni a livello cuDF. Ciò include il supporto per l'integrazione con le biblioteche
Fonte: opennet.ru