BlazingSQL é adequado para realizar consultas analíticas únicas em grandes conjuntos de dados (dezenas de gigabytes) armazenados em formatos tabulares (por exemplo, logs, estatísticas do NetFlow, etc.). BlazingSQL pode executar consultas de arquivos brutos nos formatos CSV e Apache Parquet hospedados em sistemas de arquivos de rede e nuvem como HDSF e AWS S3, transferindo diretamente o resultado para a memória da GPU. Graças à paralelização das operações na GPU e ao uso de memória de vídeo mais rápida, as consultas do BlazingSQL são executadas em menos de
Para trabalhar com GPUs, é utilizado um conjunto desenvolvido com a participação da NVIDIA
BlazingSQL oferece a capacidade de usar SQL em vez de APIs de processamento de dados
BlazingSQL simplifica muito o trabalho com dados - em vez de centenas de chamadas para funções cuDF, você pode usar uma consulta SQL. A utilização de SQL permite integrar RAPIDS com sistemas analíticos existentes, sem escrever processadores específicos e sem recorrer ao carregamento intermédio de dados num SGBD adicional, mas
ao mesmo tempo que mantém total compatibilidade com todas as partes do RAPIDS, traduzindo a funcionalidade existente em SQL e fornecendo desempenho no nível cuDF. Isso inclui suporte para integração com bibliotecas
Fonte: opennet.ru