BlazingSQL は、表形式で保存された大規模なデータ セット (数十ギガバイト) (ログ、NetFlow 統計など) に対して単一の分析クエリを実行するのに適しています。 BlazingSQL は、HDSF や AWS S3 などのネットワークおよびクラウド ファイル システムでホストされている CSV および Apache Parquet 形式の生ファイルからクエリを実行し、結果を GPU メモリに直接転送できます。 GPU での操作の並列化と高速ビデオ メモリの使用により、BlazingSQL クエリは XNUMX 時間未満で実行されます。
GPU と連携するには、NVIDIA の参加により開発されたセットが使用されます
BlazingSQL は、データ処理 API の代わりに SQL を使用する機能を提供します。
BlazingSQL を使用すると、データの操作が大幅に簡素化されます。cuDF 関数を何百も呼び出す代わりに、XNUMX つの SQL クエリを使用できます。 SQL を使用すると、特定のプロセッサを作成したり、追加の DBMS にデータを中間ロードしたりすることなく、RAPIDS を既存の分析システムと統合できます。
RAPIDS のすべての部分との完全な互換性を維持しながら、既存の機能を SQL に変換し、cuDF レベルでのパフォーマンスを提供します。 これには、ライブラリとの統合のサポートが含まれます
出所: オープンネット.ru