BlazingSQL 適合用於以表格格式儲存的大型資料集(數十 GB)(例如日誌、NetFlow 統計資料等)執行單一分析查詢。 BlazingSQL 可以對託管在 HDSF 和 AWS S3 等網路和雲端檔案系統上的 CSV 和 Apache Parquet 格式的原始檔案執行查詢,並將結果直接傳輸到 GPU 記憶體。 由於 GPU 中的平行操作以及更快的視訊記憶體的使用,BlazingSQL 查詢的執行時間小於
為了與 GPU 搭配使用,使用了 NVIDIA 參與開發的套件
BlazingSQL 提供了使用 SQL 而不是資料處理 API 的能力
BlazingSQL 大大簡化了資料處理 - 您可以使用一個 SQL 查詢,而不是對 cuDF 函數進行數百次呼叫。 SQL 的使用使得將 RAPIDS 與現有分析系統整合成為可能,無需編寫特定的處理器,也無需將資料中間載入到額外的 DBMS 中,但是
同時保持與 RAPIDS 所有部分的完全相容性,將現有功能轉換為 SQL 並提供 cuDF 層級的效能。 這包括對與庫集成的支援。
來源: opennet.ru