BlazingSQL เหมาะสำหรับการสืบค้นเชิงวิเคราะห์เดี่ยวบนชุดข้อมูลขนาดใหญ่ (หลายสิบกิกะไบต์) ที่จัดเก็บไว้ในรูปแบบตาราง (เช่น บันทึก สถิติ NetFlow ฯลฯ) BlazingSQL สามารถเรียกใช้การสืบค้นจากไฟล์ Raw ในรูปแบบ CSV และ Apache Parquet ที่โฮสต์บนเครือข่ายและระบบไฟล์บนคลาวด์ เช่น HDSF และ AWS S3 โดยถ่ายโอนผลลัพธ์ไปยังหน่วยความจำ GPU โดยตรง ต้องขอบคุณการทำงานแบบขนานใน GPU และการใช้หน่วยความจำวิดีโอที่เร็วขึ้น การสืบค้น BlazingSQL จึงดำเนินการได้ในเวลาน้อยกว่า
ในการทำงานกับ GPU จะใช้ชุดที่พัฒนาโดยการมีส่วนร่วมของ NVIDIA
BlazingSQL ให้ความสามารถในการใช้ SQL แทน API การประมวลผลข้อมูล
BlazingSQL ช่วยให้ทำงานกับข้อมูลได้ง่ายขึ้นมาก - แทนที่จะต้องเรียกฟังก์ชัน cuDF หลายร้อยครั้ง คุณสามารถใช้แบบสอบถาม SQL เดียวได้ การใช้ SQL ทำให้สามารถรวม RAPIDS เข้ากับระบบการวิเคราะห์ที่มีอยู่ได้โดยไม่ต้องเขียนโปรเซสเซอร์เฉพาะและไม่ต้องอาศัยการโหลดข้อมูลระดับกลางลงใน DBMS เพิ่มเติม แต่
ในขณะที่ยังคงความเข้ากันได้อย่างสมบูรณ์กับทุกส่วนของ RAPIDS แปลฟังก์ชันการทำงานที่มีอยู่เป็น SQL และมอบประสิทธิภาพในระดับ cuDF ซึ่งรวมถึงการสนับสนุนสำหรับการผสานรวมกับไลบรารี
ที่มา: opennet.ru