بلیزنگ ایس کیو ایل ایس کیو ایل انجن کوڈ کھلا، ایکسلریشن کے لیے جی پی یو کا استعمال کرتے ہوئے

اعلان کیا۔ ایس کیو ایل انجن کے ذرائع کھولنے کے بارے میں بلیزنگ ایس کیو ایل، جو ڈیٹا پروسیسنگ کو تیز کرنے کے لیے GPU کا استعمال کرتا ہے۔ BlazingSQL ایک مکمل DBMS نہیں ہے، لیکن بڑے ڈیٹا سیٹس کے تجزیہ اور پروسیسنگ کے لیے ایک انجن کے طور پر پوزیشن میں ہے، جو اس کے کاموں کے مقابلے میں اپاچی چمک. کوڈ Python اور میں لکھا گیا ہے۔ کھلا ہوا ہے اپاچی 2.0 کے تحت لائسنس یافتہ۔

BlazingSQL ٹیبلر فارمیٹس میں ذخیرہ شدہ بڑے ڈیٹا سیٹس (دسیوں گیگا بائٹس) پر واحد تجزیاتی سوالات چلانے کے لیے موزوں ہے (مثال کے طور پر لاگز، نیٹ فلو کے اعدادوشمار وغیرہ)۔ BlazingSQL نیٹ ورک اور کلاؤڈ فائل سسٹم جیسے HDSF اور AWS S3 پر میزبان CSV اور Apache Parquet فارمیٹس میں خام فائلوں سے سوالات چلا سکتا ہے، نتیجہ کو براہ راست GPU میموری میں منتقل کر سکتا ہے۔ GPU میں کارروائیوں کے متوازی ہونے اور تیز ویڈیو میموری کے استعمال کی بدولت، BlazingSQL سوالات اس سے بھی کم وقت میں انجام پاتے ہیں۔ 20 اوقات اپاچی اسپارک سے تیز۔

بلیزنگ ایس کیو ایل ایس کیو ایل انجن کوڈ کھلا، ایکسلریشن کے لیے جی پی یو کا استعمال کرتے ہوئے

GPUs کے ساتھ کام کرنے کے لیے، NVIDIA کی شراکت سے تیار کردہ ایک سیٹ استعمال کیا جاتا ہے۔ کھلا لائبریریاں ریپڈز، جو آپ کو ڈیٹا پروسیسنگ اور تجزیاتی ایپلی کیشنز بنانے کی اجازت دیتا ہے جو مکمل طور پر GPU سائیڈ پر چلتی ہیں (بذریعہ فراہم کردہ ازگر انٹرفیس نچلے درجے کے CUDA پرائمیٹوز کو استعمال کرنے اور حسابات کو متوازی بنانے کے لیے)۔

BlazingSQL ڈیٹا پروسیسنگ APIs کے بجائے SQL استعمال کرنے کی صلاحیت فراہم کرتا ہے۔ cuUDF (بیس پر اپاچی تیرRAPIDS میں استعمال کیا جاتا ہے۔ BlazingSQL ایک اضافی پرت ہے جو cuDF کے اوپر چلتی ہے اور ڈسک سے ڈیٹا پڑھنے کے لیے cuIO لائبریری کا استعمال کرتی ہے۔ SQL سوالات کا ترجمہ cuUDF فنکشنز کی کالز میں کیا جاتا ہے، جو آپ کو GPU میں ڈیٹا لوڈ کرنے اور اس پر انضمام، جمع اور فلٹرنگ آپریشنز انجام دینے کی اجازت دیتے ہیں۔ ہزاروں GPUs پر محیط تقسیم شدہ کنفیگریشنز کی تخلیق معاون ہے۔

BlazingSQL ڈیٹا کے ساتھ کام کرنے کو بہت آسان بناتا ہے - cuDF فنکشنز پر سینکڑوں کالز کے بجائے، آپ ایک SQL استفسار استعمال کر سکتے ہیں۔ ایس کیو ایل کا استعمال مخصوص پروسیسرز کو لکھے بغیر اور اضافی DBMS میں ڈیٹا کی درمیانی لوڈنگ کا سہارا لیے بغیر، موجودہ تجزیاتی نظام کے ساتھ RAPIDS کو مربوط کرنا ممکن بناتا ہے، لیکن
RAPIDS کے تمام حصوں کے ساتھ مکمل مطابقت برقرار رکھتے ہوئے، موجودہ فعالیت کو SQL میں ترجمہ کرتے ہوئے اور cuDF سطح پر کارکردگی فراہم کرتے ہوئے اس میں لائبریریوں کے ساتھ انضمام کے لیے تعاون شامل ہے۔ XGBoost и cuML تجزیات اور مشین لرننگ کے مسائل کو حل کرنے کے لیے۔

ماخذ: opennet.ru

نیا تبصرہ شامل کریں