BlazingSQL SQL Motorcode op, benotzt GPU fir Beschleunegung

ugekënnegt iwwer d'Ouverture vun de Quelle vum SQL-Motor BlazingSQL, déi d'GPU benotzt fir d'Datenveraarbechtung ze beschleunegen. BlazingSQL ass net e vollwäertege DBMS, awer ass als Motor positionéiert fir grouss Datesets ze analyséieren an ze veraarbecht, vergläichbar a sengen Aufgaben Apache Spark. De Code ass am Python geschriwwen an opmaachen lizenzéiert ënner Apache 2.0.

BlazingSQL ass gëeegent fir eenzel analytesch Ufroen op grouss Datesets (Zénger vu Gigabytes) auszeféieren, déi an Tabularformate gespäichert sinn (zum Beispill Logbicher, NetFlow Statistiken, etc.). BlazingSQL kann Ufroe vu rau Dateien an CSV- an Apache Parquet-Formater lafen, déi op Netzwierk- a Clouddateiesystemer wéi HDSF an AWS S3 gehost ginn, direkt d'Resultat op GPU-Erënnerung transferéieren. Dank der Paralleliséierung vun Operatiounen an der GPU an der Notzung vu méi séier Video Memory, BlazingSQL Ufroen ausféieren a manner wéi 20 Mol méi séier wéi Apache Spark.

BlazingSQL SQL Motorcode op, benotzt GPU fir Beschleunegung

Fir mat GPUs ze schaffen, gëtt e Set entwéckelt mat der Participatioun vun NVIDIA benotzt oppen Bibliothéiken RAPIDS, wat Iech erlaabt Datenveraarbechtung an Analyseapplikatiounen ze kreéieren déi ganz op der GPU Säit lafen (virgesinn vum Python Interface fir niddereg-Niveau CUDA Primitiv ze benotzen a Berechnungen parallel ze maachen).

BlazingSQL bitt d'Fäegkeet SQL ze benotzen anstatt Datenveraarbechtung APIen cuUDF (op der Basis Apache Pfeil) benotzt an RAPIDS. BlazingSQL ass eng zousätzlech Schicht déi uewen op cuDF leeft an d'cuIO Bibliothéik benotzt fir Daten vun der Disk ze liesen. SQL Ufroen ginn an Uriff op cuUDF Funktiounen iwwersat, déi Iech erlaben Daten an d'GPU ze lueden an d'Fusiouns-, Aggregatiouns- a Filteroperatiounen dorop auszeféieren. D'Schafung vu verdeelte Konfiguratiounen iwwer Dausende vu GPUs gëtt ënnerstëtzt.

BlazingSQL vereinfacht immens d'Aarbecht mat Daten - amplaz vun Honnerte vun Uruff un cuDF Funktiounen, kënnt Dir eng SQL Ufro benotzen. D'Benotzung vu SQL mécht et méiglech RAPIDS mat existente Analytiksystemer z'integréieren, ouni spezifesch Prozessoren ze schreiwen an ouni Zwëschenbelaaschtung vun Daten an eng zousätzlech DBMS ze benotzen, awer
wärend voll Kompatibilitéit mat allen Deeler vu RAPIDS behalen, existéierend Funktionalitéit an SQL iwwersetzen an Leeschtung um cuDF Niveau ubidden. Dëst beinhalt Ënnerstëtzung fir Integratioun mat Bibliothéiken XGBoost и cuML fir Probleemer vun der Analyse a Maschinnléieren ze léisen.

Source: opennet.ru

Setzt e Commentaire