BlazingSQL SQL vélarkóði opinn, notar GPU fyrir hröðun

Tilkynnt um að opna heimildir SQL vélarinnar BlazingSQL, sem notar GPU til að flýta fyrir gagnavinnslu. BlazingSQL er ekki fullgild DBMS, heldur er hann staðsettur sem vél til að greina og vinna úr stórum gagnasöfnum, sambærilegt í verkefnum sínum og Apache Spark. Kóðinn er skrifaður í Python og opinn leyfi samkvæmt Apache 2.0.

BlazingSQL er hentugur til að framkvæma stakar greiningarfyrirspurnir á stórum gagnasöfnum (tugum gígabæta) sem eru geymd á töfluformi (til dæmis logs, NetFlow tölfræði osfrv.). BlazingSQL getur keyrt fyrirspurnir úr hráum skrám á CSV og Apache Parket sniðum sem hýst eru á net- og skýjaskráarkerfum eins og HDSF og AWS S3, og flytja niðurstöðuna beint í GPU minni. Þökk sé samhliða aðgerðum í GPU og notkun hraðara myndminni, keyra BlazingSQL fyrirspurnir á innan við 20 sinnum hraðar en Apache Spark.

BlazingSQL SQL vélarkóði opinn, notar GPU fyrir hröðun

Til að vinna með GPU er sett sem er þróað með þátttöku NVIDIA notað opinn bókasöfn HRAÐI, sem gerir þér kleift að búa til gagnavinnslu- og greiningarforrit sem keyra algjörlega á GPU hliðinni (útvegað af Python tengi að nota lágstig CUDA frumstæður og samhliða útreikninga).

BlazingSQL veitir möguleika á að nota SQL í stað gagnavinnslu API cuUDF (á grunninum Apache ör) notað í RAPIDS. BlazingSQL er viðbótarlag sem keyrir ofan á cuDF og notar cuIO bókasafnið til að lesa gögn af diski. SQL fyrirspurnir eru þýddar í símtöl í cuUDF aðgerðir, sem gera þér kleift að hlaða gögnum inn í GPU og framkvæma sameiningu, söfnun og síunaraðgerðir á þeim. Stuðningur er við að búa til dreifðar stillingar sem spanna þúsundir GPU.

BlazingSQL einfaldar mjög vinnu með gögn - í stað hundraðkalla í cuDF aðgerðir geturðu notað eina SQL fyrirspurn. Notkun SQL gerir það mögulegt að samþætta RAPIDS við núverandi greiningarkerfi, án þess að skrifa sérstaka örgjörva og án þess að grípa til millihleðslu gagna í viðbótar DBMS, en
á meðan viðheldur fullri eindrægni við alla hluta RAPIDS, þýðir núverandi virkni yfir í SQL og veitir frammistöðu á cuDF stigi. Þetta felur í sér stuðning við samþættingu við bókasöfn XGBoost и cuML til að leysa vandamál við greiningar og vélanám.

Heimild: opennet.ru

Bæta við athugasemd