Còd einnsean BlazingSQL SQL fosgailte, a 'cleachdadh GPU airson luathachadh

Air ainmeachadh mu bhith a’ fosgladh stòran an einnsean SQL BlazingSQL, a bhios a’ cleachdadh an GPU gus giollachd dàta a luathachadh. Chan e DBMS làn-chuimseach a th’ ann am BlazingSQL, ach tha e air a shuidheachadh mar einnsean airson a bhith a’ sgrùdadh agus a’ giullachd sheataichean dàta mòra, a tha coltach ris na gnìomhan aige. Apache Spark. Tha an còd sgrìobhte ann am Python agus fosgailte le cead fo Apache 2.0.

Tha BlazingSQL freagarrach airson ceistean anailis singilte a dhèanamh air seataichean dàta mòra (deichean de gigabytes) air an stòradh ann an cruthan clàir (mar eisimpleir, logaichean, staitistig NetFlow, msaa). Faodaidh BlazingSQL ceistean a ruith bho fhaidhlichean amh ann an cruthan CSV agus Apache Parquet air an cumail air siostaman faidhle lìonra agus sgòthan leithid HDSF agus AWS S3, a’ gluasad an toradh gu dìreach gu cuimhne GPU. Taing do cho-shìnteadh obrachaidhean anns an GPU agus cleachdadh cuimhne bhidio nas luaithe, bidh ceistean BlazingSQL a ’cur an gnìomh ann an nas lugha na 20 amannan nas luaithe na Apache Spark.

Còd einnsean BlazingSQL SQL fosgailte, a 'cleachdadh GPU airson luathachadh

Gus obrachadh le GPUs, thathas a’ cleachdadh seata a chaidh a leasachadh le com-pàirt NVIDIA fosgail leabharlannan RAPAICHEAN, a leigeas leat tagraidhean giollachd dàta agus anailis a chruthachadh a ruitheas gu tur air taobh GPU (air a sholarachadh le Eadar-aghaidh Python gus prìomhairean CUDA ìre ìosal a chleachdadh agus àireamhachadh co-shìnte).

Tha BlazingSQL a’ toirt seachad comas SQL a chleachdadh an àite APIan giollachd dàta cuUDF (air a' bhonn Saighead Apache) air a chleachdadh ann an RAPIDS. Tha BlazingSQL na shreath a bharrachd a bhios a’ ruith air mullach cuDF agus a’ cleachdadh leabharlann cuIO gus dàta bho diosc a leughadh. Tha ceistean SQL air an eadar-theangachadh gu gairmean gu gnìomhan cuUDF, a leigeas leat dàta a luchdachadh a-steach don GPU agus obair aonaidh, cruinneachaidh agus sìoltachain a dhèanamh air. Thathas a’ toirt taic do chruthachadh rèiteachaidhean sgaoilte thairis air mìltean de GPUs.

Tha BlazingSQL gu mòr a’ sìmpleachadh obrachadh le dàta - an àite ceudan de ghairmean gu gnìomhan cuDF, faodaidh tu aon cheist SQL a chleachdadh. Tha cleachdadh SQL ga dhèanamh comasach RAPIDS fhilleadh a-steach leis na siostaman anailitigeach a th’ ann mar-thà, gun a bhith a’ sgrìobhadh pròiseasairean sònraichte agus gun a bhith a’ cleachdadh luchdachadh dàta eadar-mheadhanach gu DBMS a bharrachd, ach
agus aig an aon àm a’ cumail làn cho-chòrdalachd le gach pàirt de RAPIDS, ag eadar-theangachadh gnìomhachd gnàthaichte gu SQL agus a’ toirt seachad coileanadh aig ìre cuDF. Tha seo a’ gabhail a-steach taic airson amalachadh le leabharlannan XGB àrdachadh и cuML airson fuasgladh fhaighinn air duilgheadasan anailis agus ionnsachadh innealan.

Source: fosgailtenet.ru

Cuir beachd ann