Apache Cassandra 4.0 DBMS ri fhaighinn

Thaisbean Bunait Bathar-bog Apache foillseachadh an sgaoileadh DBMS Apache Cassandra 4.0, a bhuineas don chlas de shiostaman noSQL agus a tha air a dhealbhadh gus stòradh fìor scalable agus earbsach a chruthachadh de mhòran dàta air a stòradh ann an cruth raon ceangail (hash). Thathas den bheachd gu bheil an sgaoileadh Cassandra 4.0 deiseil airson buileachadh cinneasachaidh agus chaidh a dhearbhadh mu thràth ann am bun-structaran Amazon, Apple, DataStax, Instaclustr, iland agus Netflix le cruinneachaidhean de chòrr air 1000 nodan. Tha còd a’ phròiseict air a sgrìobhadh ann an Java agus air a chuairteachadh fo chead Apache 2.0.

Chaidh an Cassandra DBMS a leasachadh an toiseach le Facebook agus ann an 2009 chaidh a ghluasad fo sgèith an Apache Foundation. Chaidh fuasglaidhean gnìomhachais stèidhichte air Cassandra a chuir gu seirbheisean cumhachd bho chompanaidhean leithid Apple, Adobe, CERN, Cisco, IBM, HP, Comcast, Disney, eBay, Huawei, Netflix, Sony, Rackspace, Reddit agus Twitter. Mar eisimpleir, tha còrr air mìle buidheann aig bun-structar stòraidh stèidhichte air Apache Cassandra a chleachd Apple, a’ toirt a-steach 160 mìle nodan agus a’ stòradh còrr air 100 petabytes de dhàta. Bidh Huawei a’ cleachdadh còrr air 300 cruinneachaidhean Apache Cassandra, a’ toirt a-steach 30 mìle nod, agus bidh Netflix a’ cleachdadh còrr air 100 cruinneachaidhean, a’ còmhdach 10 mìle nod agus a’ giullachd còrr air trillean iarrtas gach latha.

Bidh an Cassandra DBMS a’ cothlamadh siostam hash Dynamo làn-sgaoileadh, a bheir seachad scalability cha mhòr sreathach mar a bhios meud an dàta ag àrdachadh. Bidh Cassandra a’ cleachdadh modal stòraidh dàta stèidhichte air teaghlach colbh (ColumnFamily), a tha eadar-dhealaichte bho shiostaman mar memcachedb, a bhios a’ stòradh dàta a-mhàin ann an sèine iuchrach / luach, leis a’ chomas stòradh hashes a chuir air dòigh le grunn ìrean de neadachadh. Gus eadar-obrachadh leis an stòr-dàta a dhèanamh nas sìmplidhe, tha an cànan ceiste structarail CQL (Cassandra Query Language) a’ faighinn taic, a tha coltach ri SQL, ach air a lughdachadh ann an gnìomhachd. Tha feartan a’ toirt a-steach taic airson ainmean-àite agus teaghlaichean colbhan, agus cruthachadh chlàran-amais a’ cleachdadh an abairt “CREATE INDEX”.

Leigidh an DBMS leat stòradh a dhìonas fàiligeadh: bidh dàta a thèid a chuir san stòr-dàta air ath-aithris gu fèin-ghluasadach gu grunn nodan de lìonra sgaoilte, a dh’ fhaodas a dhol thairis air diofar ionadan dàta. Nuair a dh’ fhailicheas nód, thèid na gnìomhan aige a thogail air an itealan le nodan eile. Thathas a’ cur nodan ùra ris a’ bhuidheann agus ag ùrachadh dreach Cassandra air an itealan, gun eadar-theachd làimhe a bharrachd no ath-dhealbhadh nodan eile. Tha draibhearan le taic CQL air an ullachadh airson Python, Java (JDBC/DBAPI2), Ruby, PHP, C ++ agus JavaScript (Node.js).

Prìomh innleachdan:

  • Coileanadh nas fheàrr agus scalability. Tha èifeachdas iomlaid dàta ann an cruth SSTable (Sorted Strings Table) eadar nodan air a leasachadh. Chaidh am Pròtacal Teachdaireachdan Internode ùrachadh. Tha astar gluasad sruthan dàta eadar nodan air a dhol suas gu 5 tursan (gu h-àraidh mar thoradh air cleachdadh an dòigh Zero Copy agus gluasad SSTables gu lèir), agus tha an gluasad airson obair leughaidh is sgrìobhaidh air a dhol suas gu 25%. Tha am pròiseas ath-bheothachaidh mean air mhean air a mheudachadh. Tha latasan mar thoradh air stad cruinneachadh sgudail air an lughdachadh gu beagan mhilleanan-tomhais.
  • Taic a bharrachd airson log sgrùdaidh a leigeas leat sùil a chumail air gnìomhachd dearbhaidh luchd-cleachdaidh agus a h-uile ceist CQL a chaidh a chuir an gnìomh.
  • Chuir sinn ris a’ chomas clàr làn iarrtas dà-chànanach a chumail, a’ toirt cothrom dhut a h-uile trafaic iarrtas is freagairt a shàbhaladh. Airson riaghladh, thathas a’ moladh na h-òrdughan “nodetool enablefullquerylog | disablefullquerylog | resetfullquerylog”, agus tha an goireas fqltool air a thoirt seachad airson mion-sgrùdadh log. Tha òrdughan air an toirt seachad airson an log a thionndadh gu cruth a ghabhas leughadh (Dump), a’ dèanamh coimeas eadar sliseagan gnìomhachd (Dèan coimeas) agus ath-chur gu bàs (Ath-chluich) airson mion-sgrùdadh ag ath-riochdachadh nan suidheachaidhean a tha dualach don fhìor luchd.
  • Taic a bharrachd airson clàran brìgheil a tha a’ nochdadh chan e dàta air a stòradh ann an SSTables, ach toradh fiosrachaidh tron ​​​​API (meatairean coileanaidh, fiosrachadh suidheachaidhean, susbaint tasgadan, fiosrachadh mu luchd-dèiligidh ceangailte, msaa).
  • Tha èifeachdas stòradh dàta teann air a leasachadh, a’ lughdachadh caitheamh àite diosc agus ag adhartachadh coileanadh leughaidh.
  • Tha dàta co-cheangailte ri prìomh àite an t-siostaim (siostam.*) a-nis air a chuir sa chiad eòlaire gu bunaiteach an àite a bhith air a chuairteachadh thairis air a h-uile clàr dàta, a leigeas leis an nód fuireach ag obair ma dh’ fhailicheas aon de na diosgan a bharrachd.
  • Taic deuchainneach a bharrachd airson ath-riochdachadh gluasadach agus cuòram saor. Cha bhith mac-samhail sealach a’ stòradh an dàta gu lèir agus a’ cleachdadh ath-nuadhachadh mean air mhean gus a bhith co-chòrdail ri làn mhac-samhail. Bidh cuòraman aotrom a’ cur an gnìomh optimization sgrìobhaidh anns nach eil sgrìobhaidhean air an dèanamh gu mac-samhail sealach gus am bi seata gu leòr de làn mhac-samhail rim faighinn.
  • Taic deuchainneach a bharrachd airson Java 11.
  • Roghainn deuchainneach a bharrachd gus coimeas a dhèanamh eadar na craobhan Merkle gu lèir. Mar eisimpleir, le bhith a’ comasachadh an roghainn air cruinneachadh 3-nód anns a bheil dà mhac-samhail co-ionann agus aon dhiubh sean, thig ùrachadh air a’ mhac-samhail a tha seann-fhasanta a’ cleachdadh dìreach aon obair leth-bhreac den mhac-samhail gnàthach.
  • Chaidh gnìomhan ùra a chur ris an ùine làithreach, an ceann-latha làithreach, an t-àm làithreach agus an t-Ùine UUID.
  • Taic a bharrachd airson gnìomhachd àireamhachd ann an ceistean CQL.
  • Tha comas air obrachadh àireamhachd a dhèanamh eadar dàta leis na seòrsaichean “stampa-ama”/”ceann-latha” agus “fad” air a thoirt seachad.
  • Chaidh modh a chuir ris airson ro-shealladh sruthan dàta a tha riatanach airson faighinn air ais (càradh nodetool - ro-shealladh) agus an comas sgrùdadh a dhèanamh air ionracas an dàta a thathar ag ath-nuadhachadh (càradh nodetool -validate).
  • Tha comas aig ceistean SELECT a-nis eileamaidean Mapa is Set a phròiseasadh.
  • Taic a bharrachd airson a bhith co-shìnte ris a’ chiad ìre togail de sheallaidhean tàbhachdach (cassandra.yaml:concurrent_materialized_view_builders).
  • Tha an àithne “nodetool cfstats” air taic a chuir ri bhith a’ rèiteach le cuid de mheatairean agus a’ cuingealachadh na h-àireamh de shreathan a tha air an taisbeanadh.
  • Tha roghainnean air an toirt seachad gus ceangal an neach-cleachdaidh ri ionadan dàta sònraichte a chuingealachadh a-mhàin.
  • Chuir sinn ris a’ chomas a bhith a’ cuingealachadh dian (crìoch reata) cruthachadh dhealbhan agus obair glanaidh.
  • Tha cqlsh agus cqlshlib a-nis a’ toirt taic do Python 3 (tha Python 2.7 fhathast a’ faighinn taic).
  • Tha taic airson àrd-ùrlar Windows air a stad. Gus Cassandra a ruith air Windows, thathas a’ moladh àrainneachdan Linux a chaidh a chruthachadh air bunait fo-shiostam WSL2 (Windows Subsystem airson Linux 2) no siostaman virtualization a chleachdadh.



Source: fosgailtenet.ru

Cuir beachd ann