Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Thèid ath-sgrùdadh a dhèanamh air tabhartas Yandex ris na stòran-dàta a leanas.

  • Cliog Taigh
  • Odyssey
  • Ath-bheothachadh gu puing ann an ùine (WAL-G)
  • PostgreSQL (a’ gabhail a-steach logerrors, Amcheck, heapcheck)
  • Uaine-phlum

Bhidio:

Hàlo a Shaoghail! Is e m ’ainm Andrey Borodin. Agus is e na nì mi aig Yandex.Cloud stòran-dàta dàimh fosgailte a leasachadh airson math teachdaichean Yandex.Cloud agus Yandex.Cloud.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Anns an òraid seo, bruidhnidh sinn mu na dùbhlain a tha mu choinneamh stòran-dàta fosgailte aig sgèile. Carson a tha e cudromach? Leis gu bheil duilgheadasan beaga, beaga a bhios, mar mosgìotothan, an uairsin nan ailbhein. Bidh iad a’ fàs mòr nuair a tha tòrr chlàran agad.

Ach chan e sin am prìomh rud. Bidh rudan do-chreidsinneach a’ tachairt. Rudan a thachras ann an aon ann am millean cùis. Agus ann an àrainneachd sgòthan, feumaidh tu a bhith deiseil airson sin, oir bidh rudan iongantach a’ fàs gu math coltach nuair a tha rudeigin aig sgèile.

Ach! Dè a’ bhuannachd a th’ ann an stòran-dàta fosgailte? Is e an fhìrinn gu bheil cothrom teòiridheach agad dèiligeadh ri duilgheadas sam bith. Tha an còd stòr agad, tha eòlas prògramadh agad. Bidh sinn ga chur còmhla agus bidh e ag obair.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Dè na dòighean a th’ ann a bhith ag obair air bathar-bog le còd fosgailte?

  • Is e an dòigh as fhasa bathar-bog a chleachdadh. Ma chleachdas tu protocols, ma chleachdas tu inbhean, ma chleachdas tu cruthan, ma sgrìobhas tu ceistean ann am bathar-bog stòr fosgailte, tha thu mar-thà a’ toirt taic dha.
  • Tha thu a’ dèanamh an eag-shiostam aige nas motha. Bidh thu a’ dèanamh an coltas gum bi biast air a lorg tràth. Bidh thu ag àrdachadh earbsachd an t-siostam seo. Bidh thu ag àrdachadh na tha ri fhaighinn de luchd-leasachaidh sa mhargaidh. Leasaichidh tu am bathar-bog seo. Tha thu mar-thà nad fhiosraiche ma tha thu dìreach air stoidhle fhaighinn agus rudeigin a dhèanamh an sin.
  • Is e dòigh-obrach eile a tha furasta a thuigsinn a bhith a’ toirt taic do bhathar-bog stòr fosgailte. Mar eisimpleir, am prògram ainmeil Google Summer of Code, nuair a bhios Google a 'pàigheadh ​​​​àireamh mhòr de dh' oileanaich bho air feadh an t-saoghail airgead so-thuigsinn gus an leasaich iad pròiseactan bathar-bog fosgailte a choinnicheas ri riatanasan ceadachd sònraichte.
  • Is e dòigh-obrach gu math inntinneach a tha seo oir tha e a’ leigeil leis a’ bhathar-bog a thighinn air adhart gun a bhith a’ gluasad am fòcas air falbh bhon choimhearsnachd. Chan eil Google, mar fhuamhaire teicneòlais, ag ràdh gu bheil sinn ag iarraidh am feart seo, tha sinn airson am biast seo a chàradh agus seo far am feum sinn a chladhach. Tha Google ag ràdh: “Dèan na nì thu. Dìreach cùm ag obair mar a tha thu air a bhith ag obair agus bidh a h-uile dad gu math. ”
  • Is e an ath dhòigh air com-pàirteachadh ann an còd fosgailte com-pàirteachadh. Nuair a bhios duilgheadas agad ann am bathar-bog le còd fosgailte agus gu bheil luchd-leasachaidh ann, tòisichidh an luchd-leasachaidh agad a’ fuasgladh nan duilgheadasan. Bidh iad a’ tòiseachadh air do bhun-structar a dhèanamh nas èifeachdaiche, na prògraman agad a dhèanamh nas luaithe agus nas earbsaiche.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Is e aon de na pròiseactan Yandex as ainmeil ann an raon bathar-bog stòr fosgailte ClickHouse. Is e seo stòr-dàta a rugadh mar fhreagairt do na dùbhlain a tha mu choinneamh Yandex.Metrica.

Agus mar stòr-dàta, chaidh a dhèanamh ann an stòr fosgailte gus eag-shiostam a chruthachadh agus a leasachadh còmhla ri luchd-leasachaidh eile (chan ann a-mhàin taobh a-staigh Yandex). Agus a-nis is e pròiseact mòr a tha seo anns a bheil mòran chompanaidhean eadar-dhealaichte an sàs.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Ann an Yandex.Cloud, chruthaich sinn ClickHouse a bharrachd air Yandex Object Storage, ie a bharrachd air stòradh neòil.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Carson a tha seo cudromach san sgòth? Leis gu bheil stòr-dàta sam bith ag obair anns an triantan seo, anns a ’phioramaid seo, anns an rangachd seo de sheòrsan cuimhne. Tha clàran luath ach beaga agad agus SSDan mòra ach slaodach, draibhean cruaidh agus cuid de dh’ innealan bloca eile. Agus ma tha thu èifeachdach aig mullach na pioramaid, tha stòr-dàta luath agad. ma tha thu èifeachdach aig bonn na pioramaid seo, tha stòr-dàta sgèile agad. Agus a thaobh seo, tha a bhith a’ cur còmhdach eile bho shìos na dhòigh loidsigeach airson àrdachadh scalability an stòr-dàta.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Ciamar a ghabhadh dèanamh? Tha seo na phuing chudromach san aithisg seo.

  • B’ urrainn dhuinn ClickHouse a chuir an gnìomh thairis air MDS. Tha MDS na eadar-aghaidh stòraidh sgòthan Yandex a-staigh. Tha e nas iom-fhillte na protocol S3 cumanta, ach tha e nas freagarraiche airson inneal bloca. Tha e nas fheàrr dàta a chlàradh. Tha feum air barrachd phrògraman. Bidh prògramadairean a’ prògramadh, tha e eadhon math, tha e inntinneach.
  • Tha S3 na dhòigh-obrach nas cumanta a tha a’ dèanamh an eadar-aghaidh nas sìmplidhe aig cosgais nas lugha de dh’ atharrachadh gu cuid de sheòrsan obrach.

Gu nàdarra, le bhith ag iarraidh gnìomhachd a thoirt don eag-shiostam ClickHouse gu lèir agus an obair a tha a dhìth a dhèanamh taobh a-staigh Yandex.Cloud, chuir sinn romhainn dèanamh cinnteach gum faigh a’ choimhearsnachd ClickHouse gu lèir buannachd às. Chuir sinn ClickHouse an gnìomh thairis air S3, chan e ClickHouse thairis air MDS. Agus is e tòrr obair a tha seo.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Tùsan:

https://github.com/ClickHouse/ClickHouse/pull/7946 "Sreath tarraing às an t-siostam faidhle"
https://github.com/ClickHouse/ClickHouse/pull/8011 "Amalachadh AWS SDK S3"
https://github.com/ClickHouse/ClickHouse/pull/8649 “Buileachadh bunaiteach air eadar-aghaidh IDDisk airson S3”
https://github.com/ClickHouse/ClickHouse/pull/8356 "Amalachadh einnseanan stòraidh log le eadar-aghaidh IDisk"
https://github.com/ClickHouse/ClickHouse/pull/8862 "Taic einnsean log airson S3 agus SeekableReadBuffer"
https://github.com/ClickHouse/ClickHouse/pull/9128 "Taic Storage Stripe Log S3"
https://github.com/ClickHouse/ClickHouse/pull/9415 "Tòiseachadh tùsail Storage MergeTree airson S3"
https://github.com/ClickHouse/ClickHouse/pull/9646 "MergeTree làn thaic airson S3"
https://github.com/ClickHouse/ClickHouse/pull/10126 "Cuir taic riMergeTree Ath-riochdachadh thairis air S3"
https://github.com/ClickHouse/ClickHouse/pull/11134 “Cuir a-steach teisteanasan bunaiteach agus bannan-cinn àbhaisteach airson stòradh s3”
https://github.com/ClickHouse/ClickHouse/pull/10576 msgstr "S3 le rèiteachadh progsaidh fiùghantach"
https://github.com/ClickHouse/ClickHouse/pull/10744 "S3 le fuasgladh progsaidh"

Is e seo liosta iarrtas tarraing airson siostam faidhle brìgheil a chuir an gnìomh ann an ClickHouse. Is e seo àireamh mhòr de iarrtasan tarraing.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Tùsan:

https://github.com/ClickHouse/ClickHouse/pull/9760 "Ceanglaichean cruaidh DiskS3 a’ buileachadh as fheàrr"
https://github.com/ClickHouse/ClickHouse/pull/11522 “Cliant S3 HTTP - Seachain a bhith a’ dèanamh lethbhreac de shruth freagairt gu cuimhne ”
https://github.com/ClickHouse/ClickHouse/pull/11561 “Seachain a bhith a’ dèanamh lethbhreac de shruth freagairt slàn gu cuimhne ann an S3 HTTP
neach-dèiligidh"
https://github.com/ClickHouse/ClickHouse/pull/13076 “Comas comharradh tasgadan agus faidhlichean clàr-amais airson diosc S3”
https://github.com/ClickHouse/ClickHouse/pull/13459 "Gluais pàirtean bho DiskLocal gu DiskS3 ann an co-shìnte"

Ach cha do chrìochnaich an obair an sin. Às deidh am feart a dhèanamh, bha feum air beagan a bharrachd obrach gus an gnìomh seo a bharrachadh.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Tùsan:

https://github.com/ClickHouse/ClickHouse/pull/12638 "Cuir tachartasan SelectedRows agus SelectedBytes ris"
https://github.com/ClickHouse/ClickHouse/pull/12464 "Cuir tachartasan pròifil bho iarrtas AS3 gu system.events"
https://github.com/ClickHouse/ClickHouse/pull/13028 "Cuir QueryTimeMicroseconds, SelectQueryTimeMicroseconds agus Cuir a-steachQueryTimeMicroseconds"

Agus an uairsin bha e riatanach a dhèanamh comasach a dhearbhadh, sgrùdadh a stèidheachadh agus a dhèanamh furasta a riaghladh.

Agus chaidh seo uile a dhèanamh gus am faigh a’ choimhearsnachd air fad, eag-shiostam ClickHouse gu lèir, toradh na h-obrach seo.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Gluaisidh sinn air adhart gu stòran-dàta malairt, gu stòran-dàta OLTP, a tha nas fhaisge ormsa gu pearsanta.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Is e seo an roinn leasachaidh stòr fosgailte DBMS. Tha na daoine sin a’ dèanamh draoidheachd sràide gus stòran-dàta fosgailte malairt a leasachadh.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Is e aon de na pròiseactan, a’ cleachdadh eisimpleir den urrainn dhuinn bruidhinn air ciamar agus dè a bhios sinn a’ dèanamh, an Connection Pooler ann am Postgres.

Is e stòr-dàta pròiseas a th’ ann am Postgres. Tha seo a’ ciallachadh gum bu chòir nas lugha de cheanglaichean lìonraidh a bhith aig an stòr-dàta a làimhsicheas gnothaichean.

Air an làimh eile, ann an àrainneachd sgòthan, tha suidheachadh àbhaisteach ann nuair a thig mìle ceangal gu aon bhuidheann aig an aon àm. Agus is e obair an neach-conaltraidh ceangail mìle ceangal a phacadh a-steach do àireamh bheag de cheanglaichean frithealaiche.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Faodaidh sinn a ràdh gur e an neach-cruinneachaidh ceangail an gnìomhaiche fòn a bhios ag ath-rèiteachadh na bytes gus an ruig iad an stòr-dàta gu h-èifeachdach.

Gu mì-fhortanach, chan eil facal math Ruiseanach ann airson pooler ceangail. Uaireannan canar ceanglaichean ioma-fhillteadair ris. Ma tha fios agad dè a chanas tu ris an pooler ceangail, an uairsin bi cinnteach gun innis thu dhomh, bidh mi glè thoilichte an cànan teignigeach Ruiseanach ceart a bhruidhinn.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

https://pgconf.ru/2017/92899

Rinn sinn sgrùdadh air luchd-cruinneachaidh ceangail a bha freagarrach airson cruinneachadh postgres fo stiùir. Agus b’ e PgBouncer an roghainn a b’ fheàrr dhuinn. Ach thachair sinn ri grunn dhuilgheadasan le PgBouncer. O chionn mòran bhliadhnaichean, thug Volodya Borodin aithrisean gu bheil sinn a’ cleachdadh PgBouncer, is toil leinn a h-uile càil, ach tha nuances ann, tha rudeigin ri dhèanamh.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

https://pgconf.ru/media/2017/04/03/20170316H1_V.Borodin.pdf

Agus dh’obraich sinn. Chàirich sinn na duilgheadasan a choinnich sinn, ghlèidh sinn Bouncer, agus dh’ fheuch sinn ri iarrtasan tarraing a phutadh suas an abhainn. Ach bha e duilich obrachadh leis an aon snàithlean bunaiteach.

B’ fheudar dhuinn easgannan a chruinneachadh bho Bouncers loma-làn. Nuair a bhios mòran Bouncers aon-snàithlean againn, tha na ceanglaichean air an t-sreath àrd air an gluasad chun t-sreath a-staigh de Bouncers. Is e siostam air a dhroch riaghladh a tha seo a tha duilich a thogail agus a sgèile air ais is air adhart.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Thàinig sinn chun cho-dhùnadh gun do chruthaich sinn ar pooler ceangail fhèin, ris an canar Odyssey. Sgrìobh sinn e bhon toiseach.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

https://www.pgcon.org/2019/schedule/events/1312.en.html

Ann an 2019, aig co-labhairt PgCon, thug mi seachad an pooler seo don choimhearsnachd leasaiche. A-nis tha beagan nas lugha na rionnagan 2 againn air GitHub, ie tha am pròiseact beò, tha fèill mhòr air a’ phròiseact.

Agus ma chruthaicheas tu cruinneachadh Postgres ann an Yandex.Cloud, bidh e na bhuidheann le Odyssey a tha air a thogail a-steach, a thèid ath-dhealbhadh nuair a bhios tu a’ sgèileadh a’ bhuidheann air ais no air adhart.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Dè dh’ ionnsaich sinn bhon phròiseact seo? Tha a bhith a’ cur air bhog pròiseact farpaiseach an-còmhnaidh na cheum ionnsaigheach, is e fìor thomhas a th’ ann nuair a chanas sinn gu bheil duilgheadasan ann nach eilear a’ faighinn fuasgladh luath gu leòr, nach eilear gam fuasgladh anns na h-amannan ùine a bhiodh iomchaidh dhuinn. Ach is e tomhas èifeachdach a tha seo.

Thòisich PgBouncer a’ leasachadh nas luaithe.

Agus a-nis tha pròiseactan eile air nochdadh. Mar eisimpleir, pgagroal, a tha air a leasachadh le luchd-leasachaidh Red Hat. Bidh iad a 'leantainn amasan co-ionann agus a' cur an gnìomh bheachdan co-ionann, ach, gu dearbh, leis na mion-fhiosrachadh aca fhèin, a tha nas fhaisge air luchd-leasachaidh pgagroal.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Tha cùis eile de bhith ag obair leis a’ choimhearsnachd postgres ag ath-nuadhachadh gu àm. Is e seo ath-bheothachadh às deidh fàilligeadh, is e seo ath-bheothachadh bho chùl-taic.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Tha mòran lethbhreacan-glèidhidh ann agus tha iad uile eadar-dhealaichte. Tha am fuasgladh cùl-taic fhèin aig cha mhòr a h-uile neach-reic Postgres.

Ma ghabhas tu a h-uile siostam cùl-taic, cruthaich matrix feart agus le fealla-dhà obrachadh a-mach an dearbhadair sa mhaitrix seo, bidh e neoni. Dè tha seo a' ciallachadh? Dè ma ghabhas tu faidhle cùl-taic sònraichte, chan urrainn dha a bhith air a chruinneachadh bho phìosan den fheadhainn eile. Tha e gun samhail na bhuileachadh, tha e gun samhail na adhbhar, tha e gun samhail anns na beachdan a tha freumhaichte ann. Agus tha iad uile sònraichte.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

https://www.citusdata.com/blog/2017/08/18/introducing-wal-g-faster-restores-for-postgres/

Fhad ‘s a bha sinn ag obair air a’ chùis seo, chuir CitusData am pròiseact WAL-G air bhog. Is e siostam cùl-taic a tha seo a chaidh a dhèanamh le sùil ri àrainneachd na sgòthan. A-nis tha CitusData mar phàirt de Microsoft mu thràth. Agus aig an àm sin, bu toil leinn na beachdan a chaidh a chuir sìos anns na ciad fiosan de WAL-G. Agus thòisich sinn a’ cur ris a’ phròiseact seo.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

https://github.com/wal-g/wal-g/graphs/contributors

A-nis tha mòran dhusanan de luchd-leasachaidh sa phròiseact seo, ach tha na 10 prìomh luchd-tabhartais do WAL-G a’ toirt a-steach 6 Yandexoids. Thug sinn tòrr de na beachdan againn an sin. Agus, gu dearbh, chuir sinn an gnìomh sinn fhìn, rinn sinn deuchainn orra fhìn, chuir sinn a-steach iad gu cinneasachadh sinn fhìn, bidh sinn gan cleachdadh sinn fhìn, bidh sinn fhìn a’ faighinn a-mach càite an gluais sinn an ath rud, agus sinn ag eadar-obrachadh leis a ’choimhearsnachd mhòr WAL-G.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Agus bho ar sealladh, a-nis tha an siostam cùl-taic seo, a 'gabhail a-steach a bhith a' toirt aire do ar n-oidhirpean, air fàs nas fheàrr airson àrainneachd sgòthan. Is e seo a’ chosgais as fheàrr airson taic a chumail ri Postgres san sgòth.

Dè a tha e a’ ciallachadh? Bha sinn a’ brosnachadh beachd meadhanach mòr: bu chòir cùl-taic a bhith tèarainte, saor airson obrachadh agus cho luath sa ghabhas ri ath-nuadhachadh.

Carson a bu chòir dha a bhith saor airson obrachadh? Nuair nach eil dad briste, cha bu chòir fios a bhith agad gu bheil cùl-taic agad. Bidh a h-uile dad ag obair gu math, bidh thu a’ caitheamh cho beag de CPU sa ghabhas, bidh thu a’ cleachdadh cho beag de na goireasan diosc ‘s a ghabhas, agus bidh thu a’ cur cho beag de bhiteagan chun lìonra sa ghabhas gus nach cuir thu bacadh air uallach pàighidh nan seirbheisean luachmhor agad.

Agus nuair a bhriseas a h-uile càil, mar eisimpleir, leig an rianaire sìos an dàta, chaidh rudeigin ceàrr, agus gu h-èiginneach feumaidh tu a dhol air ais chun àm a dh’ fhalbh, gheibh thu air ais leis an airgead gu lèir, oir tha thu ag iarraidh an dàta agad air ais gu sgiobalta agus slàn.

Agus bhrosnaich sinn am beachd sìmplidh seo. Agus, tha e coltach dhuinn, chaidh againn air a bhuileachadh.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Ach chan e sin uile. Bha sinn ag iarraidh aon rud beag eile. Bha sinn ag iarraidh tòrr stòran-dàta eadar-dhealaichte. Chan eil ar luchd-dèiligidh uile a’ cleachdadh Postgres. Bidh cuid de dhaoine a’ cleachdadh MySQL, MongoDB. Anns a’ choimhearsnachd, tha luchd-leasachaidh eile air taic a thoirt do FoundationDB. Agus tha an liosta seo a 'sìor leudachadh.

Is toil leis a’ choimhearsnachd am beachd gu bheil an stòr-dàta air a ruith ann an àrainneachd stiùirichte san sgòth. Agus bidh luchd-leasachaidh a’ cumail suas na stòran-dàta aca, a ghabhas taic a chumail riutha gu co-ionnan còmhla ri Postgres leis an t-siostam cùl-taic againn.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Dè tha sinn air ionnsachadh bhon sgeulachd seo? Chan e loidhnichean còd a th’ anns an toradh againn, mar roinn leasachaidh, chan e aithrisean a th’ ann, chan e faidhlichean a th’ ann. Chan eil an toradh againn a’ tarraing iarrtasan. Is iad sin na beachdan a bhios sinn a’ toirt don choimhearsnachd. Is e seo eòlas teicneòlach agus gluasad teicneòlais gu àrainneachd sgòthan.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Tha stòr-dàta mar Postgres ann. Is toil leam cridhe Postgres as motha. Bidh mi a’ caitheamh mòran ùine a’ leasachadh cridhe Postgres leis a’ choimhearsnachd.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Ach an seo feumar a ràdh gu bheil stàladh a-staigh de stòran-dàta stiùirichte aig Yandex.Cloud. Agus thòisich e o chionn fhada ann an Yandex.Mail. Chaidh an t-eòlas a tha a-nis air leantainn gu Postgres fo stiùir a chruinneachadh nuair a bha am post airson gluasad gu Postgres.

Tha riatanasan puist glè choltach ris an sgòth. Feumaidh e gum bi e comasach dhut sgèile gu fàs eas-chruthach ris nach robh dùil aig àm sam bith den dàta agad. Agus bha tòrr aig a’ phost mu thràth le cuid de cheudan de mhilleanan de bhogsaichean puist àireamh mhòr de luchd-cleachdaidh a bhios an-còmhnaidh a’ dèanamh mòran iarrtasan.

Agus b’ e fìor dhùbhlan a bha seo don sgioba a bha a’ leasachadh Postgres. Air ais an uairsin, chaidh duilgheadasan sam bith a thachair dhuinn innse don choimhearsnachd. Agus chaidh na duilgheadasan sin a cheartachadh, agus a cheartachadh leis a 'choimhearsnachd ann an cuid de dh'àiteachan eadhon aig ìre taic pàighte airson cuid de stòran-dàta eile agus eadhon nas fheàrr. Is e sin, faodaidh tu litir a chuir gu neach-tarraing PgSQL agus freagairt fhaighinn taobh a-staigh 40 mionaid. Is dòcha gu bheil taic pàighte ann an cuid de stòran-dàta a’ smaoineachadh gu bheil barrachd rudan prìomhachais na do bhiast.

A-nis tha stàladh taobh a-staigh Postgres na phetabytes de dhàta. Is iad sin milleanan de dh’ iarrtasan gach diog. Tha iad sin nam mìltean de bhuidhnean. Tha e glè mhòr air sgèile.

Ach tha nuance ann. Chan eil e beò air draibhearan lìonra sùbailte, ach air bathar-cruaidh a tha gu math sìmplidh. Agus tha àrainneachd deuchainn ann gu sònraichte airson rudan ùra inntinneach.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Agus aig àm sònraichte san àrainneachd deuchainn fhuair sinn teachdaireachd a’ nochdadh gun deach briseadh a-steach air na caochlaidhean a-staigh de chlàran-amais an stòr-dàta.

Is e eadar-dhealachadh seòrsa de dhàimh a tha sinn an dùil a bhitheas an-còmhnaidh.

Suidheachadh gu math èiginneach dhuinn. Tha e a’ nochdadh gur dòcha gun deach cuid de dhàta a chall. Agus tha call dàta rudeigin uamhasach uamhasach.

Is e am beachd coitcheann a bhios sinn a’ leantainn ann an stòran-dàta fo stiùir, eadhon le oidhirp, gum bi e duilich dàta a chall. Fiù ma bheir thu air falbh iad a dh’aona ghnothach, feumaidh tu fhathast an neo-làthaireachd a leigeil seachad airson ùine mhòr. Tha tèarainteachd dàta na chreideamh a bhios sinn a’ leantainn gu dìcheallach.

Agus an seo tha suidheachadh ag èirigh a tha a’ nochdadh gur dòcha gu bheil suidheachadh ann air nach bi sinn deiseil airson. Agus thòisich sinn ag ullachadh airson an t-suidheachaidh seo.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

https://commitfest.postgresql.org/23/2171/

B’ e a’ chiad rud a rinn sinn na logaichean a thiodhlacadh às na mìltean de chruinneachaidhean sin. Lorg sinn dè na cruinneachaidhean a bha suidhichte air diosgan le firmware trioblaideach a bha a’ call ùrachadh duilleag dàta. Air a chomharrachadh a h-uile còd dàta Postgres. Agus chomharraich sinn na teachdaireachdan sin a tha a’ nochdadh brisidhean air caochlaidhean a-staigh le còd a chaidh a dhealbhadh gus coirbeachd dàta a lorg.

Cha mhòr nach do ghabh a’ choimhearsnachd ris a’ phìos seo gun mòran deasbaid, oir anns gach cùis shònraichte bha e follaiseach gun robh rudeigin dona air tachairt agus gun robh feum air innse don loga.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Às deidh seo, thàinig sinn chun na h-ìre gu bheil sùil againn a bhios a’ sganadh logaichean. Agus air eagal teachdaireachdan amharasach, bidh e a’ dùsgadh an oifigear dleastanais, agus bidh an t-oifigear dleastanais ga chàradh.

Ach! Tha sganadh logaichean na ghnìomhachd saor air aon bhuidheann agus gu tubaisteach daor airson mìle buidheann.

Sgrìobh sinn leudachadh ris an canar Mearachdan loga. Bidh e a’ cruthachadh sealladh den stòr-dàta anns an urrainn dhut staitistig a thaghadh gu saor agus gu sgiobalta mu mhearachdan san àm a dh’ fhalbh. Agus ma dh'fheumas sinn an t-oifigear dleastanais a dhùsgadh, gheibh sinn a-mach mu dheidhinn seo gun a bhith a 'sganadh faidhlichean gigabyte, ach le bhith a' toirt a-mach beagan bytes bhon chlàr hash.

Chaidh gabhail ris an leudachadh seo, mar eisimpleir, anns an ionad-tasgaidh airson CentOS. Ma tha thu airson a chleachdadh, faodaidh tu fhèin a stàladh. Gu dearbh is e stòr fosgailte a th’ ann.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

https://www.postgresql.org/message-id/flat/[post-d fo dhìon]

Ach chan e sin uile. Thòisich sinn a’ cleachdadh Amcheck, leudachadh a chaidh a thogail leis a’ choimhearsnachd, gus brisidhean caochlaideach a lorg ann an clàran-amais.

Agus fhuair sinn a-mach ma tha thu ga obrachadh aig sgèile, gu bheil mialan ann. Thòisich sinn gan càradh. Chaidh gabhail ris na ceartachaidhean againn.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

https://www.postgresql.org/message-id/flat/[post-d fo dhìon]

Fhuair sinn a-mach nach urrainn don leudachadh seo clàran-amais GiST & GIT a sgrùdadh. Thug sinn taic dhaibh. Ach tha a’ choimhearsnachd fhathast a’ bruidhinn air an taic seo, leis gur e gnìomh gu math ùr a tha seo agus tha tòrr mion-fhiosrachaidh ann.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

https://commitfest.postgresql.org/29/2667/

Agus fhuair sinn a-mach cuideachd nuair a bhios sinn a’ sgrùdadh chlàran-amais airson brisidhean air an stiùiriche mac-samhail, air a’ mhaighstir, gu bheil a h-uile dad ag obair gu math, ach air mac-samhail, air an neach-leantainn, chan eil lorg coirbeachd cho èifeachdach. Chan eil a h-uile tionndadh air a sgrùdadh. Agus chuir aon chaochladh dragh mòr oirnn. Agus chuir sinn seachad bliadhna gu leth a’ conaltradh ris a’ choimhearsnachd gus an t-seic seo a dhèanamh air mac-samhail.

Sgrìobh sinn còd a bu chòir a h-uile protocol a leantainn. Bhruidhinn sinn air a’ phìos seo airson ùine mhòr le Peter Gaghan bho Crunchy Data. B’ fheudar dha beagan atharrachadh air a’ chraobh-B a th’ ann am Postgres gus gabhail ris a’ phìos seo. Chaidh gabhail ris. Agus a-nis tha sgrùdadh clàran-amais air mac-samhail cuideachd air fàs èifeachdach gu leòr gus na brisidhean ris an do thachair sinn a lorg. Is e sin, is iad sin na brisidhean a dh’ fhaodadh a bhith air adhbhrachadh le mearachdan ann am firmware diosc, bugaichean ann am Postgres, biastagan ann an kernel Linux, agus duilgheadasan bathar-cruaidh. Liosta gu math farsaing de thùsan dhuilgheadasan air an robh sinn ag ullachadh.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

https://www.postgresql.org/message-id/flat/38AF687F-8F6B-48B4-AB9E-A60CFD6CC261%40enterprisedb.com#0e86a12c01d967bac04a9bf83cd337cb

Ach a bharrachd air clàran-amais, tha leithid de phàirt ann ri cruach, ie an t-àite far a bheil an dàta air a stòradh. Agus chan eil mòran eadar-dhealachaidhean ann a dh'fhaodar a sgrùdadh.

Tha leudachadh againn ris an canar Heapcheck. Thòisich sinn ga leasachadh. Agus aig an aon àm, còmhla rinn, thòisich a 'chompanaidh EnterpriseDB cuideachd a' sgrìobhadh modal, ris an canadh iad Heapcheck san aon dòigh. Is e dìreach PgHeapcheck a chanadh sinn ris, agus thug iad Heapcheck air. Tha e aca le gnìomhan co-chosmhail, ainm-sgrìobhte beagan eadar-dhealaichte, ach leis na h-aon bheachdan. Chuir iad an gnìomh iad beagan na b’ fheàrr ann an cuid de dh’àiteachan. Agus chuir iad a-steach e ann an stòr fosgailte roimhe seo.

Agus a-nis tha sinn a 'leasachadh an leudachadh, oir chan e an leudachadh a th' ann tuilleadh, ach leudachadh na coimhearsnachd. Agus san àm ri teachd, is e seo pàirt den kernel a thèid a thoirt don h-uile duine gus am bi fios aca ro-làimh mu dhuilgheadasan san àm ri teachd.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

https://www.postgresql.org/message-id/flat/fe9b3722df94f7bdb08768f50ee8fe59%40postgrespro.ru

Ann an cuid de dh’àiteachan, thàinig sinn eadhon chun cho-dhùnadh gu bheil rudan ceàrr againn anns na siostaman sgrùdaidh againn. Mar eisimpleir, an siostam 1C. Nuair a bhios tu a’ cleachdadh stòr-dàta, bidh Postgres uaireannan a’ sgrìobhadh dàta a-steach ann as urrainn dha a leughadh, ach chan urrainn pg_dump a leughadh.

Bha an suidheachadh seo coltach ri coirbeachd don t-siostam lorg duilgheadas againn. Chaidh an t-oifigear dleastanais a dhùsgadh. Thug an t-oifigear dleastanais sùil air na bha a’ tachairt. Às deidh beagan ùine, thàinig neach-dèiligidh agus thuirt e gu robh duilgheadasan agam. Mhìnich an neach-frithealaidh dè an duilgheadas a bh’ ann. Ach tha an duilgheadas ann am meadhan Postgres.

Lorg mi còmhradh mun fheart seo. Agus sgrìobh e gun do thachair sinn ris an fheart seo agus gun robh e mì-thlachdmhor, dhùisg duine air an oidhche gus faighinn a-mach dè a bh’ ann.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

https://www.postgresql.org/message-id/flat/fe9b3722df94f7bdb08768f50ee8fe59%40postgrespro.ru

Fhreagair a’ choimhearsnachd, “O, feumaidh sinn a chàradh.”

Tha analogy sìmplidh agam. Ma tha thu a 'coiseachd ann am bròg aig a bheil gràn gainmhich ann, an uairsin, ann am prionnsabal, faodaidh tu gluasad air adhart - gun duilgheadas sam bith. Ma reic thu bòtannan ri mìltean de dhaoine, dèanamaid bòtannan gun gainmheach idir. Agus ma tha aon de luchd-cleachdaidh do bhrògan a 'dol a ruith marathon, tha thu airson brògan fìor mhath a dhèanamh, agus an uairsin sgèile a thoirt don luchd-cleachdaidh agad gu lèir. Agus tha an leithid de luchd-cleachdaidh ris nach robh dùil an-còmhnaidh ann an àrainneachd sgòthan. Tha an-còmhnaidh luchd-cleachdaidh ann a bhios a’ gabhail brath air a’ bhuidheann ann an dòigh thùsail air choireigin. Feumaidh tu an-còmhnaidh ullachadh airson seo.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Dè tha sinn air ionnsachadh an seo? Dh’ ionnsaich sinn rud sìmplidh: is e an rud as cudromaiche mìneachadh don choimhearsnachd gu bheil duilgheadas ann. Ma tha a’ choimhearsnachd air an duilgheadas aithneachadh, thig farpais nàdarrach gus an duilgheadas fhuasgladh. Leis gu bheil a h-uile duine airson fuasgladh fhaighinn air duilgheadas cudromach. Bidh a h-uile neach-reic, a h-uile neach-tarraing a ’tuigsinn gum faod iad fhèin ceum a chuir air an ràcan seo, agus mar sin tha iad airson cuir às dhaibh.

Ma tha thu ag obair air duilgheadas, ach nach eil e a’ cur dragh air duine ach thusa, ach gu bheil thu ag obair air gu rianail agus gu bheil e air a mheas mar dhuilgheadas aig a’ cheann thall, thèid gabhail ris an iarrtas tarraing agad gu cinnteach. Thèid gabhail ris a’ phìos agad, thèid na leasachaidhean agad no eadhon iarrtasan airson leasachaidhean ath-sgrùdadh leis a’ choimhearsnachd. Aig deireadh an latha, bidh sinn a 'dèanamh an stòr-dàta nas fheàrr dha chèile.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Tha Greenplum na stòr-dàta inntinneach. Is e stòr-dàta gu math co-shìnte a th’ ann stèidhichte air bunait còd Postgres, air a bheil mi glè eòlach.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

https://greenplum.org/greenplum-database-tables-compression/

Agus tha gnìomhachd inntinneach aig Greenplum - cuir a-steach bùird làn-leasaichte. Is iad seo clàran as urrainn dhut a chuir gu sgiobalta. Faodaidh iad a bhith an dàrna cuid colbh no sreath.

Ach cha robh cruinneachadh ann, i.e. cha robh comas-gnìomh ann far an urrainn dhut an dàta a tha suidhichte sa chlàr a chuir air dòigh a rèir an òrdugh a tha ann am fear de na clàran-amais.

Thàinig na balaich bhon tacsaidh thugam agus thuirt iad: “Anndra, tha thu eòlach air Postgres. Agus an seo tha e cha mhòr an aon rud. Tionndaidh gu 20 mionaid. Gabhaidh tu e agus dèan e." Bha mi a’ smaoineachadh gu bheil, tha fios agam air Postgres, ag atharrachadh airson 20 mionaid - feumaidh mi seo a dhèanamh.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

https://github.com/greenplum-db/gpdb/commit/179feb77a034c2547021d675082aae0911be40f7

Ach chan e, cha b’ e 20 mionaid a bh’ ann, sgrìobh mi e thairis air mìosan. Aig co-labhairt PgConf.Russia, chaidh mi gu Heikki Linakangas bho Pivotal agus dh’ fhaighnich mi: “A bheil duilgheadas sam bith ann le seo? Carson nach eil cruinneachadh bùird làn-leasaichte ann?” Tha e ag ràdh: “Gabhaidh tu an dàta. Bidh thu a’ rèiteachadh, bidh thu ag ath-rèiteachadh. Chan eil ann ach obair." Mise: “O, tha, chan fheum thu ach a ghabhail agus a dhèanamh.” Tha e ag ràdh: “Tha, feumaidh sinn làmhan an-asgaidh airson seo a dhèanamh.” Bha mi a’ smaoineachadh gum feum mi seo a dhèanamh gu cinnteach.

Agus beagan mhìosan às deidh sin chuir mi a-steach iarrtas tarraing a chuir an gnìomh seo an gnìomh. Chaidh an t-iarrtas tarraing seo ath-sgrùdadh le Pivotal còmhla ris a’ choimhearsnachd. Gu dearbh, bha bugs ann.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

https://github.com/greenplum-db/gpdb/issues/10150

Ach is e an rud as inntinniche nuair a chaidh an t-iarrtas tarraing seo a chur còmhla, chaidh biastagan a lorg ann an Greenplum fhèin. Tha sinn air faighinn a-mach gu bheil clàran tiùrr uaireannan a’ briseadh gnìomhachd nuair a thèid an cruinneachadh. Agus is e seo rud a dh’ fheumar a cheartachadh. Agus tha i san àite air an do bhruidhinn mi. Agus b’ e mo bheachd nàdarra - ceart gu leòr, leig dhomh seo a dhèanamh cuideachd.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

https://github.com/greenplum-db/gpdb/pull/10290

Shuidhich mi am biast seo. Chuir sinn iarrtas tarraing chun luchd-rèiteachaidh. Chaidh a mharbhadh.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

https://github.com/greenplum-db/gpdb-postgres-merge/pull/53

Às deidh sin thionndaidh e a-mach gum feumar an gnìomh seo fhaighinn anns an dreach Greenplum airson PostgreSQL 12. Is e sin, tha an dàn-thuras 20-mionaid a’ leantainn le tachartasan inntinneach ùra. Bha e inntinneach suathadh ris an leasachadh a th’ ann an-dràsta, far a bheil a’ choimhearsnachd a’ gearradh feartan ùra agus as cudromaiche. Tha e reòta.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

https://github.com/greenplum-db/gpdb/pull/10565

Ach cha tàinig e gu crìch an sin. Às deidh a h-uile càil, thionndaidh e a-mach gum feum sinn sgrìobhainnean a sgrìobhadh airson seo uile.

Thòisich mi a’ sgrìobhadh sgrìobhainnean. Gu fortanach, thàinig an luchd-aithris à Pivotal còmhla. 'S e Beurla an cànan dùthchasach aca. Chuidich iad mi leis na sgrìobhainnean. Gu dearbh, rinn iad fhèin ath-sgrìobhadh air na mhol mi gu fìor Bheurla.

Agus an seo, tha e coltach, thàinig an dàn-thuras gu crìch. Agus a bheil fios agad dè thachair an uairsin? Thàinig na balaich bhon tacsaidh thugam agus thuirt iad: “Tha dà thachartas ann fhathast, gach fear airson 10 mionaidean.” Agus dè a bu chòir dhomh innse dhaibh? Thuirt mi, a-nis gun toir mi seachad aithisg air sgèile, an uairsin chì sinn na tachartasan agad, oir is e obair inntinneach a tha seo.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Dè dh'ionnsaich sinn bhon chùis seo? Leis gu bheil a bhith ag obair le còd fosgailte an-còmhnaidh ag obair le neach sònraichte, tha e an-còmhnaidh ag obair leis a’ choimhearsnachd. Air sgàth 's gu robh mi ag obair aig a h-uile ìre le leasaiche, cuid de luchd-dearbhaidh, cuid de luchd-tarraing, cuid de aithriseachd, cuid de ailtire. Cha robh mi ag obair le Greenplum, bha mi ag obair le daoine timcheall air Greenplum.

Ach! Tha puing chudromach eile ann - chan eil ann ach obair. Is e sin, thig thu, òl cofaidh, sgrìobh còd. Bidh a h-uile seòrsa de dh ’atharrachaidhean sìmplidh ag obair. Dèan e gu h-àbhaisteach - bidh e gu math! Agus ’s e obair gu math inntinneach a th’ ann. Tha iarrtas airson na h-obrach seo bho luchd-dèiligidh Yandex.Cloud, luchd-cleachdaidh ar cruinneachaidhean taobh a-staigh Yandex agus taobh a-muigh. Agus tha mi a’ smaoineachadh gun àrdaich an àireamh de phròiseactan anns am bi sinn a’ gabhail pàirt agus gun àrdaich doimhneachd ar com-pàirt cuideachd.

Sin e. Gluaisidh sinn air adhart gu na ceistean.

Dè agus carson a nì sinn ann an stòran-dàta Open Source. Andrey Borodin (Yandex.Cloud)

Seisean cheistean

Halò! Tha seisean ceist is freagairt eile againn. Agus anns an stiùidio Andrei Borodin. 'S e seo an neach a tha dìreach a dh'innis thu mu dheidhinn na chuir Yandex.Cloud agus Yandex gu open source. Chan eil an aithisg againn a-nis gu tur mun Cloud, ach aig an aon àm tha sinn stèidhichte air teicneòlasan mar sin. Às aonais na rinn thu taobh a-staigh Yandex, cha bhiodh seirbheis ann an Yandex.Cloud, mar sin tapadh leat bhuam gu pearsanta. Agus a’ chiad cheist bhon chraoladh: “Dè air a bheil gach pròiseact air an tug thu iomradh sgrìobhte?”

Tha an siostam cùl-taic ann an WAL-G sgrìobhte ann an Go. Is e seo aon de na pròiseactan as ùire a tha sinn air a bhith ag obair. Gu litearra chan eil e ach 3 bliadhna a dh'aois. Agus gu tric tha stòr-dàta mu dheidhinn earbsachd. Agus tha seo a 'ciallachadh gu bheil na stòran-dàta gu math sean agus mar as trice tha iad sgrìobhte ann an C. Thòisich am pròiseact Postgres mu 30 bliadhna air ais. An uairsin b’ e an C89 an roghainn cheart. Agus tha Postgres sgrìobhte air. Mar as trice bidh stòran-dàta nas ùire leithid ClickHouse sgrìobhte ann an C ++. Tha a h-uile leasachadh siostam stèidhichte air C agus C ++.

Ceist bhon mhanaidsear ionmhais againn, air a bheil uallach airson cosgaisean aig Cloud: “Carson a tha Cloud a’ cosg airgead air taic a thoirt do stòr fosgailte? ”

Tha freagairt shìmplidh don mhanaidsear ionmhais an seo. Bidh sinn a’ dèanamh seo gus ar seirbheisean a dhèanamh nas fheàrr. Dè na dòighean as urrainn dhuinn a dhèanamh nas fheàrr? Is urrainn dhuinn rudan a dhèanamh nas èifeachdaiche, nas luaithe, agus rudan a dhèanamh nas so-ruigsinneach. Ach dhuinne, tha an sgeulachd seo gu sònraichte mu dheidhinn earbsachd. Mar eisimpleir, ann an siostam cùl-taic bidh sinn ag ath-sgrùdadh 100% de na pìosan a tha a’ buntainn ris. Tha fios againn dè an còd a th’ ann. Agus tha sinn nas comhfhurtail a bhith a’ sgaoileadh dreachan ùra gu cinneasachadh. Is e sin, an toiseach, tha e mu dheidhinn misneachd, mu dheidhinn deiseil airson leasachadh agus mu earbsachd

Ceist eile: “A bheil riatanasan luchd-cleachdaidh bhon taobh a-muigh a tha a’ fuireach ann an Yandex.Cloud eadar-dhealaichte bho luchd-cleachdaidh a-staigh a tha a ’fuireach san Cloud a-staigh?”

Tha ìomhaigh an luchd, gu dearbh, eadar-dhealaichte. Ach bho shealladh na roinne agam, tha na cùisean sònraichte agus inntinneach uile air an cruthachadh air luchd neo-àbhaisteach. Tha luchd-leasachaidh le mac-meanmna, luchd-leasachaidh a nì an rud ris nach robh dùil, cho buailteach a bhith air an lorg taobh a-staigh agus taobh a-muigh. A thaobh seo, tha sinn uile timcheall air an aon rud. Agus, is dòcha, is e an aon fheart cudromach taobh a-staigh gnìomhachd Yandex de stòran-dàta gu bheil teagasg againn taobh a-staigh Yandex. Aig àm air choreigin, bidh cuid de shòn ruigsinneachd gu tur a ’dol fo sgàil, agus feumaidh a h-uile seirbheis Yandex cumail orra ag obair a dh’ aindeoin seo. Is e eadar-dhealachadh beag a tha seo. Ach tha e a’ cruthachadh tòrr leasachadh rannsachaidh aig eadar-aghaidh an stòr-dàta agus stac lìonra. Rud eile, bidh ionadan taobh a-muigh agus a-staigh a’ gineadh na h-aon iarrtasan airson feartan agus iarrtasan coltach ris airson earbsachd agus coileanadh a leasachadh.

An ath cheist: “Ciamar a tha thu gu pearsanta a’ faireachdainn gu bheil mòran de na nì thu air a chleachdadh le Clouds eile? ” Chan ainmich sinn feadhainn sònraichte, ach tha mòran phròiseactan a chaidh a dhèanamh ann an Yandex.Cloud gan cleachdadh ann an sgòthan dhaoine eile.

Tha seo fionnar. An toiseach, tha e na chomharra gu bheil sinn air rudeigin a dhèanamh ceart. Agus tha e a 'sgrìobadh an ego. Agus tha sinn nas misneachaile gun do rinn sinn an co-dhùnadh ceart. Air an làimh eile, is e seo an dòchas gun toir seo dhuinn san àm ri teachd beachdan ùra, iarrtasan ùra bho luchd-cleachdaidh treas-phàrtaidh. Tha a’ mhòr-chuid de chùisean air GitHub air an cruthachadh le luchd-rianachd siostam fa leth, DBAn fa leth, ailtirean fa leth, innleadairean fa leth, ach uaireannan bidh daoine le eòlas eagarach a’ tighinn agus ag ràdh gu bheil an duilgheadas seo againn ann an 30% de chùisean sònraichte agus smaoinichidh sinn air mar a dh’ fhuasglas sinn e. Is e seo a tha sinn a’ coimhead air adhart ris a’ mhòr-chuid. Tha sinn a’ coimhead air adhart ri bhith a’ roinn eòlasan le àrd-ùrlaran sgòthan eile.

Bha thu a’ bruidhinn tòrr mun mharaton. Tha fios agam gun do ruith thu marathon ann am Moscow. Mar thoradh? An deach thu seachad air na balaich bho PostgreSQL?

Chan e, tha Oleg Bartunov a 'ruith gu math luath. Chrìochnaich e uair a thìde air thoiseach orm. Gu h-iomlan, tha mi toilichte leis cho fada ‘s a fhuair mi. Dhòmhsa, bha dìreach crìochnachadh na choileanadh. Gu h-iomlan, tha e na iongnadh gu bheil uimhir de luchd-ruithidh ann an coimhearsnachd postgres. Tha e coltach rium gu bheil dàimh de sheòrsa air choreigin eadar spòrs aerobic agus am miann airson prògramadh shiostaman.

A bheil thu ag ràdh nach eil ruitheadairean aig ClickHouse?

Tha fios agam le cinnt gu bheil iad ann. Tha ClickHouse na stòr-dàta cuideachd. Air an t-slighe, tha Oleg a-nis a 'sgrìobhadh thugam: "An tèid sinn airson ruith às deidh na h-aithisg?" Is e deagh bheachd a tha seo.

Ceist eile bhon chraoladh bho Nikita: “Carson a shocraich thu am biast ann an Greenplum thu fhèin agus nach tug thu dha òigridh?” Fìor, chan eil e gu math soilleir dè a th’ anns a’ bhiast agus dè an t-seirbheis a th’ ann, ach is dòcha gu bheil e a’ ciallachadh an tè air an do bhruidhinn thu.

Seadh, ann am prionnsabal, dh'fhaodadh e bhith air a thoirt do chuideigin. Is e dìreach an còd a bha mi dìreach air atharrachadh. Agus bha e nàdarra cumail a’ dol ga dhèanamh sa bhad. Ann am prionnsapal, is e deagh bheachd a th’ ann eòlas a cho-roinn leis an sgioba. Bidh sinn gu cinnteach a’ roinn ghnìomhan Greenplum am measg gach ball den roinn againn.

Leis gu bheil sinn a’ bruidhinn mu dheidhinn òigridh, seo ceist. Cho-dhùin an neach a’ chiad ghealladh a chruthachadh ann am Postgres. Dè a dh'fheumas e a dhèanamh gus a' chiad ghealladh a dhèanamh?

Is e ceist inntinneach a tha seo: “Càite an tòisich thu?” Mar as trice tha e gu math duilich tòiseachadh le rudeigin san kernel. Ann am Postgres, mar eisimpleir, tha liosta ri dhèanamh. Ach gu dearbh, is e seo duilleag de na dh’ fheuch iad ri dhèanamh, ach cha do shoirbhich leotha. Is e rudan iom-fhillte a tha seo. Agus mar as trice gheibh thu cuid de ghoireasan san eag-shiostam, cuid de leudachaidhean a ghabhas leasachadh, a tharraingeas nas lugha de aire bho luchd-leasachaidh kernel. Agus, a rèir sin, tha barrachd phuingean airson fàs an sin. Aig prògram Google Summer of code, a h-uile bliadhna bidh coimhearsnachd postgres a 'cur air adhart iomadh cuspair eadar-dhealaichte ris am faodar dèiligeadh. Am-bliadhna bha, tha mi a’ smaoineachadh, triùir oileanach againn. Sgrìobh aon eadhon ann an WAL-G air cuspairean a tha cudromach do Yandex. Ann an Greenplum, tha a h-uile dad nas sìmplidh na ann an coimhearsnachd Postgres, leis gu bheil luchd-hackers Greenplum a ’làimhseachadh iarrtasan tarraing gu math agus a’ tòiseachadh ag ath-sgrùdadh sa bhad. Is e beagan mhìosan a th’ ann a bhith a’ cur bad gu Postgres, ach thig Greenplum ann an latha agus chì thu na rinn thu. Is e rud eile a th 'ann gum feum Greenplum fuasgladh fhaighinn air duilgheadasan làithreach. Chan eil Greenplum air a chleachdadh gu farsaing, agus mar sin tha e gu math duilich do dhuilgheadas a lorg. Agus an toiseach, feumaidh sinn duilgheadasan fhuasgladh, gu dearbh.

Source: www.habr.com