Anns a 'Ghiblean, chruinnich innleadairean Avito airson coinneamhan air-loidhne leis a' phrÏomh leasaiche ClickHouse Alexey Milovidov agus Kirill Shvakov, leasaiche Golang bho Integros. Bhruidhinn sinn air mar a chleachdas sinn siostam rianachd stòr-dà ta agus dè na duilgheadasan a bhios againn.
Stèidhichte air aâ choinneamh, tha sinn air artaigil a chuir ri chèile le freagairtean eòlaichean do na ceistean againn agus an luchd-èisteachd mu chĂšl-taic, ath-chĂ radh dĂ ta, faclairean taobh a-muigh, draibhear Golang agus ag Ăšrachadh dreachan ClickHouse. Is dòcha gum bi e feumail do luchd-leasachaidh a tha mar-thĂ ag obair gu gnĂŹomhach leis an Yandex DBMS agus aig a bheil Ăšidh san latha an-diugh agus san Ă m ri teachd. Gu gnĂ thach, is ann le Alexei Milovidov a tha na freagairtean, mura sgrĂŹobhar a chaochladh.
Bi faiceallach, tha tòrr teacsa fon ghearradh. Tha sinn an dòchas gun cuidich an susbaint le ceistean thu le bhith aâ seòladh.

ClĂ r-innse
Mura h-eil thu airson an teacsa a leughadh, faodaidh tu coimhead air clĂ radh nan cruinneachaidhean . Tha còdan-tĂŹm anns aâ chiad bheachd fon bhidio.
Tha ClickHouse air Úrachadh gu cunbhalach, ach chan eil an dà ta againn. Dè a nÏ thu mu dheidhinn?
Tha ClickHouse air Úrachadh gu cunbhalach, agus chan eil an dà ta againn, a chaidh a phròiseasadh mu dheireadh as fheà rr, air Úrachadh agus tha e ann an leth-bhreac cÚl-taic.
Canaidh sinn gu robh duilgheadas againn agus chaidh an dĂ ta a chall. Cho-dhĂšin sinn ath-nuadhachadh, agus thionndaidh e a-mach gu bheil na seann phĂ irtean, a tha air an stòradh air na frithealaichean cĂšl-taic, gu math eadar-dhealaichte bhon dreach a thathas aâ cleachdadh an-drĂ sta de ClickHouse. Dè a dhèanamh ann an suidheachadh mar sin, agus a bheil e comasach?
Tha suidheachadh anns an do chuir thu air ais dĂ ta bho chĂšl-taic ann an seann chruth, ach chan eil e a 'ceangal ris an dreach Ăšr, do-dhèanta. Bidh sinn aâ dèanamh cinnteach gu bheil an cruth dĂ ta ann an ClickHouse an-còmhnaidh co-chòrdail air ais. Tha seo tòrr nas cudromaiche na co-fhreagarrachd air ais ann an gnĂŹomhachd ma tha giĂšlan cuid de ghnĂŹomh nach eilear aâ cleachdadh ach air atharrachadh. Bu chòir gum biodh an tionndadh Ăšr de ClickHouse an-còmhnaidh comasach air an dĂ ta a tha air a stòradh air diosc a leughadh. Is e seo an lagh.
Dè na cleachdaidhean as fheĂ rr a thâ ann an-drĂ sta airson taic a chumail ri dĂ ta bho ClickHouse?
Mar a nĂŹ thu cĂšl-taic, aâ gabhail a-steach gu bheil sinn air an obair dheireannach as fheĂ rr a dhèanamh, stòr-dĂ ta mòr de terabytes, agus dĂ ta a thèid Ăšrachadh, can, airson na trĂŹ latha a dhâ fhalbh, agus an uairsin nach tachair modhan sam bith dha?
Is urrainn dhuinn ar fuasgladh fhèin a dhèanamh agus sgrÏobhadh air an bash: cruinnich na lethbhric cÚl-taic sin ann an leithid de dhòigh. Is dòcha nach eil feum air dad a phronnadh, agus chaidh am baidhsagal a chruthachadh o chionn fhada?
Feuch an tòisich sinn leis na cleachdaidhean as fheà rr. Bidh mo cho-obraichean an-còmhnaidh a 'comhairleachadh, mar fhreagairt do cheistean mu chÚl-taic, gus an cur an cuimhne seirbheis Yandex.Cloud, far a bheil an duilgheadas seo air a rèiteachadh mar-thà . Mar sin cleachd e ma ghabhas e dèanamh.
Chan eil fuasgladh iomlan ann airson cĂšl-taic, ceud sa cheud air a thogail a-steach do ClickHouse. Tha cuid de bheĂ rnan ann a ghabhas cleachdadh. Gus fuasgladh coileanta fhaighinn, feumaidh tu an dĂ rna cuid beagan tinkering le lĂ imh, no pasgain a chruthachadh ann an cruth sgriobtaichean.
Tòisichidh mi leis na fuasglaidhean as sĂŹmplidh agus thig mi gu crĂŹch leis an fheadhainn as ionnsaichte, a rèir meud an dĂ ta agus meud aâ bhraisle. Mar as motha an cruinneachadh, is ann as iom-fhillte a thig am fuasgladh.
Mura h-eil an clà r le dà ta ann ach beagan gigabytes, faodar cÚl-taic a dhèanamh mar seo:
- SĂ bhail mĂŹneachadh clĂ r ie meata-dĂ ta - taisbeanadh cruthaich clĂ r.
- Dèan dump aâ cleachdadh an neach-dèiligidh ClickHouse - tagh * bhon bhòrd a fhaidhleadh. Gu gnĂ thach gheibh thu faidhle ann an cruth TabSeparated. Ma tha thu airson a bhith nas èifeachdaiche, faodaidh tu a dhèanamh ann an cruth DĂšthchasach.
Ma tha an à ireamh de dhà ta nas motha, bheir an cÚl-taic barrachd Úine agus tòrr à ite. Canar cÚl-taic loidsigeach ris an seo; chan eil e ceangailte ri cruth dà ta ClickHouse. Ma tha, an uairsin mar an roghainn mu dheireadh faodaidh tu cÚl-taic a ghabhail agus a luchdachadh suas gu MySQL airson faighinn seachad air.
Airson cÚisean nas adhartaiche, tha comas togte aig ClickHouse dealbh de phà irtean a chruthachadh san t-siostam faidhle ionadail. Tha am feart seo ri fhaighinn mar iarrtas atharraich sgaradh reothadh clà r. No gu sÏmplidh atharraich reothadh clà r - seo dealbh den chlà r gu lèir.
Thèid an dealbh a chruthachadh gu cunbhalach airson aon bhòrd air aon shard, is e sin, tha e do-dhèanta dealbh cunbhalach a chruthachadh den bhuidheann gu lèir san dòigh seo. Ach airson a 'mhòr-chuid de ghnĂŹomhan chan eil feum air a leithid, agus tha e gu leòr iarrtas a chuir an gnĂŹomh air gach shard agus dealbh cunbhalach fhaighinn. Tha e air a chruthachadh ann an cruth cruaidh-cheanglaichean agus mar sin chan eil e a 'gabhail Ă ite a bharrachd. An uairsin, bidh thu aâ dèanamh lethbhreac den dealbh seo chun t-seirbheisiche cĂšl-taic no chun stòradh a chleachdas tu airson cĂšl-taic.
Tha e gu math furasta a leithid de chĂšl-taic ath-nuadhachadh. An toiseach, cruthaich clĂ ran a 'cleachdadh mĂŹneachaidhean bĂšird a th' ann mar-thĂ . An uairsin, dèan lethbhreac de na dealbhan a chaidh a shĂ bhaladh de na pĂ irtean gu Directory-Detached airson na clĂ ran seo agus ruith aâ cheist ceangail sgaradh. Tha am fuasgladh seo gu math freagarrach airson na meudan dĂ ta as miosa.
Aig amannan feumaidh tu rudeigin eadhon nas fhuaire - ann an cÚisean far a bheil deichean no eadhon ceudan de terabytes air gach frithealaiche agus ceudan de luchd-frithealaidh. Tha fuasgladh an seo a thog mi bho mo cho-obraichean bho Yandex.Metrica. Cha bhithinn ga mholadh don h-uile duine - leugh e agus co-dhÚin dhut fhèin a bheil e freagarrach no nach eil.
An toiseach, feumaidh tu grunn fhrithealaichean a chruthachadh le sgeilpichean diosc mòra. An uairsin, air na frithealaichean sin, stèidhich grunn fhrithealaichean ClickHouse agus rèitich iad gus a bhith nan leth-bhreac eile airson na h-aon shards. An uairsin, cleachd siostam faidhle no inneal air choreigin air na frithealaichean sin a leigeas leat dealbhan-sgrĂŹn a chruthachadh. Tha dĂ roghainn an seo. Is e aâ chiad roghainn dealbhan-sgrĂŹn LVM, is e an dĂ rna roghainn ZFS air Linux.
Ăs deidh sin, a h-uile latha feumaidh tu dealbh a chruthachadh, bidh e na laighe agus gabhaidh e beagan Ă ite. Gu nĂ darra, ma dh'atharraicheas an dĂ ta, meudaichidh an ĂŹre de rĂšm thar Ăšine. Faodar an dealbh seo a thoirt a-mach aig Ă m sam bith agus an dĂ ta ath-nuadhachadh, fuasgladh cho neònach. A bharrachd air an sin, feumaidh sinn cuideachd na mac-samhail sin a chuingealachadh anns an config gus nach feuch iad ri bhith nan stiĂširichean.
Am bi e comasach dà il fo smachd de mhac-samhail a chuir air dòigh anns na claisean?
Am-bliadhna tha thu an dÚil shailean a dhèanamh ann an ClickHouse. Am bi e comasach dà il fo smachd de mhac-samhail a chuir air dòigh annta? Bu mhath leinn a chleachdadh gus sinn fhèin a dhÏon bho shuidheachaidhean à icheil le atharraichean agus atharrachaidhean eile.
A bheil e comasach seòrsa de roiligeadh air ais a dhèanamh airson atharraichean? Mar eisimpleir, ann an cas a tha ann mar-thĂ , gabh agus abair gun cuir thu na h-atharrachaidhean an sĂ s gus an Ă m seo, agus bhon mhionaid seo nach stad thu aâ cur an gnĂŹomh na h-atharrachaidhean?
Ma thĂ inig Ă ithne chun bhuidheann againn agus gun do bhris sinn e, tha mac-samhail cumhach againn le dĂ il uair a thĂŹde, far an urrainn dhuinn a rĂ dh gun cleachd sinn e an-drĂ sta, ach nach cuir sinn atharrachaidhean an sĂ s ann airson na deich mionaidean mu dheireadh?
An toiseach, mu dheidhinn lag fo smachd mac-samhail. Bha iarrtas mar seo ann bho luchd-cleachdaidh, agus chruthaich sinn cĂšis air Github leis an iarrtas: âMa tha feum aig cuideigin air seo, mar e, cuir cridhe.â Cha do lĂŹbhrig duine, agus chaidh aâ chĂšis a dhĂšnadh. Ach, gheibh thu an cothrom seo mu thrĂ th le bhith aâ stèidheachadh ClickHouse. FĂŹor, dĂŹreach a âtòiseachadh bho dhreach 20.3.
Bidh ClickHouse an-còmhnaidh aâ coileanadh dĂ ta aâ tighinn còmhla air aâ chĂšl. Nuair a bhios aonadh deiseil, thèid pĂŹos nas motha a chuir na Ă ite seata sònraichte de phĂŹosan dĂ ta. Aig an aon Ă m, bidh pĂŹosan dĂ ta a bha ann roimhe aâ fuireach air an diosc airson Ăšine.
An toiseach, bidh iad fhathast gan stòradh fhad âs a tha ceistean taghte ann a bhios gan cleachdadh, gus obrachadh gun bhacadh a thoirt seachad. Tha ceistean taghte furasta an leughadh bho sheann pĂŹosan.
San dĂ rna Ă ite, tha stairsneach Ăšine ann cuideachd - bidh seann phĂŹosan dĂ ta aâ laighe air an diosc airson ochd mionaidean. Faodar na h-ochd mionaidean sin a ghnĂ thachadh agus eadhon tionndadh gu aon latha. Cosgaidh seo Ă ite diosc: a rèir an t-sruth dĂ ta, tha e a âtionndadh a-mach nach bi san latha mu dheireadh aâ dĂšblachadh an dĂ ta a-mhĂ in, gum faodadh e a bhith còig tursan nas motha. Ach ma tha fĂŹor dhuilgheadas ann, faodaidh tu stad a chuir air frithealaiche ClickHouse agus a h-uile cĂ il a rèiteach.
A-nis tha ceist ag èirigh a thaobh mar a dhĂŹonas seo an aghaidh atharraichean. Is fhiach sĂšil nas doimhne a thoirt an seo, oir ann an dreachan nas sine de ClickHouse, dhâ obraich an t-atharrachadh ann an dòigh is gun do dhâ atharraich e pĂŹosan gu dĂŹreach. Tha pĂŹos dĂ ta ann le cuid de fhaidhlichean, agus bidh sinn, mar eisimpleir, atharraich an colbh tuiteam. An uairsin thèid an colbh seo a thoirt air falbh gu corporra bho gach cnap.
Ach aâ tòiseachadh le dreach 20.3, tha an uidheamachd atharrachaidh air atharrachadh gu tur, agus a-nis tha pĂŹosan dĂ ta an-còmhnaidh neo-sheasmhach. Chan eil iad ag atharrachadh idir - tha atharraichean a-nis ag obair anns an aon dòigh ri aonaidhean. An Ă ite pĂŹos Ăšr a chur na Ă ite, cruthaichidh sinn fear Ăšr. Anns aâ phĂŹos Ăšr, bidh faidhlichean nach do dhâatharraich gu bhith nan ceanglaichean cruaidh, agus ma sguabas sinn Ă s colbh, bidh e dĂŹreach a dhĂŹth anns aâ phĂŹos Ăšr. Thèid an seann phĂŹos a dhubhadh Ă s gu bunaiteach Ă s deidh ochd mionaidean, agus an seo faodaidh tu na roghainnean gu h-Ă rd tweak.
Tha an aon rud aâ buntainn ri atharraichean leithid mĂšthaidhean. Nuair a nĂŹ thu atharraich sguabadh Ă s no atharraich Ăšrachadh, chan eil e ag atharrachadh a 'phĂŹos, ach a' cruthachadh fear Ăšr. Agus an uairsin cuir Ă s don t-seann fhear.
Dè ma tha structar aâ bhĂšird air atharrachadh?
Ciamar as urrainn dhomh cĂšl-taic a chaidh a dhèanamh leis an t-seann sgeama a thoirt air ais? Agus tha an dĂ rna ceist mu dheidhinn aâ chĂšis le dealbhan-sgrĂŹn agus goireasan siostam faidhle. A bheil Btrfs freagarrach an seo an Ă ite ZFS? Linux LVM?
Ma nĂŹ thu ceangail sgaradh sgaraidhean le structar eadar-dhealaichte, an uairsin innsidh ClickHouse dhut nach eil seo comasach. Is e seo am fuasgladh. Is e aâ chiad fhear clĂ r sealach den t-seòrsa MergeTree a chruthachadh leis an t-seann structar, dĂ ta a cheangal an sin le bhith aâ cleachdadh ceangail, agus ceist eile a dhèanamh. An uairsin faodaidh tu an dĂ ta seo a chopaigeadh no a ghluasad agus a cheangal a-rithist, no iarrtas a chleachdadh atharraich clĂ r gluasad gluasad.
A-nis is i an dĂ rna ceist an gabh Btrfs a chleachdadh. An toiseach, ma tha LVM agad, tha dealbhan LVM gu leòr, agus faodaidh an siostam faidhle a bhith ext4, chan eil e gu diofar. Le Btrts, tha a h-uile dad an urra ris an eòlas agad air a chleachdadh. Is e siostam faidhle aibidh a tha seo, ach tha amharas ann fhathast mu mar a dhâ obraicheas a h-uile cĂ il ann an cleachdadh ann an suidheachadh sònraichte. Cha bhithinn aâ moladh seo a chleachdadh mura h-eil Btrfs agad ann an cinneasachadh.
Dè na cleachdaidhean as fheĂ rr a thâ ann an-drĂ sta ann an ath-chraoladh dĂ ta?
Tha cÚis ath-chà radh iom-fhillte agus ioma-thaobhach. Tha grunn fhreagairtean comasach an seo. Faodaidh tu a dhol bho aon taobh agus seo a rà dh - chan eil feart ath-chuiridh togte aig ClickHouse. Ach tha eagal orm nach bi am freagairt seo freagarrach do dhuine sam bith. Mar sin, faodaidh tu a dhol bhon taobh eile agus a rà dh gu bheil iomadh dòigh aig ClickHouse airson dà ta ath-cheannach.
Ma ruitheas aâ bhuidheann a-mach Ă rĂšm no mura urrainn dha an luchd a lĂ imhseachadh, cuiridh tu frithealaichean Ăšra ris. Ach tha na frithealaichean sin falamh gu bunaiteach, chan eil dĂ ta ann orra, chan eil luchd ann. Feumaidh tu an dĂ ta ath-rèiteachadh gus am bi e air a sgaoileadh gu cothromach thairis air aâ bhuidheann Ăšr, nas motha.
Is e aâ chiad dòigh air seo a dhèanamh a bhith aâ dèanamh lethbhreac de phĂ irt de na h-earrainnean gu frithealaichean Ăšra aâ cleachdadh iarrtas atharraich an clĂ r airson sgaradh. Mar eisimpleir, bha sgaraidhean agad gach mĂŹos, agus bheir thu aâ chiad mhĂŹos de 2017 agus dèan lethbhreac dheth gu frithealaiche Ăšr, agus an uairsin dèan lethbhreac den treas mĂŹos gu frithealaiche Ăšr eile. Agus nĂŹ thu seo gus an tig e gu ĂŹre mhòr no nas lugha.
Chan urrainnear tar-chuir a dhèanamh ach airson na pĂ irtean sin nach atharraich aig Ă m clĂ raidh. Airson sgaraidhean Ăšra, feumar clĂ radh a chuir Ă comas, leis nach eil an gluasad aca atamach. Rud eile, bidh dĂšblaidhean no beĂ rnan san dĂ ta agad. Ach, tha an dòigh seo practaigeach agus ag obair gu math èifeachdach. Bithear aâ gluasad pĂŹosan teannachaidh deiseil thairis air an lĂŹonra, is e sin, chan eil an dĂ ta air a dhlĂšthadh no air ath-chòdachadh.
Tha aon eas-bhuannachd aig an dòigh seo, agus tha e an urra ris an sgeama sharding, co-dhiĂš an do gheall thu don sgeama sharding seo, dè an iuchair sharding a bhâ agad. Anns an eisimpleir agad airson aâ chĂšis le meatrach, is e an iuchair sharding hash na slighe. Nuair a thaghas tu clĂ r air a chuairteachadh, thèid e chun a h-uile shards sa bhuidheann aig an aon Ă m agus bheir e dĂ ta Ă s an sin.
Tha seo aâ ciallachadh nach eil e gu diofar dhut dè an dĂ ta a thĂ inig gu crĂŹch air dè an shard. Is e am prĂŹomh rud gu bheil dĂ ta air aon shlighe aâ tighinn gu crĂŹch air aon shard, ach dè am fear nach eil cudromach. Anns a 'chĂšis seo, tha e foirfe a bhith a' gluasad pĂŹosan deiseil, oir le ceistean taghte gheibh thu cuideachd dĂ ta iomlan - ge bith an ann mus tèid thu air ais no Ă s deidh sin, chan eil an sgeama gu diofar.
Ach tha cĂšisean ann a tha nas iom-fhillte. Ma tha thu aig ĂŹre loidsig an tagraidh gu bheil thu an urra ri sgeama sharding sònraichte, gu bheil an neach-dèiligidh seo suidhichte air a leithid de shard, agus faodar an t-iarrtas a chuir gu dĂŹreach an sin, agus chan ann chun chlĂ r air a chuairteachadh. No tha thu aâ cleachdadh dreach an ĂŹre mhath o chionn ghoirid de ClickHouse agus tha thu air an suidheachadh a chomasachadh leasaich sgiob shards nach deach a chleachdadh. Anns a 'chĂšis seo, rè a' cheist taghte, thèid an abairt anns an roinn far a bheilear a 'sgrĂšdadh agus thèid a thomhas dè na slatan a dh'fheumar a chleachdadh a rèir an sgeama sharding. Bidh seo ag obair fhad âs a tha an dĂ ta air a sgaradh gu dĂŹreach a rèir an sgeama sgaraidh seo. Ma dhâ atharraich thu iad le lĂ imh, dhâ fhaodadh gun atharraich an conaltradh.
Mar sin is e seo dòigh Ă ireamh a h-aon. Agus tha mi aâ feitheamh ri do fhreagairt, ge bith a bheil an dòigh freagarrach, no gluaisidh sinn air adhart.
Vladimir Kolobaev, prĂŹomh rianadair siostam ann an Avito: Alexey, chan eil an dòigh air an tug thu iomradh ag obair glè mhath nuair a dhâ fheumas tu an luchd a sgaoileadh, aâ toirt a-steach leughadh. Faodaidh sinn sgaradh a tha mĂŹosail agus is urrainn dhuinn aâ mhĂŹos roimhe a thoirt gu nĂłd eile, ach nuair a thig iarrtas airson an dĂ ta seo, cha luchdaich sinn ach e. Ach bu mhath leinn an cruinneachadh gu lèir a luchdachadh, oir air dhòigh eile, airson Ăšine bidh an luchd leughaidh gu lèir air a phròiseasadh le dĂ shard.
Alexei Milovidov: Tha am freagairt an seo neònach - tha, tha e dona, ach is dòcha gun obraich e. MĂŹnichidh mi gu dĂŹreach ciamar. Is fhiach coimhead air an t-suidheachadh luchdan a tha air cĂšl an dĂ ta agad. Mas e dĂ ta sgrĂšdaidh a tha seo, is urrainn dhuinn cha mhòr cinnteach a rĂ dh gu bheil aâ mhòr-chuid de dhâiarrtasan airson dĂ ta Ăšr.
Chuir thu a-steach frithealaichean Ăšra, rinn thu imrich air seann phĂ irtean, ach dhâ atharraich thu cuideachd mar a tha dĂ ta Ăšr air a chlĂ radh. Agus thèid dĂ ta Ăšr a sgaoileadh air feadh na buidhne. Mar sin, Ă s deidh dĂŹreach còig mionaidean, bidh iarrtasan airson na còig mionaidean mu dheireadh a âluchdachadh aâ bhuidheann gu cothromach; Ă s deidh latha, bidh iarrtasan airson XNUMX uair a âluchdachadh aâ bhuidheann gu cothromach. Agus cha tèid iarrtasan airson na mĂŹos roimhe, gu mĂŹ-fhortanach, ach gu pĂ irt de na frithealaichean brabhsair.
Ach gu tric cha bhi iarrtasan sònraichte agad airson Gearran 2019. Nas coltaiche, ma thèid iarrtasan a-steach gu 2019, bidh iad airson 2019 gu lèir - airson Ăšine mhòr, agus chan ann airson cuid de raon beag. Agus bidh e comasach dha na h-iarrtasan sin an cruinneachadh a luchdachadh gu cothromach. Ach san fharsaingeachd, tha do bheachd gu tur ceart gur e fuasgladh ad hoc a tha seo nach eil aâ sgaoileadh an dĂ ta gu tur cothromach.
Tha beagan phuingean a bharrachd agam airson aâ cheist a fhreagairt. Tha aon dhiubh mu dheidhinn mar a dhealbhaicheas tu sgeama sharding an toiseach gus nach adhbhraicheadh ââath-sharradh nas lugha de phian. Chan eil seo an-còmhnaidh comasach.
Mar eisimpleir, tha dĂ ta sgrĂšdaidh agad. Tha dĂ ta sgrĂšdaidh aâ fĂ s airson trĂŹ adhbharan. Is e aâ chiad fhear cruinneachadh dĂ ta eachdraidheil. Is e an dĂ rna fear fĂ s trafaic. Agus is e an treas fear Ă rdachadh anns an Ă ireamh de rudan a tha fo smachd. Tha meanbh-sheirbheisean Ăšra agus meatrach ann a dhâ fheumar a shĂ bhaladh.
Dh'fhaodadh gur ann dhiubh sin a tha an à rdachadh as motha co-cheangailte ris an treas adhbhar - an à rdachadh ann an cleachdadh sgrÚdaidh. Agus anns a 'chÚis seo, is fhiach coimhead air nà dar an luchd, dè na prÏomh cheistean a th' ann. Tha e coltach gum bi ceistean taghte bunaiteach stèidhichte air cuid de fho-sheata de mheatairean.
Mar eisimpleir, cleachdadh CPU air cuid de luchd-frithealaidh le cuid de sheirbheis. Tha e a 'tionndadh a-mach gu bheil sònraichte fo-sheata de iuchraichean leis a bheil thu a' faighinn an dà ta seo. Agus tha e coltach gu bheil an t-iarrtas fhèin airson an dà ta seo gu math sÏmplidh agus air a chrÏochnachadh ann an deichean milliseconds. Air a chleachdadh airson seirbheisean sgrÚdaidh agus deas-bhòrd. Tha mi an dòchas gun tuig mi seo gu ceart.
Vladimir Kolobaev: Is e an fhĂŹrinn gu bheil sinn gu math tric ag ath-thagradh gu dĂ ta eachdraidheil, leis gu bheil sinn aâ dèanamh coimeas eadar an suidheachadh lĂ ithreach agus an suidheachadh eachdraidheil ann an Ă m fĂŹor. Agus tha e cudromach gum bi cothrom luath againn air tòrr dĂ ta, agus tha ClickHouse aâ dèanamh obair ionmholta le seo.
Tha thu ceart gu leòr, tha sinn aâ faighinn eòlas air aâ mhòr-chuid de na h-iarrtasan a chaidh a leughadh air an latha mu dheireadh, mar shiostam sgrĂšdaidh sam bith. Ach aig an aon Ă m, tha an luchd air dĂ ta eachdraidheil cuideachd gu math mòr. Tha e gu bunaiteach bho shiostam rabhaidh a bhios aâ dol timcheall a h-uile trithead diog agus ag rĂ dh ri ClickHouse: âThoir dhomh an dĂ ta airson na sia seachdainean a dhâ fhalbh. A-nis tog dhomh seòrsa de chuibheasachd gluasadach bhuapa, agus dèanamaid coimeas eadar an luach lĂ ithreach agus an luach eachdraidheil."
Bu mhath leam a rĂ dh gu bheil clĂ r beag eile againn airson iarrtasan cho o chionn ghoirid anns nach bi sinn aâ stòradh ach dĂ latha de dhĂ ta, agus tha na prĂŹomh iarrtasan aâ dol a-steach ann. Cha bhith sinn aâ cur ach ceistean mòra eachdraidheil chun bhòrd mhòr shnĂŹomhte.
Alexei Milovidov: Gu mĂŹ-fhortanach, tha e coltach gu bheil e gu math iomchaidh airson do shuidheachadh, ach innsidh mi dhut tuairisgeul air dĂ sgeama bearraidh dona agus iom-fhillte nach fheumar a chleachdadh, ach a tha gan cleachdadh ann an seirbheis mo charaidean.
Tha prĂŹomh bhuidheann còmhla ri tachartasan Yandex.Metrica. Is e tachartasan seallaidhean duilleag, cliogan, agus atharrachaidhean. Bidh aâ mhòr-chuid de dhâiarrtasan aâ dol gu lĂ rach-lĂŹn shònraichte. Bidh thu a 'fosgladh seirbheis Yandex.Metrica, tha lĂ rach-lĂŹn agad - avito.ru, rachaibh chun na h-aithisg, agus thèid iarrtas a dhèanamh airson do lĂ rach-lĂŹn.
Ach tha iarrtasan eile ann - mion-sgrĂšdaidh agus cruinneil - a tha luchd-anailis a-staigh aâ dèanamh. DĂŹreach gun fhios, tha mi a 'toirt fa-near gu bheil sgrĂšdairean taobh a-staigh a' dèanamh iarrtasan a-mhĂ in airson seirbheisean Yandex. Ach a dh'aindeoin sin, tha eadhon seirbheisean Yandex a 'gabhail pĂ irt mhòr den dĂ ta gu lèir. Is e iarrtasan a tha seo chan ann airson cunntairean sònraichte, ach airson sĂŹoladh nas fharsainge.
Ciamar a chuireas tu dĂ ta air dòigh ann an dòigh is gum bi a h-uile cĂ il ag obair gu h-èifeachdach airson aon chunntair, agus ceistean cruinneil cuideachd? Is e duilgheadas eile a thâ ann gu bheil an Ă ireamh de dhâiarrtasan ann an ClickHouse airson aâ bhuidheann Metrics grunn mhĂŹltean san diog. Aig an aon Ă m, chan urrainn dha aon fhrithealaiche ClickHouse iarrtasan neo-bheag a lĂ imhseachadh, mar eisimpleir, grunn mhĂŹltean san diog.
Is e meud na brabhsair sia ceud neach-frithealaidh rudeigin. Ma tharraingeas tu dĂŹreach clĂ r air a chuairteachadh thairis air aâ bhuidheann seo agus gun cuir thu grunn mhĂŹltean iarrtas ann, fĂ saidh e eadhon nas miosa na bhith gan cur gu aon fhrithealaiche. Air an lĂ imh eile, tha an roghainn gum bi an dĂ ta air a sgaoileadh gu cothromach, agus bidh sinn a âdol agus ag iarraidh bho gach frithealaiche, air a chuir Ă s sa bhad.
Tha roghainn ann a tha diametrically mu choinneamh. Smaoinich ma bhios sinn aâ roinneadh an dĂ ta thairis air lĂ raich, agus ma thèid iarrtas airson aon lĂ rach gu aon shard. A-nis bidh e comasach don bhuidheann deich mĂŹle iarrtas gach diog a lĂ imhseachadh, ach air aon shard obraichidh aon iarrtas ro shlaodach. Cha bhith e aâ sgèile tuilleadh a thaobh trochur. Gu sònraichte mas e seo an lĂ rach avito.ru. Cha nochd mi an dĂŹomhair ma chanas mi gur e Avito aon de na lĂ raich as motha a thadhail air ann an RuNet. Agus bhiodh e na chuthach a bhith ga ghiollachd air aon shard.
Mar sin, tha an sgeama sharding air a dhealbhadh ann an dòigh nas seòlta. Tha an cruinneachadh gu lèir air a roinn ann an grunn bhuidhnean, ris an can sinn sreathan. Anns gach cruinneachadh tha bho dhusan gu grunn dhusan shard. Tha trithead âs a naoi buidhnean mar sin ann uile gu lèir.
Ciamar a tha seo uile aâ tomhas? Chan eil an Ă ireamh de chlĂ ran ag atharrachadh - mar a bha e trithead âs a naoi o chionn beagan bhliadhnaichean, tha e fhathast mar sin. Ach taobh a-staigh gach aon dhiubh, bidh sinn ag Ă rdachadh an Ă ireamh de shards mean air mhean mar a bhios sinn aâ cruinneachadh dĂ ta. Agus tha an sgeama sharding gu h-iomlan mar seo: tha na cruinneachaidhean sin air an roinn ann an lĂ raich-lĂŹn, agus gus tuigse fhaighinn air dè an lĂ rach-lĂŹn air a bheil buidheann, thathas aâ cleachdadh meata-dĂ ta fa leth ann am MySQL. Aon lĂ rach - air aon bhuidheann. Agus na bhroinn, bidh roinneadh aâ tachairt a rèir IDan luchd-tadhail.
Nuair a bhios sinn aâ clĂ radh, bidh sinn gan roinn leis aâ chòrr de roinn ID an neach-tadhail. Ach nuair a thathar aâ cur shard Ăšr ris, bidh an sgeama sharding ag atharrachadh; tha sinn aâ leantainn air adhart aâ sgoltadh, ach leis aâ chòrr den roinneadh le Ă ireamh eile. Tha seo aâ ciallachadh gu bheil aon neach-tadhail air grunn luchd-frithealaidh mu thrĂ th, agus chan urrainn dhut a bhith an urra ri seo. Tha seo air a dhèanamh a-mhĂ in gus dèanamh cinnteach gu bheil an dĂ ta air a dhlĂšthadh nas fheĂ rr. Agus nuair a bhios sinn aâ dèanamh iarrtasan, thèid sinn chun chlĂ r Distributed, a bhios aâ coimhead air aâ bhuidheann agus aâ faighinn cothrom air dusanan de luchd-frithealaidh. Is e sgeama cho gòrach a tha seo.
Ach bidh mo sgeul neo-choileanta mura h-eil mi ag rĂ dh gun do thrèig sinn an sgeama seo. Anns an sgeama Ăšr, dhâatharraich sinn a h-uile cĂ il agus rinn sinn leth-bhreac den dĂ ta gu lèir aâ cleachdadh clickhouse-copier.
Anns an sgeama Ăšr, tha a h-uile lĂ rach air a roinn ann an dĂ roinn - mòr agus beag. Chan eil fios agam ciamar a chaidh an stairsneach a thaghadh, ach bâ e an toradh gu bheil lĂ raichean mòra air an clĂ radh air aon bhuidheann, far a bheil 120 shards le trĂŹ mac-samhail gach fear - is e sin, 360 frithealaichean. Agus tha an sgeama sharding cho mòr is gum bi iarrtas sam bith aâ dol chun a h-uile shards aig an aon Ă m. Ma dh'fhosglas tu a-nis duilleag aithisg sam bith airson avito.ru ann an Yandex.Metrica, thèid an t-iarrtas gu 120 frithealaiche. Chan eil mòran lĂ raich mòra ann an RuNet. Agus chan eil na h-iarrtasan mĂŹle san diog, ach eadhon nas lugha na ceud. Tha seo uile air a chuairteachadh gu sĂ mhach leis aâ bhòrd Distributed, a bhios gach fear dhiubh aâ pròiseasadh le 120 frithealaiche.
Agus tha an dĂ rna buidheann airson lĂ raich beaga. Seo sgeama sharding stèidhichte air ID na lĂ raich, agus tha gach iarrtas aâ dol gu dĂŹreach aon shard.
Tha goireas clickhouse-copier aig ClickHouse. An urrainn dhut innse dhuinn mu deidhinn?
Canaidh mi sa bhad gu bheil am fuasgladh seo nas duilghe agus beagan nas cinneasaiche. Is e aâ bhuannachd a th âann gu bheil e aâ smeuradh an dĂ ta gu tur a rèir a âphĂ train a shònraicheas tu. Ach is e ana-cothrom aâ ghoireas nach eil e ag ath-neartachadh idir. Bidh e aâ dèanamh lethbhreac de dhĂ ta bho aon sgeama brabhsair gu sgeama cnuasachaidh eile.
Tha seo aâ ciallachadh gum feum dĂ bhuidheann a bhith agad airson gun obraich e. Faodaidh iad a bhith air an suidheachadh air na h-aon luchd-frithealaidh, ach, a dh'aindeoin sin, cha tèid an dĂ ta a ghluasad mean air mhean, ach thèid lethbhreac a dhèanamh dheth.
Mar eisimpleir, bha ceithir frithealaichean ann, a-nis tha ochdnar ann. Bidh thu aâ cruthachadh clĂ r Ăšr Sgaoilte air a h-uile seirbheisiche, bĂšird ionadail Ăšra agus aâ cur air bhog clickhouse-copier, aâ nochdadh ann an sgeama obrach a bu chòir dha leughadh Ă s an sin, gabhail ris an sgeama sharding Ăšr agus an dĂ ta a ghluasad an sin. Agus air seann luchd-frithealaidh feumaidh tu uair gu leth barrachd Ă ite na tha ann an-drĂ sta, oir feumaidh an seann dĂ ta fuireach orra, agus thig leth den aon seann dĂ ta air am mullach. Ma bha thu a 'smaoineachadh ro-lĂ imh gum feumar an dĂ ta ath-chĂ radh agus gu bheil Ă ite ann, tha an dòigh seo freagarrach.
Ciamar a tha clickhouse-copier ag obair a-staigh? Bidh e a 'briseadh a h-uile obair ann an seata de ghnÏomhan airson a bhith a' giullachd aon phà irt de aon bhòrd air aon shard. Faodar na gnÏomhan sin uile a chuir an gnÏomh aig an aon à m, agus faodar clickhouse-copier a ruith air diofar innealan ann an grunn shuidheachaidhean, ach chan eil na nÏ e airson aon sgaradh nas motha na cuir a-steach taghte. Tha an dà ta air a leughadh, air a dhÏ-dhÚmhlachadh, air a thoirt air ais, an uairsin air a dhlÚthadh a-rithist, air a sgrÏobhadh an à iteigin, agus air ath-sheòrsachadh. Is e co-dhÚnadh nas cruaidhe a tha seo.
Bha rud pÏleat agad ris an canar resharding. Dè leatha?
Air ais ann an 2017, bha rud pÏleat agad ris an canar resharding. Tha eadhon roghainn ann an ClickHouse. Mar a tha mi ga thuigsinn, cha do dh'èirich e. An innis thu dhomh carson a thachair seo? Tha e coltach gu bheil e gu math buntainneach.
Is e an duilgheadas gu lèir ma tha feum air dà ta ath-nuadhachadh na à ite, tha feum air sioncronadh gu math toinnte gus seo a dhèanamh gu atamach. Nuair a thòisich sinn a 'coimhead air mar a tha an sioncronadh seo ag obair, dh'fhàs e soilleir gu robh duilgheadasan bunaiteach ann. Agus tha na duilgheadasan bunaiteach sin chan ann a-mhà in teòiridheach, ach sa bhad thòisich iad gan sealltainn fhèin ann an cleachdadh ann an cruth rudeigin a dh'fhaodar a mhÏneachadh gu sÏmplidh - chan eil dad ag obair.
A bheil e comasach a h-uile pÏos dà ta a chur còmhla mus gluais thu gu diosgan slaodach?
Ceist mu TTL leis aâ ghluasad gu roghainn diosc slaodach ann an co-theacs aonaidhean. A bheil dòigh ann, ach a-mhĂ in tro cron, na pĂ irtean gu lèir a chur còmhla ann an aon mus gluais iad gu diosgan slaodach?
Is e am freagairt don cheist gu bheil e comasach dòigh air choireigin na pĂŹosan gu lèir a ghleusadh ann an aon mus gluais iad - chan eil. Chan eil mi aâ smaoineachadh gu bheil seo riatanach. Chan fheum thu na pĂ irtean gu lèir a chur còmhla ann an aon, ach dĂŹreach cunntadh air an fhĂŹrinn gun tèid an gluasad gu diosgan slaodach gu fèin-ghluasadach.
Tha dĂ shlat-tomhais againn airson riaghailtean gluasaid. Tha a 'chiad fhear mar a tha e air a lĂŹonadh. Ma tha nas lugha na ceudad sònraichte de rĂšm an-asgaidh aig an t-sreath stòraidh gnĂ thach, bidh sinn aâ taghadh aon phĂŹos agus ga ghluasad gu stòradh nas slaodaiche. No an Ă ite, chan ann nas slaodaiche, ach an ath fhear - mar a bhios tu a 'rèiteachadh.
Is e an dà rna slat-tomhais meud. Tha e mu dheidhinn pÏosan mòra a ghluasad. Faodaidh tu an stairsneach atharrachadh a rèir an à ite an-asgaidh air an diosc luath, agus thèid an dà ta a ghluasad gu fèin-ghluasadach.
Mar a nÏ thu imrich gu dreachan Úra de ClickHouse mura h-eil dòigh ann sgrÚdadh a dhèanamh air co-chòrdalachd ro-là imh?
Bithear aâ bruidhinn air aâ chuspair seo gu cunbhalach a 'toirt aire do dhreachan eadar-dhealaichte, agus fhathast. Dè cho sĂ bhailte âs a tha e Ăšrachadh bho dhreach 19.11 gu 19.16 agus, mar eisimpleir, bho 19.16 gu 20.3. Dè an dòigh as fheĂ rr air gluasad gu dreachan Ăšra gun a bhith comasach air sgrĂšdadh a dhèanamh air co-chòrdalachd sa bhogsa gainmhich ro-lĂ imh?
Tha grunn riaghailtean âòirâ an seo. Aâ chiad - . Tha e mòr, ach tha paragrafan fa leth ann mu atharrachaidhean air ais nach eil iomchaidh. Na cleachd na puingean sin mar bhratach dhearg. Mar as trice is e neo-fhreagarrachd beaga a tha seo a tha aâ toirt a-steach cuid de ghnĂŹomhachd iomaill nach bi thu aâ cleachdadh.
San dĂ rna h-Ă ite, mura h-eil dòigh ann sgrĂšdadh a dhèanamh air co-chòrdalachd sa bhogsa gainmhich, agus gu bheil thu airson Ăšrachadh sa bhad ann an cinneasachadh, is e am moladh nach fheum thu seo a dhèanamh. An toiseach cruthaich bogsa gainmhich agus deuchainn. Mura h-eil Ă rainneachd deuchainn ann, tha e glè choltach nach eil companaidh glè mhòr agad, a tha a âciallachadh gun urrainn dhut cuid den dĂ ta a chopaigeadh chun laptop agad agus dèanamh cinnteach gu bheil a h-uile dad ag obair gu ceart air. Faodaidh tu eadhon grunn mac-samhail a thogail gu h-ionadail air an inneal agad. No faodaidh tu dreach Ăšr a thogail am badeigin faisg air lĂ imh agus cuid den dĂ ta a luchdachadh suas an sin - is e sin, cruthaich Ă rainneachd deuchainn gun ullachadh.
Is e riaghailt eile gun a bhith ag Úrachadh airson seachdain às deidh an dreach a leigeil ma sgaoil air sgà th bhiteagan glacaidh ann an cinneasachadh agus fuasglaidhean sgiobalta às deidh sin. Feuch an obraich sinn a-mach an à ireamh de dhreachan ClickHouse gus nach bi sinn troimh-chèile.
Tha dreach 20.3.4 ann. Tha an Ă ireamh 20 a 'comharrachadh a' bhliadhna saothrachaidh - 2020. Bho shealladh na tha a-staigh, chan eil seo gu diofar, agus mar sin cha toir sinn aire dha. Air adhart - 20.3. Bidh sinn ag Ă rdachadh an dĂ rna Ă ireamh - sa chĂšis seo 3 - a h-uile uair a chuireas sinn a-mach brath le comas-gnĂŹomh Ăšr. Ma tha sinn airson feart a chuir ri ClickHouse, feumaidh sinn an Ă ireamh seo Ă rdachadh. Is e sin, ann an dreach 20.4 obraichidh ClickHouse eadhon nas fheĂ rr. Is e an treas figear 20.3.4. Seo 4 an Ă ireamh de sgaoilidhean paiste anns nach do chuir sinn feartan Ăšra ris, ach shuidhich sinn cuid de bhiteagan. Agus tha 4 aâ ciallachadh gun do rinn sinn e ceithir tursan.
Na bi aâ smaoineachadh gur e rud uamhasach a tha seo. Mar as trice faodaidh an neach-cleachdaidh an dreach as Ăšire a stĂ ladh agus obraichidh e gun duilgheadas sam bith le uptime gach bliadhna. Ach smaoinich, ann an gnĂŹomh air choreigin airson a bhith aâ giullachd bitmaps, a chaidh a chuir ris le ar com-pĂ irtichean SĂŹneach, gu bheil am frithealaiche aâ bualadh nuair a thèid thu seachad air argamaidean ceĂ rr. Tha dleastanas oirnn seo a cheartachadh. Cuiridh sinn a-mach dreach paiste Ăšr agus fĂ saidh ClickHouse nas seasmhaiche.
Ma tha ClickHouse agad aâ ruith ann an cinneasachadh, agus dreach Ăšr de ClickHouse aâ tighinn a-mach le feartan a bharrachd - mar eisimpleir, is e 20.4.1 aâ chiad fhear, na dèan cabhag gus a chuir gu cinneasachadh air aâ chiad latha. Carson a tha feum air eadhon? Mura h-eil thu aâ cleachdadh ClickHouse mu thrĂ th, faodaidh tu a stĂ ladh, agus is coltaiche gum bi a h-uile dad ceart gu leòr. Ach ma tha ClickHouse ag obair gu seasmhach mu thrĂ th, cĂšm sĂšil air badan is Ăšrachaidhean gus faicinn dè na duilgheadasan a tha sinn aâ rèiteachadh.
Kirill Shvakov: Bu mhath leam beagan a chuir ris mu à rainneachdan deuchainn. Tha eagal mòr air a h-uile duine mu à rainneachdan deuchainn agus airson adhbhar air choireigin tha iad den bheachd ma tha cruinneachadh mòr ClickHouse agad, nach bu chòir an à rainneachd deuchainn a bhith nas lugha no co-dhiÚ deich tursan nas lugha. Chan ann mar sin a tha e idir.
Is urrainn dhomh innse dhut bhon eisimpleir agam fhÏn. Tha pròiseact agam, agus tha ClickHouse ann. Tha an à rainneachd deuchainn againn dÏreach dha - is e inneal beag brÏgheil a tha seo ann an Hetzner airson fichead iÚro, far a bheil a h-uile cà il air a chleachdadh. Gus seo a dhèanamh, tha là n fèin-ghluasad againn ann an Ansible, agus mar sin, ann am prionnsapal, chan eil e gu diofar cà ite an tèid e - gu frithealaichean bathar-cruaidh no dÏreach cleachdadh ann an innealan brÏgheil.
Dè ghabhas dèanamh? Bhiodh e math eisimpleir a thoirt seachad anns na sgrĂŹobhainnean ClickHouse air mar a chleachdas tu cruinneachadh beag nad dhachaigh fhèin - ann an Docker, ann an LXC, is dòcha cruthaich leabhar-cluiche Ansible, leis gu bheil diofar chleachdadh aig diofar dhaoine. NĂŹ seo mòran nas sĂŹmplidhe. Nuair a bheir thu agus a chleachdas tu brabhsair ann an còig mionaidean, tha e tòrr nas fhasa feuchainn ri rudeigin a dhèanamh a-mach. Tha seo tòrr nas goireasaiche, oir tha a bhith aâ putadh a-steach do dhreach cinneasachaidh nach do rinn thu deuchainn na rathad gu Ă ite sam bith. Uaireannan bidh e ag obair agus uaireannan chan eil e. Agus mar sin, tha dòchas airson soirbheachas dona.
Maxim Kotyakov, Ă rd-innleadair cĂšl-taic Avito: Cuiridh mi beagan a-steach mu Ă rainneachdan deuchainn bho shreath de dhuilgheadasan a tha mu choinneamh chompanaidhean mòra. Tha cruinneachadh lĂ n-ghabhail ClickHouse againn; a thaobh sgeamaichean dĂ ta agus suidheachaidhean, tha e na fhĂŹor leth-bhreac de na tha ann an riochdachadh. Tha an cruinneachadh seo air a chleachdadh ann an soithichean a tha gu math sgĂŹth le glè bheag de ghoireasan. Bidh sinn aâ sgrĂŹobhadh ceudad sònraichte den dĂ ta toraidh an sin, gu fortanach tha e comasach an sruth ann an Kafka ath-riochdachadh. Tha a h-uile dad air a shioncronachadh agus air a sgèileadh - an dĂ chuid a thaobh comas agus sruthadh, agus, ann an teòiridh, a h-uile cĂ il eile co-ionann, bu chòir dha a bhith ga ghiĂšlan fhèin mar chinneasachadh a thaobh meatrach. Thèid a h-uile dad a dhâ fhaodadh a bhith spreadhaidh a chuir a-steach don stand seo an toiseach agus fhĂ gail an sin airson grunn lĂ ithean gus am bi e deiseil. Ach gu nĂ darra, tha am fuasgladh seo daor, duilich agus tha cosgaisean taic neo-neoni ann.
Alexei Milovidov: Innsidh mi dhut cò ris a tha à rainneachd deuchainn ar caraidean bho Yandex.Metrica coltach. Bha frithealaichean 600-corr aig aon bhuidheann, bha 360 aig fear eile, agus tha an treas cuid agus grunn bhuidhnean ann. Is e an à rainneachd deuchainn airson aon dhiubh dÏreach dà shard le dà mhac-samhail anns gach fear. Carson dà shards? Gus nach bi thu nad aonar. Agus bu chòir mac-samhail a bhith ann cuideachd. DÏreach suim as Ïsle as urrainn dhut a phà igheadh.
Leigidh an à rainneachd deuchainn seo leat faighinn a-mach a bheil na ceistean agad ag obair agus a bheil dad mòr briste. Ach gu tric bidh duilgheadasan ag èirigh gu tur eadar-dhealaichte, nuair a bhios a h-uile cà il ag obair, ach tha cuid de dh'atharrachaidhean beaga anns an luchd.
Leig dhomh eisimpleir a thoirt dhut. Cho-dhÚin sinn dreach Úr de ClickHouse a chuir a-steach. Tha e air a phostadh air à rainneachd deuchainn, chaidh deuchainnean fèin-ghluasadach a chrÏochnachadh ann an Yandex.Metrica fhèin, a tha a 'dèanamh coimeas eadar dà ta air an t-seann dreach agus an tè Úr, a' ruith an loidhne-phÏoban gu lèir. Agus gu dearbh, deuchainnean uaine den CI againn. Mur eil, cha bhiodh sinn eadhon air an dreach seo a mholadh.
Tha a h-uile dad gu math. Tha sinn aâ tòiseachadh air gluasad gu cinneasachadh. Tha mi aâ faighinn teachdaireachd gu bheil an luchd air na grafaichean air a dhol suas grunn thursan. Tha sinn a 'toirt air ais an dreach. Bidh mi aâ coimhead air aâ ghraf agus aâ faicinn: chaidh an luchd Ă rdachadh grunn thursan rè an sgaoileadh, agus lughdaich e air ais nuair a chaidh an sgaoileadh a-mach. An uairsin thòisich sinn air an dreach a thoirt air ais. Agus mheudaich an luchd san aon dòigh agus thuit e air ais san aon dòigh. Mar sin is e seo an co-dhĂšnadh: tha an luchd air a dhol suas mar thoradh air an dealbhadh, gun dad iongantach.
An uairsin bha e duilich toirt a chreidsinn air co-obraichean an dreach Ăšr a chuir a-steach. Tha mi ag rĂ dh: âTha e ceart gu leòr, cuir a-mach. CĂšm do chorragan tarsainn, obraichidh a h-uile dad. A-nis tha an luchd air na grafaichean air a dhol suas, ach tha a h-uile dad gu math. Fanaibh ann." San fharsaingeachd, rinn sinn seo, agus sin e - chaidh an dreach fhoillseachadh airson riochdachadh. Ach cha mhòr a h-uile cruth tha duilgheadasan coltach ris.
Tha còir aig ceist marbhadh ceistean a mharbhadh, ach chan eil. Carson?
ThĂ inig neach-cleachdaidh, seòrsa de mhion-sgrĂšdair, thugam agus chruthaich e iarrtas a chuir mo bhuidheann ClickHouse. Cuid de nĂłd no cruinneachadh iomlan, a rèir dè am mac-samhail no an t-slat dhan deach an t-iarrtas. Tha mi a 'faicinn gu bheil a h-uile goireas CPU air an fhrithealaiche seo ann an sgeilp, tha a h-uile dad dearg. Aig an aon Ă m, bidh ClickHouse fhèin aâ freagairt iarrtasan. Agus tha mi aâ sgrĂŹobhadh: âFeuch an seall thu dhomh, liosta pròiseas, dè an t-iarrtas a chruthaich aâ chuthach seo. â
Lorg mi an t-iarrtas seo agus sgrĂŹobh mi marbhadh thuige. Agus tha mi aâ faicinn nach eil dad aâ tachairt. Tha an frithealaiche agam ann an sgeilp, bidh ClickHouse an uairsin aâ toirt dhomh òrdughan, aâ sealltainn gu bheil am frithealaiche beò, agus tha a h-uile dad sgoinneil. Ach tha truailleadh agam anns a h-uile iarrtas neach-cleachdaidh, bidh truailleadh aâ tòiseachadh le clĂ ran ann an ClickHouse, agus chan eil mo cheist marbhadh ag obair. Carson? Bha mi aâ smaoineachadh gu robh còir aig ceist marbhadh ceistean a mharbhadh, ach chan eil.
A-nis bidh freagairt caran neònach ann. Is e aâ phuing nach bi ceist marbhadh aâ marbhadh cheistean.
Bidh ceist marbhadh aâ sgrĂšdadh bogsa beag leis an t-ainm âTha mi airson aâ cheist seo a mharbhadh. â Agus tha an t-iarrtas fhèin a 'coimhead air a' bhratach seo nuair a bhios e a 'giollachd gach bloca. Ma tha e air a shuidheachadh, stad an t-iarrtas ag obair. Tha e a 'tionndadh a-mach nach eil duine a' marbhadh an iarrtas, feumaidh e fhèin sĂšil a h-uile cĂ il agus stad. Agus bu chòir seo obrachadh anns a h-uile cĂšis far a bheil an t-iarrtas ann an staid giullachd bhlocaichean dĂ ta. Pròiseas e an ath bhloca dĂ ta, thoir sĂšil air aâ bhratach, agus stadaidh e.
Chan eil seo ag obair ann an cĂšisean far a bheil an t-iarrtas a bhacadh air cuid de obrachadh. FĂŹor, is coltaiche nach e seo a âchĂšis agad, oir, a rèir thusa, bidh e aâ cleachdadh tunna de ghoireasan frithealaiche. Tha e comasach nach obraich seo a thaobh seòrsachadh taobh a-muigh agus ann am mion-fhiosrachadh eile. Ach san fharsaingeachd cha bu chòir seo tachairt, is e bug a thâ ann. Agus is e an aon rud as urrainn dhomh a mholadh a bhith ag Ăšrachadh ClickHouse.
Ciamar a nĂŹ thu Ă ireamhachadh Ăšine freagairt fo luchd leughaidh?
Tha clĂ r ann a bhios aâ stòradh chruinneachaidhean nithean - diofar chunntair. Tha an Ă ireamh de loidhnichean timcheall air ceud millean. A bheil e comasach cunntadh air Ăšine freagairt a tha dĂšil ma dhòirteas tu 1K RPS airson nithean 1K?
A rèir a 'cho-theacsa, tha sinn a' bruidhinn mun luchd leughaidh, oir chan eil duilgheadasan ann le sgrÏobhadh - eadhon mÏle, eadhon ceud mÏle, agus uaireannan faodar grunn mhilleanan sreathan a chuir a-steach.
Tha iarrtasan leughaidh gu math eadar-dhealaichte. Ann an taghadh 1, faodaidh ClickHouse timcheall air deichean de mhĂŹltean de dhâ iarrtasan gach diog a dhèanamh, agus mar sin bidh eadhon iarrtasan airson aon iuchair feumach air cuid de ghoireasan mu thrĂ th. Agus bidh ceistean puing mar sin nas duilghe na ann an cuid de phrĂŹomh stòran-dĂ ta le luach, oir airson gach leughadh tha e riatanach bloc dĂ ta a leughadh le clĂ r-amais. Chan eil an clĂ r-amais againn aâ dèiligeadh ri gach clĂ r, ach gach raon. Is e sin, feumaidh tu an raon gu lèir a leughadh - is e seo loidhnichean 8192 gu bunaiteach. Agus feumaidh tu am bloc dĂ ta teann a dhĂŹ-dhĂšmhlachadh bho 64 KB gu 1 MB. Mar as trice, bidh ceistean cuimsichte mar sin aâ toirt beagan mhilleanan-tomhais airson a chrĂŹochnachadh. Ach is e seo an roghainn as sĂŹmplidh.
Feuch sinn beagan à ireamhachd sÏmplidh. Ma dh'iomadaicheas tu beagan mhillean-seconds le mÏle, gheibh thu beagan dhiog. Tha e mar gum biodh e do-dhèanta cumail suas ri mÏle iarrtas gach diog, ach gu dearbh tha e comasach, leis gu bheil grunn choraichean pròiseasar againn. Mar sin, ann am prionnsabal, faodaidh ClickHouse uaireannan 1000 RPS a chumail, ach airson iarrtasan goirid, feadhainn cuimsichte gu sònraichte.
Ma dhâ fheumas tu cruinneachadh ClickHouse a sgèileadh leis an Ă ireamh de dhâ iarrtasan sĂŹmplidh, tha mi aâ moladh an rud as sĂŹmplidhe - Ă rdaich an Ă ireamh de mhac-samhail agus cuir iarrtasan gu mac-samhail air thuaiream. Ma tha aon mhac-samhail aâ cumail còig ceud iarrtas gach diog, a tha gu tur fĂŹrinneach, bidh trĂŹ mac-samhail aâ lĂ imhseachadh mĂŹle gu leth.
Aig amannan, gu dearbh, faodaidh tu ClickHouse a rèiteachadh airson an Ă ireamh as motha de leughaidhean puing. Dè tha a dhĂŹth airson seo? Is e a 'chiad fhear a bhith a' lĂšghdachadh granularity a 'chlĂ r-amais. Anns a 'chĂšis seo, cha bu chòir a lĂšghdachadh gu aon, ach air a' bhunait gu bheil an Ă ireamh de inntrigidhean anns a 'chlĂ r-amais a bhios grunn mhilleanan no deichean de mhilleanan gach frithealaiche. Ma tha ceud millean sreath air aâ chlĂ r, faodar an granularity a shuidheachadh gu 64.
Faodaidh tu meud aâ bhloc teannachaidh a lughdachadh. Tha roghainnean ann airson seo min compress meud bloca, meud bloc compress as Ă irde. Faodar an lughdachadh, ath-lĂŹonadh le dĂ ta, agus an uairsin bidh ceistean cuimsichte nas luaithe. Ach fhathast, chan e stòr-dĂ ta prĂŹomh luach a thâ ann an ClickHouse. Tha Ă ireamh mhòr de dh'iarrtasan beaga mar antipattern luchd.
Kirill Shvakov: Bheir mi comhairle gun fhios nach bi cunntasan Ă bhaisteach ann. Is e suidheachadh gu math Ă bhaisteach a tha seo nuair a bhios ClickHouse aâ stòradh seòrsa de chunntair. Tha neach-cleachdaidh agam, tha e Ă dĂšthaich mar sin agus mar sin, agus cuid den treas raon, agus feumaidh mi rudeigin Ă rdachadh mean air mhean. Gabh MySQL, dèan iuchair shònraichte - ann am MySQL tha e na iuchair dhĂšblaichte, agus ann am PostgreSQL tha e na chòmhstri - agus cuir soidhne a bharrachd ris. Obraichidh seo tòrr nas fheĂ rr.
Nuair nach eil mòran dĂ ta agad, chan eil mòran feum ann a bhith aâ cleachdadh ClickHouse. Tha stòran-dĂ ta cunbhalach ann agus bidh iad aâ dèanamh seo gu math.
Dè as urrainn dhomh atharrachadh ann an ClickHouse gus am bi barrachd dà ta san tasgadan?
Smaoinich sinn air suidheachadh - tha 256 GB de RAM aig na frithealaichean, anns aâ chleachdadh lĂ itheil bheir ClickHouse timcheall air 60-80 GB, aig an ĂŹre as Ă irde - suas ri 130. Dè ghabhas a chomasachadh agus a thweaked gus am bi barrachd dĂ ta san tasgadan agus, a rèir sin, a bheil nas lugha de thursan air an diosg?
Mar as trice, bidh tasgadan duilleag an t-siostam obrachaidh aâ dèanamh obair mhath de seo. Ma dhâ fhosglas tu am mullach dĂŹreach, seall an sin ann an tasgadan no an-asgaidh - bidh e cuideachd ag innse na tha air a thasgadh - an uairsin chĂŹ thu gu bheil a h-uile cuimhne an-asgaidh air a chleachdadh airson an tasgadan. Agus nuair a leughas tu an dĂ ta seo, thèid a leughadh chan ann bhon diosc, ach bhon RAM. Aig an aon Ă m, is urrainn dhomh a rĂ dh gu bheil an tasgadan air a chleachdadh gu h-èifeachdach oir is e an dĂ ta teann a tha air a thasgadh.
Ach, ma tha thu airson cuid de cheistean sĂŹmplidh a luathachadh eadhon nas motha, tha e comasach tasgadan a chomasachadh anns an dĂ ta dĂŹ-dhĂšmhlaichte taobh a-staigh ClickHouse. Canar tasgadan neo-bhrĂšichte. Anns an fhaidhle rèiteachaidh config.xml, suidhich meud an tasgadan neo-bhrĂšichte chun luach a dh âfheumas tu - tha mi aâ moladh gun a bhith nas fhaide na leth den RAM an-asgaidh, oir thèid an còrr fo tasgadan na duilleige.
A bharrachd air an sin, tha dĂ shuidheachadh ĂŹre iarrtas ann. A' chiad suidheachadh - cleachd tasgadan neo-dhĂšmhlaichte - a 'toirt a-steach a chleachdadh. Thathas aâ moladh a chomasachadh airson a h-uile iarrtas, ach a-mhĂ in feadhainn throm, as urrainn an dĂ ta gu lèir a leughadh agus an tasgadan a shruthladh. Agus tha an dĂ rna suidheachadh rudeigin mar an Ă ireamh as motha de loidhnichean airson an tasgadan a chleachdadh. Bidh e gu fèin-ghluasadach aâ cuingealachadh cheistean mòra gus an tèid iad seachad air an tasgadan.
Ciamar as urrainn dhomh storage_configuration a rèiteachadh airson stòradh ann an RAM?
Anns na sgrĂŹobhainnean Ăšra ClickHouse leugh mi an earrann co-cheangailte . Tha eisimpleir anns an tuairisgeul le SSD luath.
Saoil ciamar a ghabhas an aon rud a rèiteachadh le cuimhne teth meud. Agus aon cheist eile. Ciamar a dhâobraicheas taghadh leis aâ bhuidheann dĂ ta seo, an leugh e an seata slĂ n no an aon fhear a tha air diosc, agus a bheil an dĂ ta seo air a dhlĂšthadh mar chuimhne? Agus ciamar a tha an roinn ro-Ă ite ag obair le leithid de bhuidheann dĂ ta?
Bheir an suidheachadh seo buaidh air stòradh pÏosan dà ta, agus chan atharraich an cruth aca ann an dòigh sam bith.
Bheir sinn sĂšil nas mionaidiche.
Faodaidh tu stòradh dĂ ta a rèiteachadh ann an RAM. Is e a h-uile rud a tha air a rèiteachadh airson an diosc an t-slighe aige. Bidh thu aâ cruthachadh sgaradh tmpfs a tha air a chuir suas gu slighe air choreigin san t-siostam faidhle. Bidh thu aâ sònrachadh an t-slighe seo mar an t-slighe airson dĂ ta a stòradh airson an sgaradh as teotha, bidh pĂŹosan dĂ ta aâ tòiseachadh aâ ruighinn agus air an sgrĂŹobhadh an sin, tha a h-uile dad ceart gu leòr.
Ach chan eil mi aâ moladh seo a dhèanamh air sgĂ th earbsachd ĂŹosal, ged ma tha co-dhiĂš trĂŹ mac-samhail agad ann an diofar ionadan dĂ ta, tha e comasach. Ma thachras dad, thèid an dĂ ta ath-nuadhachadh. Smaoinich sinn gun deach am frithealaiche a chuir dheth gu h-obann agus a thionndadh air ais. Chaidh an sgaradh a chuir suas a-rithist, ach cha robh dad ann. Nuair a thòisicheas am frithealaiche ClickHouse, tha e a 'faicinn nach eil na pĂŹosan sin aige, ged, a rèir meata-dĂ ta ZooKeeper, bu chòir dhaibh a bhith ann. Bidh e aâ coimhead air dè na mac-samhail a tha aca, gan iarraidh agus gan luchdachadh sĂŹos. San dòigh seo thèid an dĂ ta ath-nuadhachadh.
San t-seagh seo, chan eil stòradh dĂ ta ann an RAM gu tur eadar-dhealaichte bho bhith ga stòradh air diosc, oir nuair a thèid dĂ ta a sgrĂŹobhadh gu diosc, thig e gu crĂŹch an toiseach ann an tasgadan na duilleige agus thèid a sgrĂŹobhadh gu corporra nas fhaide air adhart. Tha seo an urra ris an roghainn sreap siostam faidhle. Ach gun fhios nach bi, canaidh mi nach bi ClickHouse aâ sioncronadh nuair a chuireas tu a-steach e.
Anns a 'chĂšis seo, tha an dĂ ta anns an RAM air a stòradh san aon chruth ris a' chlĂ r. Bidh an ceist taghaidh san aon dòigh aâ taghadh nam pĂŹosan a dhâfheumar a leughadh, aâ taghadh nan raointean dĂ ta riatanach anns na pĂŹosan, agus gan leughadh. Agus bidh prewhere ag obair dĂŹreach mar an ceudna, ge bith an robh an dĂ ta ann an RAM no air diosc.
Suas gu dè an Ă ireamh de luachan sònraichte a tha Ăosal Cardinality èifeachdach?
Tha Cardinality Ăosal air a dhealbhadh gu snasail. Bidh e aâ cur ri chèile faclairean dĂ ta, ach tha iad ionadail. An toiseach, tha faclairean eadar-dhealaichte ann airson gach pĂŹos, agus san dĂ rna h-Ă ite, eadhon taobh a-staigh aon phĂŹos faodaidh iad a bhith eadar-dhealaichte airson gach raon. Nuair a ruigeas an Ă ireamh de luachan gun samhail Ă ireamh stairsneachâaon mhillean, tha mi aâ smaoineachadhâtha am faclair dĂŹreach air a sgeilpadh agus fear Ăšr ga chruthachadh.
Tha am freagairt san fharsaingeachd: airson gach raon ionadail - can, airson gach latha - an Ă iteigin suas ri millean luachan sònraichte Tha Cardinality Ăosal èifeachdach. Ăs deidh sin bidh dĂŹreach cĂšl-raon ann, anns an tèid mòran fhaclairean eadar-dhealaichte a chleachdadh, agus chan e dĂŹreach aon. Obraichidh e timcheall air an aon rud ri colbh sreang Ă bhaisteach, is dòcha beagan nas èifeachdaiche, ach cha bhi droch ĂŹsleachadh coileanaidh ann.
Dè na cleachdaidhean as fheĂ rr airson lĂ n-theacsa aâ sgrĂšdadh clĂ r le còig billean sreathan?
Tha diofar fhreagairtean ann. Is e aâ chiad fhear a rĂ dh nach e einnsean sgrĂšdaidh lĂ n-theacsa a thâ ann an ClickHouse. Tha siostaman sònraichte ann airson seo, mar eisimpleir, и . Ach, tha mi aâ faicinn barrachd is barrachd dhaoine ag rĂ dh gu bheil iad aâ gluasad bho Elasticsearch gu ClickHouse.
Carson a tha seo aâ tachairt? Bidh iad aâ mĂŹneachadh seo leis gu bheil Elasticsearch aâ sgur a bhith aâ dèiligeadh ris an luchd aig cuid de dhâ leabhraichean, aâ tòiseachadh le togail chlĂ ran-amais. Bidh clĂ ran-amais aâ fĂ s ro throm, agus ma ghluaiseas tu dĂŹreach an dĂ ta gu ClickHouse, tha e aâ tionndadh a-mach gu bheil iad air an stòradh grunn thursan nas èifeachdaiche a thaobh meud. Aig an aon Ă m, gu tric cha robh ceistean rannsachaidh cho mòr 's gu robh feum air abairt a lorg anns an Ă ireamh iomlan de dhĂ ta, a' gabhail a-steach morf-eòlas, ach feadhainn gu tur eadar-dhealaichte. Mar eisimpleir, lorg beagan fo-leanmhainn de bytes anns na logaichean thairis air na beagan uairean a thĂŹde.
Anns a 'chĂšis seo, cruthaichidh tu clĂ r-amais ann an ClickHouse, agus bidh a' chiad raon dheth an ceann-latha agus Ă m. Agus bidh an gearradh dĂ ta as motha stèidhichte air an raon cinn-latha. Taobh a-staigh an raon cinn-latha a chaidh a thaghadh, mar riaghailt, tha e comasach mar-thĂ sgrĂšdadh lĂ n-theacsa a dhèanamh, eadhon a âcleachdadh an dòigh feachd brĂšideil aâ cleachdadh leithid. Is e an leithid de ghnĂŹomhaiche ann an ClickHouse an gnĂŹomhaiche coltach as èifeachdaiche a lorgas tu. Ma lorgas tu rudeigin nas fheĂ rr, innis dhomh.
Ach fhathast, mar a tha lĂ n scan. Agus faodaidh lĂ n scan a bhith slaodach chan ann a-mhĂ in air an CPU, ach cuideachd air an diosc. Ma tha aon terabyte de dhĂ ta agad san latha gu h-obann, agus ma nĂŹ thu sgrĂšdadh airson facal tron ââââlatha, feumaidh tu an terabyte a sganadh. Agus is dòcha gu bheil e air dreachan cruaidh cunbhalach, agus aig aâ cheann thall bidh iad air an luchdachadh ann an dòigh nach bi e comasach dhut faighinn chun t-seirbheisiche seo tro SSH.
Anns a 'chÚis seo, tha mi deiseil airson cleas beag eile a thabhann. Tha e deuchainneach - is dòcha gun obraich e, is dòcha nach bi. Tha clà ran-amais là n-theacsa aig ClickHouse ann an cruth sÏoltachain trigram Bloom. Tha ar co-obraichean aig Arenadata air na clà ran-amais seo fheuchainn mar-thà , agus bidh iad gu tric ag obair dÏreach mar a bha dÚil.
Gus an cleachdadh gu ceart, bu chòir tuigse mhath a bhith agad air dĂŹreach mar a tha iad ag obair: dè a th âann an criathrag Bloom trigram agus mar a roghnaicheas tu a mheud. Is urrainn dhomh a rĂ dh gun cuidich iad airson ceistean air cuid de dhâ abairtean tearc, fo-thiotalan nach fhaighear ach ainneamh anns an dĂ ta. Anns a 'chĂšis seo, thèid subranges a thaghadh le clĂ ran-amais agus thèid nas lugha de dhĂ ta a leughadh.
O chionn ghoirid, tha ClickHouse air gnĂŹomhan eadhon nas adhartaiche a chuir ris airson sgrĂšdadh lĂ n-theacsa. Is e seo, an-toiseach, sgrĂšdadh airson dòrlach de fho-sreathan aig an aon Ă m ann an aon chead, aâ toirt a-steach roghainnean a tha mothachail air cĂšis, neo-mhothachail air cĂšis, le taic airson UTF-8 no dĂŹreach airson ASCII. Tagh am fear as èifeachdaiche a dh 'fheumas tu.
Tha lorg airson grunn abairtean cunbhalach ann an aon bhealaich cuideachd air nochdadh. Chan fheum thu X a sgrĂŹobhadh mar aon fho-sreang no X mar fho-sreang eile. Bidh thu aâ sgrĂŹobhadh sa bhad, agus tha a h-uile cĂ il air a dhèanamh cho èifeachdach sa ghabhas.
San treas à ite, tha sgrÚdadh tuairmseach ann a-nis airson regexps agus sgrÚdadh tuairmseach airson fo-thiotalan. Ma rinn cuideigin mearachd air facal, thèid a shireadh airson an Ïre as à irde.
Dè an dòigh as fheà rr air ruigsinneachd gu ClickHouse a chuir air dòigh airson à ireamh mhòr de luchd-cleachdaidh?
Inns dhuinn dè an dòigh as fheà rr air ruigsinneachd a chuir air dòigh airson à ireamh mhòr de luchd-cleachdaidh agus luchd-anailis. Mar a chruthaicheas tu ciudha, cuir prÏomhachas air na ceistean as motha aig an aon à m, agus dè na h-innealan?
Ma tha an cruinneachadh mòr gu leòr, bhiodh e na fhuasgladh math dĂ sheirbheisiche eile a thogail, a thig gu bhith na Ă ite inntrigidh dha sgrĂšdairean. Is e sin, na leig le sgrĂšdairean faighinn gu shards sònraichte anns aâ bhuidheann, ach dĂŹreach cruthaich dĂ fhrithealaiche falamh, gun dĂ ta, agus rèitich còraichean-slighe orra. Anns a 'chĂšis seo, thèid roghainnean luchd-cleachdaidh airson iarrtasan sgaoilte a ghluasad gu frithealaichean iomallach. Is e sin, bidh thu aâ rèiteachadh a h-uile cĂ il air an dĂ fhrithealaiche seo, agus tha buaidh aig na roghainnean air aâ bhuidheann gu lèir.
Ann am prionnsapal, chan eil dà ta aig na frithealaichean sin, ach tha an Ïre de RAM orra glè chudromach airson iarrtasan a chuir an gnÏomh. Faodar an diosc a chleachdadh cuideachd airson dà ta sealach ma tha co-chruinneachadh taobh a-muigh no seòrsachadh taobh a-muigh air a chomasachadh.
Tha e cudromach coimhead air na roghainnean a tha co-cheangailte ris a h-uile crĂŹochan a dh'fhaodadh a bhith ann. Ma thèid mi a-nis gu brabhsair Yandex.Metrica mar anailisiche agus faighnich iarrtas tagh cunntadh bho bhuillean, an uairsin gheibh mi eisgeachd sa bhad nach urrainn dhomh an t-iarrtas a chuir an gnĂŹomh. Is e an Ă ireamh as motha de shreathan a tha cead agam a sganadh ceud billean, agus gu h-iomlan tha leth-cheud trillean dhiubh ann an aon chlĂ r air aâ bhuidheann. Is e seo aâ chiad chuingealachadh.
Canaidh sinn gun toir mi air falbh crĂŹoch na loidhne agus ruith mi aâ cheist a-rithist. An uairsin chĂŹ mi an eisgeachd a leanas - suidheachadh air a chomasachadh clĂ r-amais feachd a rèir ceann-latha. Chan urrainn dhomh a' cheist a lĂŹonadh mura h-eil mi air raon cinn-latha a shònrachadh. Chan fheum thu a bhith an urra ri sgrĂšdairean gus a shònrachadh le lĂ imh. Is e cĂšis Ă bhaisteach nuair a thèid raon cinn-latha a sgrĂŹobhadh far a bheil ceann-latha tachartais eadar seachdain. Agus an uairsin shònraich iad bracaid san Ă ite ceĂ rr, agus an Ă ite sin agus thionndaidh e a-mach gur e no - no maids URL a bh âann. Mura h-eil crĂŹoch ann, snĂ gaidh e an colbh URL agus dĂŹreach caithidh e tunna de ghoireasan.
A bharrachd air an sin, tha dĂ shuidheachadh prĂŹomhachais aig ClickHouse. Gu mĂŹ-fhortanach, tha iad gu math prĂŹomhadail. Tha aon air a ghairm gu sĂŹmplidh phrĂŹomhachas. Ma tha prĂŹomhachas â 0, agus iarrtasan le beagan prĂŹomhachais gan cur an gnĂŹomh, ach iarrtas le luach prĂŹomhachais nas lugha na, a tha aâ ciallachadh prĂŹomhachas nas Ă irde, ga chur an gnĂŹomh, an uairsin iarrtas le luach prĂŹomhachais nas motha, a tha aâ ciallachadh prĂŹomhachas nas ĂŹsle , dĂŹreach air a chuir dheth agus cha obraich e idir aig an Ă m seo.
Is e suidheachadh gu math amh a tha seo agus chan eil e freagarrach airson cĂšisean far a bheil eallach cunbhalach air aâ bhuidheann. Ach ma tha iarrtasan goirid, bursty agad a tha cudromach, agus gu bheil an cruinneachadh gu ĂŹre mhòr leisg, tha an suidheachadh seo freagarrach.
Canar an ath shuidheachadh prĂŹomhachais PrĂŹomhachas snĂ ithlean OSBidh e dĂŹreach aâ suidheachadh an luach snog airson an clĂ r-ama airson a h-uile snĂ thainn cur an gnĂŹomh iarrtasan. LinuxTha e ag obair gu mĂŹ-chĂšramach, ach tha e ag obair co-dhiĂš. Ma shuidhicheas tu an luach snog chun an luach as ĂŹsleâis e an luach as motha, agus mar sin am prĂŹomhachas as ĂŹsleâagus ma shuidhicheas tu iarrtasan Ă rd-phrĂŹomhachais gu -19, bidh iarrtasan ĂŹosal-phrĂŹomhachais ag ithe timcheall air ceithir uiread nas lugha de CPU na iarrtasan Ă rd-phrĂŹomhachais.
Feumaidh tu cuideachd an Ăšine cur an gnĂŹomh iarrtas as Ă irde a rèiteachadh - can, còig mionaidean. Is e an astar as lugha de chur an gnĂŹomh ceist an rud as fhuaire. Tha an suidheachadh seo air a bhith timcheall airson Ăšine mhòr, agus feumar chan ann a-mhĂ in a bhith ag rĂ dh nach bi ClickHouse aâ slaodadh sĂŹos, ach airson a sparradh.
Smaoinich, bidh thu aâ rèiteachadh: ma bhios cuid de cheistean aâ pròiseasadh nas lugha na millean sreath gach diog, chan urrainn dhut sin a dhèanamh. Tha seo aâ cur nĂ ire air ar deagh ainm, ar stòr-dĂ ta math. Leig leinn dĂŹreach casg a chuir air seo. Gu dearbh tha dĂ shuidheachadh ann. Canar aon astar cur gu bĂ s min - ann an loidhnichean gach diog, agus canar timeout ris an dĂ rna fear mus dèan thu sgrĂšdadh air astar cur gu bĂ s - còig diogan deug gu bunaiteach. Is e sin, tha e comasach còig diogan deug, agus an uairsin, ma tha e slaodach, dĂŹreach tilg eisgeachd agus stad air an iarrtas.
Feumaidh tu cuideachd cuotathan a stèidheachadh. Tha feart cuota togte aig ClickHouse a bhios aâ cunntadh caitheamh ghoireasan. Ach, gu mĂŹ-fhortanach, chan e goireasan bathar-cruaidh leithid CPU, diosgan, ach feadhainn loidsigeach - an Ă ireamh de dh'iarrtasan air an giullachd, loidhnichean agus bytes air an leughadh. Agus faodaidh tu a rèiteachadh, mar eisimpleir, suas ri ceud iarrtas taobh a-staigh còig mionaidean agus mĂŹle iarrtas san uair.
Carson a tha e cudromach? Leis gun tèid cuid de cheistean anailis a dhèanamh le lĂ imh gu dĂŹreach bhon neach-dèiligidh ClickHouse. Agus bidh a h-uile cĂ il gu math. Ach ma tha sgrĂšdairean adhartach agad sa chompanaidh agad, sgrĂŹobhaidh iad sgriobt, agus dhâ fhaodadh gum bi mearachd anns an sgriobt. Agus bidh am mearachd seo ag adhbhrachadh gun tèid an t-iarrtas a chuir gu bĂ s ann an lĂšb gun chrĂŹoch. Is e seo a dhâ fheumas sinn gus sinn fhèin a dhĂŹon.
A bheil e comasach toraidhean aon cheist a thoirt do dheich teachdaichean?
Tha grunn luchd-cleachdaidh againn a tha dèidheil air a thighinn a-steach le iarrtasan glè mhòr aig an aon à m. Tha an t-iarrtas mòr agus, ann am prionnsabal, air a chur gu bàs gu luath, ach air sgà th gu bheil mòran iarrtasan mar sin aig an aon à m, bidh e gu math goirt. A bheil e comasach an aon iarrtas a chuir an gnÏomh, a rà inig deich tursan ann an sreath, aon uair, agus an toradh a thoirt do dheich teachdaichean?
Is e an duilgheadas a thâ ann nach eil toraidhean tasgadan no tasgadan dĂ ta eadar-mheadhanach againn. Tha tasgadan duilleag den t-siostam obrachaidh ann, a chuireas casg ort bho bhith aâ leughadh dĂ ta bhon diosc a-rithist, ach, gu mĂŹ-fhortanach, bidh an dĂ ta fhathast air a dhĂŹ-dhĂšmhlachadh, air a dhĂŹ-dhealbhadh agus air ath-phròiseasadh.
Bu mhath leam dòigh air choireigin seo a sheachnadh, le bhith aâ tasgadh dĂ ta eadar-mheadhanach, no le bhith aâ cur cheistean coltach ris ann an ciudha air choireigin agus aâ cur tasgadan thoraidhean ris. Tha aon iarrtas tarraingidh againn an-drĂ sta ann an leasachadh a chuireas ri tasgadan iarrtas, ach dĂŹreach airson fo-cheistean anns na h-earrannan a-steach agus a-steach - is e sin, tha am fuasgladh neo-choileanta.
Ach, tha sinn cuideachd aâ toirt aghaidh air suidheachadh mar sin. Is e eisimpleir sònraichte canonical ceistean le duilleagan. Tha aithisg ann, tha grunn dhuilleagan aige, agus tha iarrtas ann airson crĂŹoch 10. An uairsin an aon rud, ach crĂŹoch 10,10. An uairsin an ath dhuilleag eile. Agus is e aâ cheist, carson a bhios sinn aâ cunntadh seo uile a h-uile turas? Ach a-nis chan eil fuasgladh ann, agus chan eil dòigh ann air a sheachnadh.
Tha fuasgladh eile ann a tha air a chuir mar chĂ r-taobh ri taobh ClickHouse - .
Kirill Shvakov: Tha inneal-crĂŹochnachaidh reata togte aig ClickHouse Proxy agus tasgadan thoraidhean togte. Chaidh tòrr shuidheachaidhean a dhèanamh an sin oir bha duilgheadas coltach ris ga fhuasgladh. Leigidh neach-ionaid leat iarrtasan a chuingealachadh le bhith gan ciudha agus aâ rèiteachadh dè cho fada âs a mhaireas tasgadan an iarrtais. Nam biodh na h-iarrtasan an aon rud, cuiridh Proxy iad iomadh uair, ach cha tèid e gu ClickHouse ach aon turas.
Tha tasgadan aig Nginx cuideachd anns an dreach an-asgaidh, agus obraichidh seo cuideachd. Tha eadhon roghainnean aig Nginx ma thig iarrtasan aig an aon à m, gun cuir e maill air feadhainn eile gus am bi aon deiseil. Ach is ann ann an ClickHouse Proxy a tha an stèidheachadh air a dhèanamh tòrr nas fheà rr. Chaidh a dhèanamh gu sònraichte airson ClickHouse, gu sònraichte airson na h-iarrtasan sin, agus mar sin tha e nas freagarraiche. Uill, tha e furasta a stà ladh.
Dè mu dheidhinn obrachaidhean asyncronach agus seallaidhean dearbhte?
Tha duilgheadas ann gu bheil gnÏomhachd leis an einnsean ath-chluich asyncronach - an toiseach tha an dà ta air a sgrÏobhadh, agus an uairsin tuitidh e. Ma tha clà r tà bhachdach le cuid de cho-chruinneachaidhean a 'fuireach fon t-soidhne, thèid lethbhreacan a sgrÏobhadh thuige. Agus mura h-eil loidsig iom-fhillte ann, thèid an dà ta a dhÚblachadh. Dè as urrainn dhut a dhèanamh mu dheidhinn?
Tha fuasgladh follaiseach ann - gus inneal-brosnachaidh a chuir an gnÏomh air clas sònraichte de matviews rè gnÏomhachd tuiteam asyncronach. A bheil peilearan airgid no planaichean ann gus an aon seòrsa gnÏomh a chuir an gnÏomh?
Is fhiach a bhith aâ tuigsinn mar a tha dĂŹ-dhĂšblachadh ag obair. Chan eil na dhâ innseas mi dhut a-nis buntainneach don cheist, ach dĂŹreach air eagal âs gum bâ fhiach a chuimhneachadh.
Nuair a thèid a chuir a-steach do bhòrd ath-chuiridh, thathas aâ toirt air falbh na blocaichean gu lèir a chaidh a chuir a-steach. Ma chuireas tu a-steach an aon bhloc anns a bheil an aon Ă ireamh de na h-aon sreathan san aon òrdugh, tha an dĂ ta air a dhĂŹ-dhĂšblachadh. Gheibh thu âOKâ mar fhreagairt airson cuir a-steach, ach gu dearbh thèid aon phasgan dĂ ta a sgrĂŹobhadh, agus cha tèid a dhĂšblachadh.
Tha seo riatanach airson cinnt. Ma gheibh thu âOKâ aig Ă m cuir a-steach, tha an dĂ ta agad air a chuir a-steach. Ma gheibh thu mearachd bho ClickHouse, tha e aâ ciallachadh nach deach an cuir a-steach agus feumaidh tu an cuir a-steach a-rithist. Ach ma thèid an ceangal a bhriseadh aig Ă m cuir a-steach, chan eil fios agad an deach an dĂ ta a chuir a-steach no nach deach. Is e an aon roghainn an cuir a-steach a-rithist. Ma chaidh an dĂ ta a chuir a-steach gu fĂŹrinneach agus gun do chuir thu a-steach e a-rithist, tha dĂšblachadh bloca ann. Tha seo riatanach gus dĂšblaidhean a sheachnadh.
Agus tha e cuideachd cudromach mar a tha e ag obair airson seallaidhean tà bhachdach. Ma chaidh an dà ta a dhÏ-dhÚblachadh nuair a chaidh a chuir a-steach don phrÏomh chlà r, cha tèid e a-steach don t-sealladh toraidh nas motha.
A-nis mun cheist. Tha an suidheachadh agad nas toinnte oir tha thu aâ clĂ radh dĂšblaidhean de loidhnichean fa leth. Is e sin, chan e am pasgan gu lèir a tha air a dhĂšblachadh, ach loidhnichean sònraichte, agus bidh iad a 'tuiteam air a' chĂšl. Gu dearbh, tuitidh an dĂ ta anns a 'phrĂŹomh chlĂ r, ach thèid an dĂ ta nach deach a chall chun an t-seallaidh tĂ bhachdach, agus aig Ă m co-aonaidhean cha tachair dad dha na seallaidhean tĂ bhachdach. Leis nach eil sealladh tĂ bhachdach nas motha na inneal-brosnachaidh cuir a-steach. Rè obrachaidhean eile, chan eil dad a bharrachd a 'tachairt dha.
Agus chan urrainn dhomh do dhèanamh toilichte an seo. Feumaidh tu dĂŹreach coimhead airson fuasgladh sònraichte airson a 'chĂšis seo. Mar eisimpleir, a bheil e comasach ath-chluich ann an sealladh tĂ bhachdach, agus dhâ fhaodadh an dòigh dĂšblachaidh obrachadh san aon dòigh. Ach gu mĂŹ-fhortanach, chan ann an-còmhnaidh. Ma tha e aâ cruinneachadh, chan obraich e.
Kirill Shvakov: Bha togail crutch againn air ais san latha cuideachd. Bha duilgheadas ann gu bheil beachdan sanasachd ann, agus tha beagan dà ta ann as urrainn dhuinn a shealltainn ann an à m fÏor - is e dÏreach beachdan a tha seo. Is ann ainneamh a thèid an dÚblachadh, ach ma thachras seo, tuitidh sinn às a chèile nas fhaide air adhart co-dhiÚ. Agus bha rudan ann nach gabhadh a dhÚblachadh - cliogan agus an sgeul slà n seo. Ach bha mi cuideachd airson sealltainn dhaibh cha mhòr sa bhad.
Ciamar a chaidh beachdan gnĂ thaichte a mheas? Bha beachdan ann far an deach a sgrĂŹobhadh gu dĂŹreach - chaidh a sgrĂŹobhadh gu dĂ ta amh, agus a sgrĂŹobhadh gu beachdan. An sin, aig Ă m air choreigin chan eil an dĂ ta gu math ceart, tha e air a dhĂšblachadh, agus mar sin air adhart. Agus tha an dĂ rna pĂ irt den chlĂ r, far a bheil iad a 'coimhead dĂŹreach mar a tha seallaidhean tĂ thaichte, is e sin, tha iad gu tur co-ionann ann an structar. Uair ann an Ăšine bidh sinn ag ath-Ă ireamhachadh an dĂ ta, aâ cunntadh an dĂ ta gun dĂšblaidhean, aâ sgrĂŹobhadh chun na clĂ ran sin.
Chaidh sinn tron ââââAPI - chan obraich seo ann an ClickHouse le lĂ imh. Agus tha an API a 'coimhead: nuair a tha ceann-latha an cur-ris mu dheireadh agam ris a' chlĂ r, far a bheil e cinnteach gu bheil an dĂ ta ceart air a thomhas mar-thĂ , agus bidh e a 'dèanamh iarrtas gu aon chlĂ r agus gu clĂ r eile. Bho aon tha an t-iarrtas a 'taghadh suas ri Ăšine shònraichte, agus bhon fhear eile gheibh e dè nach deach a thomhas fhathast. Agus bidh e ag obair, ach chan ann tro ClickHouse a-mhĂ in.
Ma tha seòrsa de API agad - airson luchd-anailis, airson luchd-cleachdaidh - an uairsin, ann am prionnsapal, tha seo na roghainn. Tha thu an-còmhnaidh aâ cunntadh, an-còmhnaidh aâ cunntadh. Faodar seo a dhèanamh aon uair san latha no aig Ă m eile. Bidh thu aâ taghadh dhut fhèin raon nach eil a dhĂŹth ort agus nach eil riatanach.
Tha tòrr logaichean aig ClickHouse. Ciamar a chÏ mi gu sgiobalta a h-uile dad a thachras don fhrithealaiche?
Tha Ă ireamh mhòr de chlĂ ran eadar-dhealaichte aig ClickHouse, agus tha an Ă ireamh seo aâ dol am meud. Ann an dreachan Ăšra, tha cuid dhiubh eadhon air an comasachadh gu bunaiteach; ann an dreachan nas sine feumaidh iad a bhith air an comasachadh nuair a bhios iad ag Ăšrachadh. Ach, tha barrachd is barrachd dhiubh ann. Aig a 'cheann thall, bu mhath leam faicinn dè tha a' tachairt leis an t-seirbheisiche agam a-nis, 's dòcha air clĂ r de sheòrsa air choreigin.
A bheil sgioba ClickHouse agad, no sgiobaidhean do charaidean, a bheir taic do chuid de ghnÏomhachd de chlà ran-deasachaidh deiseil a sheallas na logaichean sin mar thoradh crÏochnaichte? Aig a 'cheann thall, tha e math dÏreach a bhith a' coimhead air logaichean ann an ClickHouse. Ach bhiodh e gu math fionnar nam biodh e air ullachadh mar-thà ann an cruth deas-bhòrd. Gheibhinn breab as.
Tha dashboards ann, ged nach eil iad Ă bhaisteach. Anns aâ chompanaidh againn, bidh timcheall air 60 sgioba aâ cleachdadh ClickHouse, agus is e an rud as neònaiche gu bheil clĂ ran-lĂ imhe aig mòran dhiubh a rinn iad dhaibh fhèin, agus feadhainn a tha beagan eadar-dhealaichte. Bidh cuid de sgiobaidhean aâ cleachdadh stĂ ladh Yandex.Cloud a-staigh. Tha cuid de dh'aithisgean deiseil ann, ged nach eil iad uile riatanach. Tha an cuid fhèin aig cuid eile.
Tha an deas-bhòrd aca fhèin aig mo cho-obraichean bho Metrica ann an Grafana, agus tha mo chuid fhĂŹn agam airson an cruinneachadh aca. Tha mi aâ coimhead air rudan mar cache hit airson an tasgadan serif. Agus tha e eadhon nas duilghe gu bheil sinn aâ cleachdadh diofar innealan. Chruthaich mi an deas-bhòrd agam aâ cleachdadh inneal glè shean ris an canar Graphite-web. Tha e gu tur grĂ nda. Agus bidh mi fhathast ga chleachdadh san dòigh seo, ged is dòcha gum biodh Grafana nas goireasaiche agus nas bòidhche.
Tha an aon rud bunaiteach ann an dashboards. Is iad seo meatrach siostam airson aâ bhuidheann: CPU, cuimhne, diosc, lĂŹonra. Cuid eile - an Ă ireamh de dhâ iarrtasan aig an aon Ă m, an Ă ireamh de cho-aonaidhean aig an aon Ă m, an Ă ireamh de dhâiarrtasan gach diog, an Ă ireamh as motha de phĂŹosan airson pĂŹosan bĂšird MergeTree, dĂ il ath-riochdachadh, meud ciudha ath-riochdachadh, Ă ireamh de shreathan a chaidh a chuir a-steach gach diog, Ă ireamh de bhlocaichean a chaidh a chuir a-steach gach diog. Is e seo a h-uile cĂ il a gheibhear chan ann bho logaichean, ach bho mheatairean.
Vladimir Kolobaev: Alexei, bu mhath leam a cheartachadh beagan. Tha Grafana ann. Tha stòr-dĂ ta aig Grafana, is e sin ClickHouse. Is e sin, is urrainn dhomh iarrtasan a dhèanamh bho Grafana gu dĂŹreach gu ClickHouse. Tha clĂ r aig ClickHouse le logaichean, tha e an aon rud airson a h-uile duine. Mar thoradh air an sin, tha mi airson faighinn chun chlĂ r log seo ann an Grafana agus na h-iarrtasan a bhios an frithealaiche agam aâ dèanamh fhaicinn. Bhiodh e math clĂ r mar seo a bhith agad.
Rothairich mi mi fhÏn e. Ach tha ceist agam - ma tha e uile à bhaisteach, agus Grafana air a chleachdadh leis a h-uile duine, carson nach eil deas-bhòrd oifigeil aig Yandex?
Kirill Shvakov: Gu dearbh, tha an stòr-dĂ ta a thèid gu ClickHouse a-nis aâ toirt taic do Altinity. Agus tha mi dĂŹreach airson vectar a thoirt seachad air cĂ ite an tèid mi a chladhach agus cò a bu chòir dhomh a phutadh. Faodaidh tu faighneachd dhaibh, oir tha Yandex fhathast a 'dèanamh ClickHouse, agus chan e an sgeulachd timcheall air. Is e Altinity am prĂŹomh chompanaidh a tha an-drĂ sta aâ brosnachadh ClickHouse. Cha trèig iad e, ach bheir iad taic dha. Air sgĂ th, ann am prionnsabal, gus deas-bhòrd a luchdachadh suas gu lĂ rach-lĂŹn Grafana, chan fheum thu ach clĂ radh agus a luchdachadh suas - chan eil duilgheadasan sònraichte ann.
Alexei Milovidov: Thar na bliadhna a dhâ fhalbh, tha ClickHouse air mòran chomasan pròifil cheistean a chuir ris. Tha metrics ann airson gach iarrtas a thaobh cleachdadh ghoireasan. Agus dĂŹreach o chionn ghoirid, chuir sinn ĂŹomhaigh ceist eadhon nas ĂŹsle ris gus faicinn far a bheil ceist aâ cosg a h-uile millisecond. Ach airson an gnĂŹomh seo a chleachdadh, feumaidh mi teachdaiche aâ chonsail fhosgladh agus iarrtas a thaipeadh, a dhĂŹochuimhnicheas mi an-còmhnaidh. ShĂ bhail mi e an Ă iteigin agus chĂšm mi aâ dĂŹochuimhneachadh cĂ ite dĂŹreach.
Tha mi aâ guidhe gum biodh inneal ann a thuirt dĂŹreach, seo na ceistean trom agad, air an cruinneachadh a rèir clas ceist. BhrĂšth mi air fear dhiubh, agus dhâ innseadh iad dhomh gur e sin as coireach gu bheil e trom. Chan eil fuasgladh mar sin ann a-nis. Agus tha e gu math neònach nuair a bhios daoine aâ faighneachd dhomh: âInnis dhomh, a bheil clĂ ran-deasachaidh deiseil airson Grafana?â, Bidh mi ag rĂ dh: âRach gu lĂ rach-lĂŹn Grafana, tha coimhearsnachdâ Dashboards âann, agus tha deas-bhòrd ann. bho Dimka, tha deas-bhòrd bho Kostyan. Chan eil fios agam dè a thâ ann, cha do chleachd mi mi fhĂŹn e.â
Mar a bheir thu buaidh air aonaidhean gus nach tuit am frithealaiche a-steach gu OOM?
Tha bòrd agam, chan eil ach aon sgaradh anns aâ chlĂ r, is e ReplacingMergeTree a thâ ann. Tha mi air a bhith aâ sgrĂŹobhadh dĂ ta ann airson ceithir bliadhna. Dh'fheumadh mi atharrachadh a dhèanamh ann agus beagan dĂ ta a sguabadh Ă s.
Rinn mi seo, agus nuair a bha an t-iarrtas seo air a ghiullachd, chaidh a h-uile cuimhne air na frithealaichean uile anns aâ bhraisle a chaitheamh, agus chaidh a h-uile seirbheisiche sa bhuidheann a-steach gu OOM. An uairsin dh'èirich iad uile còmhla, thòisich iad air an aon obrachadh seo, am bloc dĂ ta seo a chur còmhla, agus thuit iad a-steach do OOM a-rithist. An uairsin dh'èirich iad a-rithist agus thuit iad a-rithist. Agus cha do stad an rud seo.
An uairsin thionndaidh e a-mach gur e bug a bha seo a shuidhich na balaich. Tha seo gu math fionnar, mòran taing. Ach dh'fhuirich fuigheall. Agus a-nis, nuair a smaoinicheas mi air aonachadh de sheòrsa air choreigin a dhèanamh sa chlà r, tha ceist agam - carson nach urrainn dhomh dòigh air choireigin buaidh a thoirt air na h-aonaidhean sin? Mar eisimpleir, cuingealaich iad leis an uiread de RAM a tha a dhÏth, no, ann am prionnsabal, leis an t-suim a bhios a 'là imhseachadh a' chlà r shònraichte seo.
Tha clĂ r agam air a bheil âMetricsâ, feuch an giullachd thu dhomh ann an dĂ snĂ ithlean. Chan eil feum air deich no còig co-aonaidhean a chruthachadh aig an aon Ă m, dèan e ann an dhĂ . Tha mi aâ smaoineachadh gu bheil cuimhne gu leòr agam airson dithis, ach âs dòcha nach bi e gu leòr airson deich a ghiullachd. Carson a tha eagal fhathast? Leis gu bheil am bòrd aâ fĂ s, agus uaireigin bidh mi aâ cur aghaidh ri suidheachadh nach eil, ann am prionnsapal, mar thoradh air bug tuilleadh, ach leis gun atharraich an dĂ ta ann an ĂŹre cho mòr is nach bi cuimhne gu leòr agam air an frithealaiche. Agus an uairsin tuitidh am frithealaiche a-steach gu OOM nuair a thèid e còmhla. A bharrachd air an sin, is urrainn dhomh am mĂšthadh a chuir dheth, ach chan eil Merji ann tuilleadh.
Tha fios agad, nuair a thèid an aonachadh, cha tuit am frithealaiche a-steach do OOM, oir nuair a thèid an aonachadh, cha tèid an uiread de RAM a chleachdadh ach airson aon raon beag de dhĂ ta. Mar sin bidh a h-uile dad gu math ge bith dè an ĂŹre de dhĂ ta a th âann.
Vladimir Kolobaev: Gu math. An seo tha a âmhòmaid cho mòr is gun do luchdaich mi sĂŹos dreach Ăšr dhomh fhĂŹn Ă s deidh aâ bhiast a chĂ radh, agus air bòrd eile, fear nas lugha, far a bheil mòran earrannan, rinn mi an aon obair. Agus rè an aonaidh, chaidh timcheall air 100 GB de RAM a losgadh air an fhrithealaiche. Bha 150 agam, 100 air ithe, agus uinneag 50 GB air fhĂ gail, agus mar sin cha do thuit mi a-steach do OOM.
Dè a tha gam dhĂŹon an-drĂ sta bho bhith aâ tuiteam a-steach do OOM ma bhios e dha-rĂŹribh ag ithe 100 GB de RAM? Dè a nĂŹ thu ma ruitheas an RAM air na h-aonaidhean a-mach gu h-obann?
Alexei Milovidov: Tha an leithid de dhuilgheadas ann nach eil caitheamh RAM gu sònraichte airson aonachadh cuingealaichte. Agus is e an dĂ rna duilgheadas ma chaidh co-aonadh de sheòrsa air choreigin a shònrachadh, feumaidh e a bhith air a chuir gu bĂ s leis gu bheil e clĂ raichte sa log ath-riochdachadh. Is e an log ath-riochdachadh na gnĂŹomhan a dhâ fheumar gus am mac-samhail a thoirt gu staid chunbhalach. Mura dèan thu lĂ imhseachadh lĂ imhe a chuireas air ais an loga mac-samhail seo, feumaidh an aonadh a bhith air a dhèanamh aon dòigh no dòigh eile.
Gu dearbh, cha bhiodh e iomarcach cuingealachadh RAM a bhith âdĂŹreach gun fhiosâ aâ dĂŹon an aghaidh OOM. Cha chuidich e an aonachadh gus a chrĂŹochnachadh, tòisichidh e a-rithist, ruigidh e stairsneach, tilg eisgeachd, agus an uairsin tòisichidh e a-rithist - cha tig dad math Ă s. Ach ann am prionnsabal, bhiodh e feumail an cuingealachadh seo a thoirt a-steach.
Ciamar a thèid an draibhear Golang airson ClickHouse a leasachadh?
Tha an drà ibhear Golang, a chaidh a sgrÏobhadh le Kirill Shvakov, a-nis a 'faighinn taic oifigeil bho sgioba ClickHouse. Tha e , tha e nis mòr agus fÏor.
Nòta beag. Tha stòr iongantach agus grĂ dhach de chruthan Ă bhaisteach de òrdugh gun chrĂŹoch - is e seo Vertica. Tha an draibhear python oifigeil aca fhèin cuideachd, a tha aâ faighinn taic bho luchd-leasachaidh Vertica. Agus grunn thursan thachair e gu robh na dreachan stòraidh agus na dreachan draibhear gu math eadar-dhealaichte, agus stad an draibhear ag obair aig Ă m air choreigin. Agus an dĂ rna puing. Tha taic don draibhear oifigeil seo, tha e coltach riumsa, air a dhèanamh leis an t-siostam ânippleâ - bidh thu aâ sgrĂŹobhadh cĂšis dhaibh, agus bidh e an crochadh gu brĂ th.
Tha dĂ cheist agam. A-nis is e draibhear Kirill's Golang cha mhòr an dòigh Ă bhaisteach air conaltradh bho Golang le ClickHouse. Mura h-eil cuideigin fhathast aâ conaltradh tron ââeadar-aghaidh http oir is toil leis e mar sin. Ciamar a thèid leasachadh an drĂ ibhear seo air adhart? Am bi e air a shioncronachadh le atharrachaidhean briste sam bith san stòr fhèin? Agus dè an dòigh-obrach airson beachdachadh air cĂšis?
Kirill Shvakov: Is e aâ chiad fhear mar a tha a h-uile cĂ il air a chuir air dòigh gu biĂšrocratach. Cha deach bruidhinn air aâ phuing seo, agus mar sin chan eil dad agam ri fhreagairt.
Airson a 'cheist a fhreagairt mun chÚis, feumaidh sinn beagan eachdraidh an drà ibhear. Bha mi ag obair airson companaidh aig an robh tòrr dà ta. B 'e snÏomhadair sanasachd a bh' ann le à ireamh mhòr de thachartasan a dh'fheumadh a bhith air an stòradh an à iteigin. Agus aig à m air choreigin nochd ClickHouse. LÏon sinn le dà ta e, agus an toiseach bha a h-uile dad gu math, ach an uairsin thuit ClickHouse. Aig an à m sin cho-dhÚin sinn nach robh feum againn air.
Bliadhna Ă s deidh sin, thill sinn chun bheachd a bhith a 'cleachdadh ClickHouse, agus dh'fheumadh sinn dĂ ta a sgrĂŹobhadh an sin dòigh air choireigin. Bâ e seo an teachdaireachd tòiseachaidh: tha am bathar-cruaidh gu math lag, chan eil mòran ghoireasan ann. Ach bha sinn an-còmhnaidh ag obair mar seo, agus mar sin choimhead sinn a dhâ ionnsaigh a âphròtacal dĂšthchasach.
Leis gu robh sinn ag obair ann an Go, bha e soilleir gu robh feum againn air draibhear Go. Rinn mi e cha mhòr lĂ n-Ăšine - bâ e an obair obrach agam a bhâ ann. Thug sinn gu ĂŹre sònraichte e, agus ann am prionnsapal cha robh duine aâ gabhail ris gum biodh duine eile ach sinne ga chleachdadh. An uairsin thĂ inig CloudFlare leis an aon dhuilgheadas, agus airson Ăšine bha sinn ag obair còmhla riutha gu math rèidh, leis gu robh na h-aon ghnĂŹomhan aca. A bharrachd air an sin, rinn sinn seo an dĂ chuid ann an ClickHouse sinn fhĂŹn agus anns an draibhear.
Aig Ă m air choreigin, cha do stad mi ga dhèanamh, oir dh'atharraich mo ghnĂŹomhachd a thaobh ClickHouse agus obair beagan. Mar sin chan eil cĂšisean dĂšinte. Bho Ă m gu Ă m, bidh daoine a dh âfheumas rudeigin iad fhèin aâ gealltainn don stòr. An uairsin bidh mi aâ coimhead air an iarrtas tarraing agus uaireannan bidh mi eadhon aâ deasachadh rudeigin mi-fhĂŹn, ach is ann ainneamh a thachras seo.
Tha mi airson tilleadh chun an driver. O chionn grunn bhliadhnaichean, nuair a thòisich an rud gu lèir seo, bha ClickHouse cuideachd eadar-dhealaichte agus le comasan eadar-dhealaichte. A-nis tha tuigse againn air mar as urrainn dhut an draibhear ath-dhèanamh gus am bi e ag obair gu math. Ma thachras seo, bidh dreach 2 neo-fhreagarrach ann an suidheachadh sam bith air sgà th na crutches cruinnichte.
Chan eil fios agam ciamar a chuireas mi aâ chĂšis seo air dòigh. Chan eil mòran Ăšine agam fhĂŹn. Ma chuireas cuid de dhaoine crĂŹoch air an draibhear, is urrainn dhomh an cuideachadh agus innse dhaibh dè a nĂŹ iad. Ach cha deach beachdachadh fhathast air com-pĂ irteachadh gnĂŹomhach Yandex ann an leasachadh a âphròiseict.
Alexei Milovidov: Gu dearbh, chan eil biurocrasaidh sam bith ann mu na draibhearan sin fhathast. Is e an aon rud gu bheil iad air an cur a-steach gu buidheann oifigeil, is e sin, tha an draibhear seo air aithneachadh mar am fuasgladh oifigeil bunaiteach airson Go. Tha cuid de dhraibhearan eile ann, ach thig iad air leth.
Chan eil leasachadh taobh a-staigh sam bith againn airson na draibhearan sin. Is e aâ cheist an urrainn dhuinn neach fa-leth fhastadh, chan ann airson an draibhear sònraichte seo, ach airson a h-uile draibhear coimhearsnachd a leasachadh, no an lorg sinn cuideigin bhon taobh a-muigh.
Cha luchdaich am faclair taobh a-muigh às deidh ath-thòiseachadh leis an t-suidheachadh lazy_load air a chomasachadh. Dè a nÏ thu?
Tha an suidheachadh lazy_load air a chur an comas, agus an dèidh dhan fhrithealaiche ath-thòiseachadh, cha bhith am faclair a' luchdachadh leis fhèin. Thèid a thogail dĂŹreach Ă s deidh don neach-cleachdaidh am faclair seo fhaighinn. Agus aâ chiad uair a gheibh mi cothrom air, tha e aâ toirt mearachd. A bheil e comasach dòigh air choireigin faclairean a luchdachadh gu fèin-ghluasadach aâ cleachdadh ClickHouse, no am feum thu smachd a chumail air cho deònach sa tha iad thu fhèin gus nach faigh luchd-cleachdaidh mearachdan?
Is dòcha gu bheil seann dreach againn de ClickHouse, agus mar sin cha deach am faclair a luchdachadh gu fèin-obrachail. Am faodadh seo a bhith mar sin?
An toiseach, faodar faclairean a luchdachadh le bhith aâ cleachdadh ceist Faclairean siostam ath-luchdaich. San dĂ rna h-Ă ite, a thaobh mearachd - ma tha am faclair air a luchdachadh mar-thĂ , obraichidh na ceistean stèidhichte air an dĂ ta a chaidh a luchdachadh. Mura h-eil am faclair air a luchdachadh fhathast, thèid a luchdachadh gu dĂŹreach rè an iarrtais.
Chan eil seo gu math goireasach airson faclairean trom. Mar eisimpleir, feumaidh tu millean sreath a tharraing bho MySQL. Bidh cuideigin aâ dèanamh taghadh sĂŹmplidh, ach bidh an taghadh seo aâ feitheamh ris na h-aon mhillean sreath. Tha dĂ fhuasgladh an seo. Is e aâ chiad fhear lazy_load a chuir dheth. San dĂ rna h-Ă ite, nuair a bhios am frithealaiche suas, mus cuir thu an luchd air, dèan Am faclair siostam ath-luchdaich neo dĂŹreach dèan ceist a chleachdas faclair. An uairsin thèid am faclair a luchdachadh. Feumaidh tu smachd a chumail air na tha ri fhaighinn de fhaclairean leis an t-suidheachadh lazy_load air a chomasachadh, oir cha bhith ClickHouse gan luchdachadh gu fèin-ghluasadach.
Is e am freagairt don cheist mu dheireadh an dĂ rna cuid gu bheil an dreach sean no feumar a dhĂŹ-bhugachadh.
Dè a nĂŹ thu leis nach bi faclairean ath-luchdachadh an t-siostaim aâ luchdachadh gin den iomadh faclair ma thuiteas co-dhiĂš aon dhiubh le mearachd?
Tha ceist eile ann mu fhaclairean ath-luchdachadh siostam. Tha dĂ fhaclair againn - chan eil aon air a luchdachadh, tha an dĂ rna fear air a luchdachadh. Anns aâ chĂšis seo, cha bhith faclairean ath-luchdachadh an t-siostaim aâ luchdachadh faclair sam bith, agus feumaidh tu fear sònraichte a luchdachadh leis an ainm aâ cleachdadh faclair ath-luchdachadh an t-siostaim. A bheil seo cuideachd co-cheangailte ris an tionndadh ClickHouse?
Tha mi airson do dhèanamh toilichte. Bha an giĂšlan seo ag atharrachadh. Tha seo aâ ciallachadh ma dhâ Ăšraicheas tu ClickHouse, atharraichidh e cuideachd. Mura h-eil thu toilichte leis a 'ghiĂšlan lĂ ithreach agad Faclairean siostam ath-luchdaich, Ăšrachadh, agus tha sinn an dòchas gun atharraich e airson na bâ fheĂ rr.
A bheil dòigh ann mion-fhiosrachadh a rèiteachadh ann an config ClickHouse, ach gun a bhith gan taisbeanadh gun fhios nach bi mearachdan ann?
Tha an ath cheist mu mhearachdan co-cheangailte ris an fhaclair, is e sin mion-fhiosrachadh. Tha sinn air mion-fhiosrachadh aâ cheangail a shònrachadh ann an config ClickHouse airson an fhaclair, agus ma tha mearachd ann, gheibh sinn am mion-fhiosrachadh agus am facal-faire seo mar fhreagairt.
Dhâ fhuasgail sinn aâ mhearachd seo le bhith aâ cur mion-fhiosrachadh ri rèiteachadh draibhear ODBC. A bheil dòigh sam bith air am mion-fhiosrachadh a rèiteachadh ann an config ClickHouse, ach gun a bhith aâ sealltainn am mion-fhiosrachadh sin gun fhios nach bi mearachdan ann?
Is e am fÏor fhuasgladh an seo na teisteanasan sin a shònrachadh ann an odbc.ini, agus ann an ClickHouse fhèin sònraich dÏreach Ainm Stòr Dà ta ODBC. Cha tachair seo airson tobraichean faclair eile - an dà rna cuid airson an fhaclair le MySQL, no an fheadhainn eile, cha bu chòir dhut am facal-faire fhaicinn nuair a gheibh thu teachdaireachd-mearachd. Airson ODBC, seallaidh mi cuideachd - ma tha e ann, chan fheum thu ach a thoirt air falbh.
Bònas: cÚl-fhiosrachadh airson Zoom bho chruinneachaidhean
Le bhith aâ cliogadh air an dealbh, fosglaidh cĂšl-fhiosrachadh bonus bho na cruinneachaidhean dha na leughadairean as seasmhaiche. Chuir sinn a-mach an teine ââââcòmhla ri suaichnean teicneòlais Avito, bidh sinn aâ bruidhinn ri co-obraichean bho rĂšm rianadair an t-siostaim no cluba coimpiutair na seann-sgoile, agus bidh sinn aâ cumail choinneamhan lĂ itheil fon drochaid an aghaidh cĂšl-raon graffiti.
Source: www.habr.com
