
A dh 'aindeoin gu bheil tòrr dĂ ta ann a-nis cha mhòr anns a h-uile Ă ite, tha stòran-dĂ ta anailis fhathast gu math annasach. Chan eil mòran eòlach orra agus nas miosa buileach comasach air an cleachdadh gu h-èifeachdach. Bidh mòran aâ leantainn orra âag ithe cactusâ le MySQL no PostgreSQL, a tha air an dealbhadh airson suidheachaidhean eile, aâ fulang le NoSQL, no aâ pĂ igheadh ââcus airson fuasglaidhean malairteach. Bidh ClickHouse ag atharrachadh riaghailtean aâ gheama agus aâ lughdachadh gu mòr an stairsneach airson a dhol a-steach do shaoghal DBMS anailiseach.
Aithisg bho BackEnd Conf 2018 agus tha e air fhoillseachadh le cead bhon neach-labhairt.


Cò mise agus carson a tha mi aâ bruidhinn mu dheidhinn ClickHouse? Tha mi nam stiĂširiche leasachaidh aig LifeStreet, a bhios aâ cleachdadh ClickHouse. Cuideachd, is mise am fear a stèidhich Altinity. Tha e na chom-pĂ irtiche Yandex a bhios aâ brosnachadh ClickHouse agus aâ cuideachadh Yandex gus ClickHouse a dhèanamh nas soirbheachaile. Cuideachd deiseil airson eòlas a cho-roinn mu ClickHouse.

Agus chan e brĂ thair Petya Zaitsev a thâ annam. Bidh mi tric aâ faighneachd mu dheidhinn seo. Chan e, chan e brĂ ithrean a thâ annainn.

âTha fios aig a h-uile duineâ gu bheil ClickHouse:
- Gu math luath,
- Gu math comhfhurtail
- Air a chleachdadh ann an Yandex.
Tha fios beagan nas lugha anns na companaidhean agus mar a thèid a chleachdadh.

Innsidh mi dhut carson, cà ite agus ciamar a thèid ClickHouse a chleachdadh, ach a-mhà in Yandex.
Innsidh mi dhut mar a tha gnÏomhan sònraichte air am fuasgladh le cuideachadh bho ClickHouse ann an diofar chompanaidhean, dè na h-innealan ClickHouse as urrainn dhut a chleachdadh airson do ghnÏomhan, agus mar a chaidh an cleachdadh ann an diofar chompanaidhean.
Thog mi trĂŹ eisimpleirean a sheallas ClickHouse bho dhiofar cheĂ rnan. Tha mi aâ smaoineachadh gum bi e inntinneach.

Is e aâ chiad cheist: âCarson a tha feum againn air ClickHouse?â. Tha e coltach gur e ceist gu math follaiseach a thâ ann, ach tha barrachd air aon fhreagairt ann.

- Tha a 'chiad fhreagairt airson coileanadh. Tha ClickHouse gu math luath. Tha Analytics air ClickHouse cuideachd gu math luath. Faodar a chleachdadh gu tric far a bheil rudeigin eile gu math slaodach no gu math dona.
- Is e an dĂ rna freagairt cosgais. Agus an toiseach, cosgais sgèileadh. Mar eisimpleir, tha Vertica na stòr-dĂ ta fĂŹor mhath. Bidh e ag obair glè mhath mura h-eil tòrr terabytes de dhĂ ta agad. Ach nuair a thig e gu ceudan de terabytes no petabytes, tha cosgais cead agus taic aâ dol a-steach gu ĂŹre gu math mòr. Agus tha e daor. Agus tha ClickHouse an-asgaidh.
- Is e an treas freagairt cosgais obrachaidh. Is e dòigh-obrach beagan eadar-dhealaichte a tha seo. Tha RedShift na dheagh analog. Air RedShift, faodaidh tu co-dhÚnadh a dhèanamh gu math luath. Obraichidh e gu math, ach aig an aon à m, gach uair a thÏde, a h-uile latha, agus a h-uile mÏos, pà ighidh tu Amazon gu math daor, oir is e seirbheis gu math daor a tha seo. Google BigQuery cuideachd. Ma chleachd cuideigin e, tha fios aige gum faod thu grunn iarrtasan a ruith agus bile fhaighinn airson ceudan dolar gu h-obann.
Chan eil na duilgheadasan sin aig ClickHouse.

CĂ ite a bheil ClickHouse air a chleachdadh a-nis? A bharrachd air Yandex, tha ClickHouse air a chleachdadh ann an grunn ghnĂŹomhachasan agus chompanaidhean.
- An toiseach, is e seo mion-sgrĂšdadh tagradh lĂŹn, ie is e cĂšis cleachdaidh a tha seo a thĂ inig bho Yandex.
- Bidh mòran de chompanaidhean AdTech aâ cleachdadh ClickHouse.
- Iomadh companaidh a dhâ fheumas sgrĂšdadh a dhèanamh air logaichean malairt bho dhiofar stòran.
- Bidh grunn chompanaidhean aâ cleachdadh ClickHouse gus sĂšil a chumail air logaichean tèarainteachd. Bidh iad gan luchdachadh suas gu ClickHouse, aâ dèanamh aithisgean, agus aâ faighinn na toraidhean a tha a dhĂŹth orra.
- Tha companaidhean aâ tòiseachadh ga chleachdadh ann am mion-sgrĂšdadh ionmhais, i.e. mean air mhean tha gnĂŹomhachasan mòra aâ tighinn faisg air ClickHouse.
- sgòthan. Ma leanas cuideigin ClickHouse, is dòcha gu bheil iad air ainm aâ chompanaidh seo a chluinntinn. 'S e seo aon den fheadhainn a tha air leth cudromach bhon choimhearsnachd. Agus tha fĂŹor dhroch stĂ ladh ClickHouse aca. Mar eisimpleir, rinn iad Kafka Engine airson ClickHouse.
- Thòisich companaidhean cian-conaltraidh aâ cleachdadh. Bidh grunn chompanaidhean aâ cleachdadh ClickHouse an dĂ rna cuid mar dhearbhadh air bun-bheachd no mar-thĂ ann an riochdachadh.
- Bidh aon chompanaidh aâ cleachdadh ClickHouse gus sĂšil a chumail air pròiseasan toraidh. Bidh iad aâ dèanamh deuchainn air microcircuits, aâ cuir dheth dòrlach de pharamadairean, tha timcheall air 2 feart ann. Agus an uairsin bidh iad aâ sgrĂšdadh a bheil an geama math no dona.
- Mion-sgrĂšdadh blockchain. Tha leithid de chompanaidh Ruiseanach ann mar Bloxy.info. Is e seo mion-sgrĂšdadh air an lĂŹonra ethereum. Rinn iad seo cuideachd air ClickHouse.

Agus chan eil meud cudromach. Tha mòran chompanaidhean ann a bhios aâ cleachdadh aon fhrithealaiche bheag, agus tha e aâ fuasgladh an duilgheadasan. Agus bidh barrachd chompanaidhean aâ cleachdadh cruinneachaidhean mòra de mhòran frithealaichean no dusanan de fhrithealaichean.
Agus ma choimheadas tu air na clĂ ran, an uairsin:
- Yandex: 500+ frithealaichean, bidh iad aâ stòradh 25 billean clĂ r gach latha an sin.
- LifeStreet: 60 frithealaiche, timcheall air 75 billean clĂ r gach latha. Tha nas lugha de luchd-frithealaidh ann, barrachd chlĂ ran na ann an Yandex.
- CloudFlare: 36 frithealaichean, bidh iad aâ sĂ bhaladh 200 billean clĂ r gach latha. Tha eadhon nas lugha de luchd-frithealaidh aca agus bidh iad aâ stòradh eadhon barrachd dĂ ta.
- Bloomberg: 102 frithealaiche, timcheall air trillean inntrigeadh gach latha. Sealbhaiche clĂ r airson inntrigidhean.

A thaobh sgĂŹrean, tha seo cuideachd tòrr. Tha am mapa seo an seo aâ sealltainn mapa teas de far a bheil ClickHouse ga chleachdadh air an t-saoghal. Tha an Ruis, SĂŹona, Ameireagaidh aâ seasamh a-mach gu soilleir an seo. Chan eil mòran dhĂšthchannan Eòrpach ann. Agus tha 4 buidhnean ann.
Is e mion-sgrĂšdadh coimeasach a tha seo, chan fheumar coimhead airson figearan iomlan. Is e seo mion-sgrĂšdadh air luchd-tadhail a leugh stuthan Beurla air lĂ rach-lĂŹn Altinity, leis nach eil feadhainn le Ruiseanach ann. Agus an Ruis, an UcrĂ in, Belarus, ie am pĂ irt Ruiseanach den choimhearsnachd, is iad sin an luchd-cleachdaidh as lĂŹonmhoire. An uairsin thig na SA agus Canada. Tha SĂŹona aâ dol suas gu mòr. Cha mhòr nach robh SĂŹona an sin o chionn sia mĂŹosan, a-nis tha SĂŹona air a dhol seachad air an Roinn Eòrpa mu thrĂ th agus a âsĂŹor fhĂ s. Chan eil an t-seann Roinn Eòrpa fada air dheireadh cuideachd, agus tha an stiĂširiche ann an cleachdadh ClickHouse, gu h-annasach gu leòr, san Fhraing.

Carson a tha mi ag innse seo uile? Gus sealltainn gu bheil ClickHouse gu bhith na fhuasgladh Ă bhaisteach airson mion-sgrĂšdadh dĂ ta mòr agus gu bheil e air a chleachdadh ann an iomadh Ă ite mu thrĂ th. Ma chleachdas tu e, tha thu anns aâ ghluasad cheart. Mura h-eil thu ga chleachdadh fhathast, chan urrainn dhut a bhith fo eagal gum bi thu air fhĂ gail leat fhèin agus nach cuidich duine thu, oir tha mòran ga dhèanamh mar-thĂ .

Tha iad sin nan eisimpleirean de fhĂŹor chleachdadh ClickHouse ann an grunn chompanaidhean.
- Is e aâ chiad eisimpleir lĂŹonra sanasachd: imrich bho Vertica gu ClickHouse. Agus tha fios agam air beagan chompanaidhean a tha air gluasad bho Vertica no a tha an-drĂ sta ag atharrachadh.
- Is e an dà rna eisimpleir stòradh malairt air ClickHouse. Seo eisimpleir a chaidh a thogail air antipatterns. Tha a h-uile dad nach bu chòir a dhèanamh ann an ClickHouse air comhairle luchd-leasachaidh air a dhèanamh an seo. Agus tha e air a dhèanamh cho èifeachdach is gu bheil e ag obair. Agus bidh e ag obair mòran nas fheà rr na am fuasgladh malairt à bhaisteach.
- Tha an treas eisimpleir air a chuairteachadh coimpiutaireachd air ClickHouse. Bha ceist ann mu mar as urrainnear ClickHouse fhilleadh a-steach do eag-shiostam Hadoop. Seallaidh mi eisimpleir de mar a rinn companaidh rudeigin coltach ri mapa lughdachadh inneal air ClickHouse, aâ cumail sĂšil air sgĂŹreachadh dĂ ta, msaa, gus gnĂŹomh nach eil cho beag a thomhas.

- Tha LifeStreet na chompanaidh Ad Tech aig a bheil an teicneòlas gu lèir a thig an cois lÏonra sanasachd.
- Tha i an sàs ann an optimization sanasachd, tagraidhean prògramaichte.
- Tòrr dà ta: timcheall air 10 billean tachartas gach latha. Aig an aon à m, faodar tachartasan an sin a roinn ann an grunn fo-thachartasan.
- Tha mòran de luchd-dèiligidh an dà ta seo, agus chan e a-mhà in daoine a tha seo, mòran a bharrachd - tha iad sin nan diofar algorithms a tha an sàs ann an tagraidhean prògram.

Tha aâ chompanaidh air slighe fhada agus dhromach a thighinn. Agus bhruidhinn mi mu dheidhinn air HighLoad. An toiseach, ghluais LifeStreet bho MySQL (le stad goirid aig Oracle) gu Vertica. Agus gheibh thu sgeulachd mu dheidhinn.
Agus bha a h-uile dad fĂŹor mhath, ach dh'fhĂ s e soilleir gu luath gu bheil an dĂ ta a 'fĂ s agus gu bheil Vertica daor. Mar sin, chaidh diofar roghainnean eile a shireadh. Tha cuid dhiubh air an liostadh an seo. Agus gu dearbh, rinn sinn dearbhadh air bun-bheachd no uaireannan deuchainn dèanadais air cha mhòr a h-uile stòr-dĂ ta a bha rim faighinn air aâ mhargaidh bhon 13mh gu an 16mh bliadhna agus a bha cha mhòr iomchaidh a thaobh comas-gnĂŹomh. Agus bhruidhinn mi cuideachd mu chuid dhiubh air HighLoad.

B 'e an obair imrich bho Vertica sa chiad Ă ite, oir dh'fhĂ s an dĂ ta. Agus dhâ fhĂ s iad gu mòr thar nam bliadhnaichean. An uairsin chaidh iad air an sgeilp, ach a dh'aindeoin sin. Agus le ro-innse an fhĂ s seo, riatanasan gnĂŹomhachais airson an ĂŹre de dhĂ ta air am feumadh seòrsa de mhion-sgrĂšdadh a dhèanamh, bha e soilleir gum biodh petabytes air an deasbad a dhâ aithghearr. Agus tha pĂ igheadh ââââairson petabytes gu math daor mar-thĂ , agus mar sin bha sinn aâ coimhead airson Ă ite eile airson a dhol.

Cà ite a dhol? Agus airson Úine fhada cha robh e soilleir cà ite an tèid e, oir air an aon là imh tha stòran-dà ta malairteach, tha e coltach gu bheil iad ag obair gu math. Bidh cuid ag obair cha mhòr cho math ri Vertica, cuid nas miosa. Ach tha iad uile daor, chan eil dad nas saoire agus cha b 'urrainnear a lorg nas fheà rr.
Air an là imh eile, tha fuasglaidhean stòr fosgailte ann, nach eil gu math iomadach, ie airson anailisean, faodar an cunntadh air na corragan. Agus tha iad saor no saor, ach slaodach. Agus gu tric chan eil an comas-gnÏomh riatanach agus feumail aca.
Agus cha robh dad ann airson am math a tha ann an stòran-dà ta malairteach a chur còmhla agus a h-uile dad an-asgaidh a tha ann an stòr fosgailte.

Cha robh dad ann gus, ris nach robh dĂšil, tharraing Yandex ClickHouse a-mach, mar dhraoidh bho ad, mar choineanach. Agus b 'e co-dhĂšnadh ris nach robh dĂšil, tha iad fhathast a' faighneachd na ceiste: "Carson?", Ach a dh'aindeoin sin.

Agus anns a 'bhad as t-samhradh 2016, thòisich sinn a' coimhead air dè a th 'ann an ClickHouse. Agus thionndaidh e a-mach gum faod e uaireannan a bhith nas luaithe na Vertica. Rinn sinn deuchainn air diofar shuidheachaidhean air diofar cheistean. Agus mura do chleachd aâ cheist ach aon bhòrd, is e sin, gun cheangal sam bith (join), bha ClickHouse dĂ uair cho luath ri Vertica.
Cha robh mi ro leisg agus choimhead mi air deuchainnean Yandex an latha eile. Tha e an aon rud an sin: tha ClickHouse dĂ uair cho luath ri Vertica, agus mar sin bidh iad gu tric aâ bruidhinn mu dheidhinn.
Ach ma tha ceanglaichean anns na ceistean, chan eil a h-uile dad a 'tionndadh a-mach gu tur gun teagamh. Agus faodaidh ClickHouse a bhith dĂ uair cho slaodach ri Vertica. Agus ma nĂŹ thu beagan ceartachadh air an iarrtas agus ath-sgrĂŹobhadh, tha iad timcheall air co-ionann. Chan eil sin dona. Agus an-asgaidh.

Agus Ă s deidh dha toraidhean na deuchainn fhaighinn, agus coimhead air bho dhiofar cheĂ rnan, chaidh LifeStreet gu ClickHouse.

Seo an 16mh bliadhna, tha mi gad chuimhneachadh. Bha e coltach ri fealla-dhà mu luchainn a bha ag èigheach agus gam priobadh fhèin, ach a lean orra ag ithe an cactus. Agus chaidh seo a mhÏneachadh gu mionaideach, tha bhidio ann mu dheidhinn seo, msaa.

Mar sin, cha bhith mi a 'bruidhinn mu dheidhinn gu mionaideach, cha bhith mi a' bruidhinn ach mu na toraidhean agus beagan rudan inntinneach air nach do bhruidhinn mi an uairsin.
Is iad na toraidhean:
- Imrich soirbheachail agus còrr is bliadhna tha an siostam mar-thà ag obair ann an riochdachadh.
- Tha cinneasachd agus sĂšbailteachd air Ă rdachadh. De na 10 billean clĂ r a bâ urrainn dhuinn a stòradh gach latha agus an uairsin airson Ăšine ghoirid, tha LifeStreet a-nis aâ stòradh 75 billean clĂ r gach latha agus is urrainn dhuinn seo a dhèanamh airson 3 mĂŹosan no barrachd. Ma tha thu aâ cunntadh aig an ĂŹre as Ă irde, tha seo suas ri millean tachartas gach diog. Bidh còrr air millean ceist SQL gach latha aâ ruighinn an t-siostam seo, aâ mhòr-chuid bho dhiofar innealan-fuadain.
- A dhâ aindeoin gun deach barrachd luchd-frithealaidh a chleachdadh airson ClickHouse na airson Vertica, shĂ bhail iad air bathar-cruaidh cuideachd, leis gun deach diosgan SAS caran daor a chleachdadh ann an Vertica. Chleachd ClickHouse SATA. Agus carson? Leis gu bheil cuir a-steach ann an Vertica sioncronaich. Agus tha sioncronadh ag iarraidh nach bi na diosgan a 'slaodadh cus, agus cuideachd nach bi an lĂŹonra a' slaodadh cus, is e sin, obrachadh caran daor. Agus ann an ClickHouse tha cuir a-steach asyncronach. A bharrachd air an sin, faodaidh tu an-còmhnaidh a h-uile dad a sgrĂŹobhadh gu h-ionadail, chan eil cosgaisean a bharrachd ann airson seo, agus mar sin faodar dĂ ta a chuir a-steach gu ClickHouse fada nas luaithe na ann an Vertika, eadhon air draibhearan nas slaodaiche. Agus tha leughadh mu dheidhinn an aon rud. Leughadh air SATA, ma tha iad ann an RAID, tha seo uile luath gu leòr.
- Gun a bhith cuibhrichte le cead, ie 3 petabytes de dhĂ ta ann an 60 frithealaiche (tha 20 frithealaiche mar aon mac-samhail) agus 6 trillean clĂ r ann am fĂŹrinnean agus cruinneachaidhean. Cha bâ urrainn dad mar seo a thoirt seachad aig Vertica.

Tionndaidhidh mi a-nis gu rudan practaigeach san eisimpleir seo.
- Tha aâ chiad fhear na sgeama èifeachdach. Tha tòrr an urra ris an sgeama.
- Is e an dà rna fear gineadh SQL èifeachdach.

Is e ceist Ă bhaisteach OLAP taghadh. Bidh cuid de na colbhan aâ dol gu buidheann le, cuid de na colbhan aâ dol gu gnĂŹomhan iomlan. Tha Ă ite ann, a dh'fhaodar a riochdachadh mar sliseag de chiĂšb. Faodar smaoineachadh air aâ bhuidheann gu lèir mar ro-mheasadh. Agus is ann air sgĂ th sin a chanar mion-sgrĂšdadh dĂ ta multivariate ris.

Agus gu tric tha seo air a mhodail ann an cruth sgeama rionnagan, nuair a tha prĂŹomh fhĂŹrinn agus feartan na fĂŹrinn seo air na taobhan, air na ghathan.

Agus a thaobh dealbhadh corporra, mar a tha e a 'freagairt air a' bhòrd, mar as trice bidh iad a 'dèanamh riochdachadh Ă bhaisteach. Faodaidh tu dĂŹ-normalachadh, ach tha e daor air diosc agus chan eil e gu math èifeachdach air ceistean. Mar sin, mar as trice bidh iad aâ dèanamh riochdachadh Ă bhaisteach, i.e. clĂ r fiosrachaidh agus mòran, mòran chlĂ ran tomhasan.
Ach chan eil e ag obair gu math ann an ClickHouse. Tha dĂ adhbhar ann:
- Tha aâ chiad fhear air sgĂ th nach eil ceanglaichean fĂŹor mhath aig ClickHouse, i.e. tha ceanglaichean ann, ach tha iad dona. Fhad 'sa tha e dona.
- Is e an dĂ rna fear nach eil na clĂ ran air an Ăšrachadh. Mar as trice anns na truinnsearan sin, a tha timcheall air aâ chuairt-rionnag, feumar rudeigin atharrachadh. Mar eisimpleir, ainm teachdaiche, ainm companaidh, msaa. Agus chan eil e ag obair.
Agus tha slighe a-mach Ă seo ann an ClickHouse. eadhon dhĂ :
- Is e aâ chiad fhear cleachdadh fhaclairean. Is e Faclairean Taobh a-muigh a chuidicheas 99% gus fuasgladh fhaighinn air an duilgheadas leis an sgeama rionnag, le Ăšrachaidhean is mar sin air adhart.
- Is e an dĂ rna fear a bhith a 'cleachdadh arrays. Bidh arrays cuideachd aâ cuideachadh le bhith aâ faighinn cuidhteas joints agus duilgheadasan le gnĂ thachadh.

- Chan eil feum air ballrachd.
- Ărdachadh. Bhon MhĂ rt 2018, tha cothrom gun sgrĂŹobhainn air nochdadh (chan fhaigh thu seo anns na sgrĂŹobhainnean) gus faclairean Ăšrachadh gu ĂŹre, i.e. na h-inntrigidhean sin a tha air atharrachadh. Gu practaigeach, tha e coltach ri bòrd.
- An-còmhnaidh mar chuimhneachan, mar sin bidh e aâ tighinn còmhla ri faclair ag obair nas luaithe na bhiodh e na bhòrd a tha air diosc agus chan eil e na fhĂŹrinn fhathast gu bheil e san tasgadan, is dòcha nach eil.

- Chan fheum thu ceanglaichean idir.
- Is e riochdachadh teann 1-gu-mòran a tha seo.
- Agus nam bheachd-sa, tha arrays air an dèanamh airson geeks. Is iad sin gnÏomhan lambda agus mar sin air adhart.
Chan eil seo airson faclan dearga. Is e gnÏomh fÏor chumhachdach a tha seo a leigeas leat mòran rudan a dhèanamh ann an dòigh gu math sÏmplidh agus eireachdail.

Eisimpleirean à bhaisteach a chuidicheas le bhith a 'fuasgladh arrays. Tha na h-eisimpleirean seo sÏmplidh agus soilleir gu leòr:
- Lorg le tagaichean. Ma tha hashtags agad an sin agus gu bheil thu airson cuid de phuist a lorg le hashtag.
- Rannsaich le paidhrichean prĂŹomh-luach. Tha cuid de fheartan ann cuideachd le luach.
- A 'stòradh liostaichean de iuchraichean a dh'fheumas tu eadar-theangachadh gu rudeigin eile.
Faodar na gnÏomhan sin uile fhuasgladh gun arrays. Faodar tagaichean a chuir ann an loidhne air choreigin agus an taghadh le abairt à bhaisteach no ann an clà r air leth, ach an uairsin feumaidh tu ceanglaichean a dhèanamh.

Agus ann an ClickHouse, chan fheum thu dad a dhèanamh, tha e gu leòr cunntas a thoirt air an t-sreath sreang airson hashtags no structar neadachaidh a dhèanamh airson prÏomh shiostaman luach.
Is dòcha nach e structar neadachaidh an t-ainm as fheà rr. Is iad seo dà raon aig a bheil pà irt cumanta san ainm agus cuid de fheartan co-cheangailte riutha.
Agus tha e gu math furasta a lorg le tag. Biodh gnĂŹomh agad has, a nĂŹ cinnteach gu bheil eileamaid san raon. A h-uile duine, lorg iad na h-inntrigidhean uile a bhuineas don cho-labhairt againn.
Tha rannsachadh le subid beagan nas iom-fhillte. Feumaidh sinn an toiseach clĂ r-amais na h-iuchrach a lorg, agus an uairsin an eileamaid a ghabhail leis aâ chlĂ r-amais seo agus dèanamh cinnteach gur e an luach seo a tha a dhĂŹth oirnn. Ach, tha e gu math sĂŹmplidh agus comhfhurtail.
An abairt chunbhalach a bu mhath leat a sgrÏobhadh nan cumadh tu e uile ann an aon loidhne, bhiodh e, an toiseach, gòrach. Agus, san dà rna à ite, dh'obraich e mòran nas fhaide na dà shreath.

Eisimpleir eile. Tha raon agad far an glèidh thu an ID. Agus faodaidh tu an eadar-theangachadh gu ainmean. GnĂŹomh arrayMap. Is e seo gnĂŹomh Ă bhaisteach lambda. Bidh thu a 'dol seachad air briathran lambda an sin. Agus tha i aâ tarraing a-mach luach an ainm airson gach ID bhon fhaclair.
Faodar rannsachadh a dhèanamh san aon dòigh. Thèid gnĂŹomh ro-innse a thoirt seachad a nĂŹ sgrĂšdadh air na tha na h-eileamaidean aâ maidseadh.

Bidh na rudan sin gu mòr aâ sĂŹmpleachadh aâ chuairt agus aâ fuasgladh dòrlach de dhuilgheadasan.
Ach is e an ath dhuilgheadas a tha romhainn, agus air am bu mhath leam iomradh a thoirt, ceistean èifeachdach.
- Chan eil dealbhaiche ceiste aig ClickHouse. Gu dearbh chan eil.
- A dh'aindeoin sin, feumar ceistean iom-fhillte a dhealbhadh fhathast. Ann an cĂšisean?
- Ma tha iomadh ceangal anns aâ cheist, còmhdaichidh tu iad ann am fo-thaghadh. Agus tha an òrdugh anns a bheil iad air an cur an gnĂŹomh cudromach.
- Agus an dà rna - ma thèid an t-iarrtas a sgaoileadh. Air sgà th 's ann an ceist sgaoilte, chan eil ach an fho-thaghadh as fhaide a-staigh air a sgaoileadh, agus thèid a h-uile cà il eile a chuir gu aon fhrithealaiche ris an do cheangail thu agus a chuir thu gu bàs an sin. Mar sin, ma tha thu air ceistean a sgaoileadh le mòran cheanglaichean (join), feumaidh tu an òrdugh a thaghadh.
Agus eadhon ann an cÚisean nas sÏmplidh, uaireannan tha e riatanach cuideachd obair a 'chlà r-ama a dhèanamh agus ceistean ath-sgrÏobhadh beagan.

Seo eisimpleir. Air an taobh chlĂŹ tha ceist a sheallas na 5 dĂšthchannan as fheĂ rr. Agus bheir e 2,5 diogan, nam bheachd-sa. Agus air an taobh cheart, an aon cheist, ach beagan ath-sgrĂŹobhadh. An Ă ite a bhith aâ cruinneachadh le sreang, thòisich sinn aâ cruinneachadh le iuchair (int). Agus tha e nas luaithe. Agus an uairsin cheangail sinn faclair ris an toradh. An Ă ite 2,5 diogan, bheir an t-iarrtas 1,5 diogan. Tha seo math.

Eisimpleir coltach ri ath-sgrÏobhadh sÏoltachain. Seo iarrtas airson an Ruis. Bidh e a 'ruith airson 5 diogan. Ma nÏ sinn ath-sgrÏobhadh air ann an dòigh a nÏ sinn coimeas a-rithist chan e sreang, ach à ireamhan le cuid de sheata de na h-iuchraichean sin a tha co-cheangailte ris an Ruis, bidh e fada nas luaithe.

Tha iomadh cleas mar sin ann. Agus leigidh iad leat luathachadh mòr a dhèanamh air ceistean a tha thu aâ smaoineachadh a tha aâ ruith gu luath mu thrĂ th, no, air an lĂ imh eile, aâ ruith gu slaodach. Faodar an dèanamh eadhon nas luaithe.

- An obair as Ă irde ann am modh sgaoilte.
- A 'rèiteachadh a rèir seòrsaichean as Ïsle, mar a rinn mi le ints.
- Ma tha ceangal sam bith (join), faclairean ann, tha e nas fheà rr an dèanamh mar an roghainn mu dheireadh, nuair a tha dà ta agad mu thrà th co-dhiÚ ann am pà irt, an uairsin thèid an obair ceangail no gairm fhaclair a ghairm nas lugha de thursan agus bidh e nas luaithe .
- A âcur sĂŹoltachain an Ă ite.
Tha dòighean eile ann, agus chan e dÏreach an fheadhainn a sheall mi. Agus faodaidh iad uile uaireannan luathachadh gu mòr air coileanadh cheistean.

Gluaisidh sinn air adhart chun ath eisimpleir. Companaidh X às na SA. Dè tha i a' dèanamh?
Bha obair ann:
- Ceangal far-loidhne de ghnothaichean sanasachd.
- Modaladh diofar mhodalan ceangail.

Dè an suidheachadh a thâ ann?
Bidh neach-tadhail Ă bhaisteach a 'tighinn chun lĂ raich, mar eisimpleir, 20 uair sa mhĂŹos bho shanasan eadar-dhealaichte, no dĂŹreach mar sin uaireannan a' tighinn gun shanasan sam bith, oir tha cuimhne aige air an lĂ rach seo. A 'coimhead air cuid de stuthan, gan cur anns a' bhasgaid, gan toirt a-mach Ă s a 'bhasgaid. Agus, aig a 'cheann thall, tha rudeigin a' ceannach.
Ceistean reusanta: "Cò a bu chòir pĂ igheadh ââââairson sanasachd, ma tha sin riatanach?" agus âDè an t-sanasachd a thug buaidh air, ma tha idir?â. Is e sin, carson a cheannaich e agus ciamar a gheibh thu air daoine mar an neach seo a cheannach cuideachd?
Gus an duilgheadas seo fhuasgladh, feumaidh tu na tachartasan a tha a âtachairt air an lĂ rach-lĂŹn a cheangal san dòigh cheart, is e sin, dòigh air choireigin ceangal a thogail eatorra. An uairsin thèid an cur gu DWH airson mion-sgrĂšdadh. Agus stèidhichte air an anailis seo, tog modalan de cò agus dè na sanasan a sheallas tu.

Is e malairt sanasachd seata de thachartasan cleachdaiche co-cheangailte a thòisicheas bho bhith aâ sealltainn sanas, an uairsin bidh rudeigin aâ tachairt, an uairsin is dòcha ceannach, agus an uairsin is dòcha gum bi ceannach taobh a-staigh ceannach. Mar eisimpleir, mas e tagradh gluasadach no geama gluasadach a tha seo, mar as trice thèid an tagradh a chuir a-steach an-asgaidh, agus ma thèid rudeigin a dhèanamh an sin, is dòcha gum bi feum air airgead airson seo. Agus mar as motha a chosgas neach san tagradh, is ann as luachmhoire a tha e. Ach airson seo feumaidh tu a h-uile cĂ il a cheangal.

Tha mòran mhodalan ceangail ann.
Is e an fheadhainn as mòr-chòrdte:
- Eadar-obrachadh mu dheireadh, far a bheil eadar-obrachadh an dĂ rna cuid cliog no sealladh.
- Aâ chiad eadar-obrachadh, i.e. aâ chiad rud a thug duine chun lĂ raich.
- Cothlamadh loidhneach - uile co-ionann.
- Lughdachadh.
- Agus mar sin air adhart.

Agus ciamar a bha e uile ag obair sa chiad Ă ite? Bha Runtime agus Cassandra ann. Chaidh Cassandra a chleachdadh mar stòradh malairt, i.e. bha a h-uile gnothach co-cheangailte ris air a stòradh ann. Agus nuair a thig tachartas air choireigin ann an Runtime, mar eisimpleir, aâ sealltainn duilleag air choireigin no rudeigin eile, chaidh iarrtas a chuir gu Cassandra - a bheil an leithid de dhuine ann no nach eil. An uairsin fhuaireadh na gnothaichean co-cheangailte ris. Agus chaidh an ceangal a dhèanamh.
Agus ma tha e fortanach gu bheil id malairt aig an iarrtas, tha e furasta. Ach mar as trice chan eil fortan ann. Mar sin, bha e riatanach an gnothach mu dheireadh no an gnothach a lorg leis aâ bhriogadh mu dheireadh, msaa.
Agus dhâ obraich e uile glè mhath fhad âs a bha an ceangal ris aâ bhriogadh mu dheireadh. Leis gu bheil, can, 10 millean cliog gach latha, 300 millean sa mhĂŹos, ma shuidhicheas sinn uinneag airson mĂŹos. Agus leis gu bheil e ann an Cassandra feumaidh e a bhith uile mar chuimhneachan gus ruith gu sgiobalta, oir feumaidh an Runtime freagairt gu sgiobalta, thug e timcheall air 10-15 frithealaiche.
Agus nuair a bha iad airson gnothach a cheangal ris an taisbeanadh, cha robh e cho spòrsail sa bhad. Agus carson? ChĂŹthear gum feumar 30 uair a bharrachd de thachartasan a stòradh. Agus, a rèir sin, feumaidh tu 30 uair a bharrachd frithealaichean. Agus tha e a 'tionndadh a-mach gur e seo seòrsa de fhigear reul-eòlais. Gus suas ri 500 frithealaiche a chumail gus an ceangal a dhèanamh, a dhâ aindeoin gu bheil mòran nas lugha de luchd-frithealaidh ann an Runtime, is e seo seòrsa de fhigear ceĂ rr. Agus thòisich iad air smaoineachadh dè a dhèanadh iad.

Agus chaidh sinn gu ClickHouse. Agus ciamar a nĂŹ thu e air ClickHouse? Aig a 'chiad shealladh, tha e coltach gur e seo seata de anti-pĂ train.
- Bidh an gnothach aâ fĂ s, bidh sinn aâ ceangal barrachd is barrachd thachartasan ris, ie tha e mutable, agus chan eil ClickHouse ag obair glè mhath le nithean mutable.
- Nuair a thig neach-tadhail thugainn, feumaidh sinn na gnothaichean aige a tharraing a-mach le iuchair, leis an id tadhal aige. Is e ceist puing a tha seo cuideachd, cha bhith iad aâ dèanamh sin ann an ClickHouse. Mar as trice tha sganaidhean mòra aig ClickHouse, ach an seo feumaidh sinn cuid de chlĂ ran fhaighinn. Cuideachd antipattern.
- A bharrachd air an sin, bha an gnothach ann an json, ach cha robh iad airson a ath-sgrÏobhadh, agus mar sin bha iad airson json a stòradh ann an dòigh neo-structaraichte, agus ma tha sin riatanach, rudeigin a tharraing a-mach à s. Agus tha seo cuideachd na antipattern.
Is e sin, seata de antipatterns.

Ach a dh'aindeoin sin thionndaidh e a-mach siostam a dhèanamh a dh'obraich glè mhath.
Dè chaidh a dhèanamh? Nochd ClickHouse, anns an deach logaichean a thilgeil, air an roinn ann an clĂ ran. Nochd seirbheis ainmichte a fhuair logaichean bho ClickHouse. Ăs deidh sin, airson gach inntrig, le tadhal id, fhuair mi gnothaichean a dhâ fhaodadh nach deach a phròiseasadh fhathast agus a bharrachd air dealbhan, ie gnothaichean ceangailte mar-thĂ , is e sin toradh obair roimhe. Rinn mi loidsig bhuapa mu thrĂ th, thagh mi an gnothach ceart, cheangail mi tachartasan Ăšra. ClĂ raichte a-rithist. Chaidh an log air ais gu ClickHouse, i.e. is e siostam a thâ ann an-còmhnaidh cearcallach. Agus a bharrachd air an sin, chaidh mi gu DWH airson a sgrĂšdadh an sin.
Bha e anns an fhoirm seo nach do dh'obraich e glè mhath. Agus gus a dhèanamh nas fhasa dha ClickHouse, nuair a bha iarrtas ann le tadhal id, chuir iad na h-iarrtasan sin còmhla ann am blocaichean de 1-000 ids tadhal agus tharraing iad a-mach a h-uile gnothach airson 2-000 neach. Agus an uairsin dh'obraich e uile.

Ma choimheadas tu taobh a-staigh ClickHouse, chan eil ann ach 3 prĂŹomh bhĂšird a bhios aâ frithealadh seo gu lèir.
A 'chiad chlà r anns a bheil logaichean air an luchdachadh suas, agus tha na logaichean air an luchdachadh suas cha mhòr gun a bhith a' giullachd.
An dĂ rna clĂ r. Tron t-sealladh tĂ bhachdach, bho na logaichean sin, chaidh tachartasan nach deach ainmeachadh fhathast, i.e., feadhainn gun cheangal, a bhĂŹdeadh a-mach. Agus tron âââât-sealladh susbainteach, chaidh gnothaichean a tharraing a-mach Ă s na logaichean sin gus dealbh a thogail. Is e sin, thog sealladh tĂ bhachdach sònraichte dealbh, is e sin an suidheachadh cruinnichte mu dheireadh den ghnothach.

Seo an teacsa sgrĂŹobhte ann an SQL. Bu mhath leam iomradh a thoirt air beagan rudan cudromach ann.
Is e aâ chiad rud cudromach an comas colbhan agus raointean a tharraing a-mach bho json ann an ClickHouse. Is e sin, tha cuid de dhòighean aig ClickHouse airson a bhith ag obair le json. Tha iad glè, glè prĂŹomhadail.
Leigidh visitParamExtractInt leat buadhan a thoirt a-mach Ă json, i.e. aâ chiad obraichean hit. Agus san dòigh seo faodaidh tu id malairt a tharraing a-mach no tadhal air id. An turas seo.
San dĂ rna h-Ă ite, thathas aâ cleachdadh raon toraidh duilich an seo. Dè a tha e aâ ciallachadh? Tha seo aâ ciallachadh nach urrainn dhut a chuir a-steach don bhòrd, i.e. chan eil e air a chuir a-steach, tha e air a thomhas agus air a stòradh nuair a thèid a chuir a-steach. Nuair a chuireas tu seachad, nĂŹ ClickHouse an obair dhut. Agus tha na tha a dhĂŹth ort nas fhaide air adhart air a tharraing a-mach Ă json mu thrĂ th.
Anns a 'chĂšis seo, tha sealladh tĂ thaichte airson sreathan amh. Agus tha a 'chiad bhòrd le logaichean gu math amh dĂŹreach air a chleachdadh. Agus dè tha e aâ dèanamh? An toiseach, bidh e ag atharrachadh an seòrsachadh, ie bidh an rèiteachadh a-nis aâ dol le tadhal id, oir feumaidh sinn an gnothach aige a tharraing a-mach gu sgiobalta airson neach sònraichte.
Is e an dĂ rna rud cudromach index_granularity. Ma tha thu air MergeTree fhaicinn, mar as trice tha e 8 a rèir index_granularity bunaiteach. Dè th' ann? Is e seo am paramadair gann de chlĂ r-amais. Ann an ClickHouse tha an clĂ r-amais gann, cha bhith e uair sam bith aâ clĂ r-amais a h-uile inntrig. Bidh e a 'dèanamh seo a h-uile 192. Agus tha seo math nuair a tha feum air tòrr dĂ ta a bhith air a thomhas, ach dona nuair a tha beagan, oir tha Ă rdachadh mòr ann. Agus ma lĂšghdaicheas sinn an granularity clĂ r-amais, an uairsin lughdaichidh sinn an còrr. Chan urrainnear a lughdachadh gu aon, oir is dòcha nach eil cuimhne gu leòr ann. Tha an clĂ r-amais an-còmhnaidh air a stòradh mar chuimhne.

Bidh Snapshot cuideachd aâ cleachdadh cuid de fheartan inntinneach eile ClickHouse.
An toiseach, is e AggregatingMergeTree a thâ ann. Agus stòran AggregatingMergeTree argMax, ie is e seo staid aâ ghnothaich a rèir an stampa-ama mu dheireadh. Bidh gnothaichean air an cruthachadh fad na h-Ăšine airson neach-tadhail sònraichte. Agus anns an staid mu dheireadh den ghnothach seo, chuir sinn tachartas ris agus tha stĂ it Ăšr againn. Bhuail e air ClickHouse a-rithist. Agus tro argMax anns an t-sealladh tĂ bhachdach seo, gheibh sinn an-còmhnaidh an staid lĂ ithreach.

- Tha an ceangal âdecoupledâ bhon Runtime.
- Bidh suas ri 3 billean malairt gach mÏos air an stòradh agus air an giullachd. Is e seo òrdugh meudachd nas motha na bha e ann an Cassandra, ie ann an siostam malairt à bhaisteach.
- Buidheann de luchd-frithealaidh ClickHouse 2x5. 5 frithealaichean agus tha mac-samhail aig gach frithealaiche. Tha seo eadhon nas lugha na bha e ann an Cassandra gus brÏgh stèidhichte air cliog a dhèanamh, agus an seo tha sinn stèidhichte air beachd. Is e sin, an à ite an à ireamh de luchd-frithealaidh à rdachadh 30 uair, chaidh aca air an lughdachadh.

Agus is e an eisimpleir mu dheireadh companaidh ionmhais Y, a rinn mion-sgrĂšdadh air co-dhĂ imhean atharrachaidhean ann am prĂŹsean stoc.
Agus bâ e an obair:
- Tha timcheall air 5 earrann ann.
- Tha fios air luachan gach 100 milliseconds.
- Tha an dà ta air a chruinneachadh thairis air 10 bliadhna. A rèir coltais, airson cuid de chompanaidhean barrachd, airson cuid nas lugha.
- Tha timcheall air 100 billean sreath gu h-iomlan.
Agus bha e riatanach obrachadh a-mach co-dhĂ imh nan atharrachaidhean.

Seo dĂ stoc agus na luachan aca. Ma thèid aon suas agus am fear eile suas, is e co-dhĂ imh adhartach a tha seo, ie thèid aon suas agus thèid am fear eile suas. Ma thèid aon suas, mar aig deireadh aâ ghraf, agus am fear eile aâ dol sĂŹos, is e co-dhĂ imh Ă icheil a tha seo, i.e. nuair a dhâ èiricheas aon, tuitidh an tè eile.
Le bhith aâ dèanamh anailis air na h-atharrachaidhean dha chèile sin, faodaidh duine ro-innse a dhèanamh anns aâ mhargaidh ionmhais.

Ach tha an obair duilich. Dè thathar aâ dèanamh airson seo? Tha 100 billean clĂ r againn aig a bheil: Ăšine, stoc, agus prĂŹs. Feumaidh sinn obrachadh a-mach an toiseach 100 billean uair an eadar-dhealachadh ruith bhon algairim prĂŹsean. Tha RunningDifference na ghnĂŹomh ann an ClickHouse a bhios aâ tomhas an eadar-dhealachadh eadar dĂ shreath ann an sreath.
Agus às deidh sin, feumaidh tu an co-dhà imh obrachadh a-mach, agus feumar an co-dhà imh a thomhas airson gach paidhir. Airson 5 earrann, tha paidhrichean 000 millean. Agus tha seo tòrr, ie 12,5 tursan feumar obrachadh a-mach dÏreach gnÏomh co-dhà imh.
Agus ma dhĂŹochuimhnich cuideigin, tha Íx agus Íy na neach-seic. dĂšil samplachaidh. Is e sin, tha e riatanach chan ann a-mhĂ in obrachadh a-mach na freumhan agus na suimean, ach cuideachd aon suimean eile taobh a-staigh nan suimean sin. Feumar dòrlach de Ă ireamhachadh a dhèanamh 12,5 millean uair, agus eadhon air an cruinneachadh a rèir uairean. Tha tòrr uairean againn cuideachd. Agus feumaidh tu a dhèanamh ann an 60 diog. Is e fealla-dhĂ a thâ ann.

Bha feum air Ăšine co-dhiĂš dòigh air choireigin, oir dhâ obraich seo uile gu math slaodach mus tĂ inig ClickHouse.

Dh'fheuch iad ri obrachadh a-mach air Hadoop, air Spark, air Greenplum. Agus bha seo uile gu math slaodach no daor. Is e sin, bha e comasach dòigh air choireigin à ireamhachadh, ach an uair sin bha e daor.

Agus an uairsin thĂ inig ClickHouse agus dhâ fhĂ s cĂšisean tòrr na bâ fheĂ rr.
Tha mi gad chuimhneachadh gu bheil duilgheadas againn le sgÏre dà ta, leis nach urrainn co-dhà imhean a bhith ionadail. Chan urrainn dhuinn cuid den dà ta a chuir air aon fhrithealaiche, cuid air fear eile agus obrachadh a-mach, feumaidh an dà ta gu lèir a bhith againn anns a h-uile à ite.
Dè rinn iad? An toiseach, tha an dĂ ta ionadail. Bidh gach frithealaiche aâ stòradh dĂ ta mu phrĂŹsean seata earrannan sònraichte. Agus chan eil iad a 'dol thairis air. Mar sin, tha e comasach Ă ireamhachadh logReturn ann an co-shĂŹnte agus gu neo-eisimeileach, tha seo uile a 'tachairt gu ruige seo ann an co-shĂŹnte agus air a sgaoileadh.
An uairsin chuir sinn romhainn an dĂ ta sin a lughdachadh, gun a bhith aâ call faireachdainneachd. LĂšghdaich le bhith aâ cleachdadh arrays, i.e. airson gach Ăšine, dèan sreath de stocan agus raon de phrĂŹsean. Mar sin, bidh e aâ toirt mòran nas lugha de rĂšm dĂ ta. Agus tha iad beagan nas fhasa obrachadh leotha. Tha iad sin nan obraichean cha mhòr co-shĂŹnte, ie bidh sinn aâ leughadh gu ĂŹre ann an co-shĂŹnte agus an uairsin aâ sgrĂŹobhadh chun t-seirbheisiche.
Ăs deidh sin, faodaidh e bhith air ath-aithris. Tha an litir ârâ aâ ciallachadh gun do rinn sinn ath-riochdachadh air an dĂ ta seo. Is e sin, tha an aon dĂ ta againn air na trĂŹ frithealaichean - is iad sin na h-arrays.
Agus an uairsin le sgriobt sònraichte bhon t-seata seo de 12,5 millean co-dhĂ imhean a dhâ fheumar a thomhas, faodaidh tu pasganan a dhèanamh. Is e sin, 2 gnĂŹomh le 500 paidhir co-dhĂ imhean. Agus tha an obair seo gu bhith air a thomhas air frithealaiche sònraichte ClickHouse. Tha an dĂ ta gu lèir aige, oir tha an dĂ ta mar an ceudna agus is urrainn dha an Ă ireamhachadh ann an òrdugh.

A-rithist, seo mar a tha e coltach. An toiseach, tha an dĂ ta gu lèir againn san structar seo: Ăšine, earrannan, prĂŹs. An uairsin rinn sinn cunntas air logReturn, ie dĂ ta den aon structar, ach an Ă ite aâ phrĂŹs tha logReturn againn mu thrĂ th. An uairsin chaidh an ath-nuadhachadh, i.e. fhuair sinn an Ăšine agus aâ bhuidheannArray airson stocan is prĂŹsean. Air ath-aithris. Agus Ă s deidh sin, chruthaich sinn dòrlach de ghnĂŹomhan agus thug sinn biadh dhaibh gu ClickHouse gus am biodh e gan cunntadh. Agus tha e ag obair.

Mar dhearbhadh air bun-bheachd, bâ e fo-obair a bhâ anns aâ ghnĂŹomh, i.e., chaidh nas lugha de dhĂ ta a thogail. Agus dĂŹreach trĂŹ frithealaichean.
Thug aâ chiad dĂ ĂŹre seo timcheall air uair a thĂŹde gus Log_return obrachadh a-mach agus pasgadh ann an arrays.
Agus tha Ă ireamhachadh aâ cho-dhĂ imh timcheall air 50 uair. Ach chan eil 50 uair gu leòr, oir bâ Ă bhaist dhaibh a bhith ag obair airson seachdainean. Bha e na shoirbheachadh mòr. Agus ma tha thu aâ cunntadh, an uairsin 70 uair san diog chaidh a h-uile cĂ il a chunntadh air aâ bhuidheann seo.
Ach is e an rud as cudromaiche gu bheil an siostam seo cha mhòr Ă s aonais botail, is e sin, bidh e a âsgèile cha mhòr sreathach. Agus rinn iad sgrĂšdadh air. Ărdaich e gu soirbheachail.

- Tha an sgeama ceart leth an t-soirbheachais. Agus is e an sgeama ceart cleachdadh nan teicneòlasan ClickHouse riatanach uile.
- Is e teicneòlasan a thâ ann an Summing/AggregatingMergeTrees a leigeas leat dealbh stĂ ite a chruinneachadh no beachdachadh mar chĂšis shònraichte. Agus tha e gu mòr a 'sĂŹmpleachadh tòrr rudan.
- Leigidh Seallaidhean TĂ thaichte leat a dhol seachad air an aon chrĂŹoch clĂ r-amais. Is dòcha nach tuirt mi e gu math soilleir, ach nuair a bha sinn aâ luchdachadh na logaichean, bha na logaichean amh sa chlĂ r le aon chlĂ r, agus bha na logaichean buadhan sa chlĂ r, ie an aon dĂ ta, dĂŹreach sĂŹoladh, ach bha an clĂ r-amais gu tur cuid eile. Tha e coltach gur e an aon dĂ ta a thâ ann, ach seòrsachadh eadar-dhealaichte. Agus leigidh Seallaidhean TĂ thaichte leat, ma tha feum agad air, a dhol seachad air a leithid de chuingealachadh ClickHouse.
- LĂšghdaich granularity clĂ r-amais airson ceistean puing.
- Agus sgaoil an dĂ ta gu sgiobalta, feuch ris an dĂ ta a shuidheachadh taobh a-staigh an fhrithealaiche cho mòr âs as urrainn dhut. Agus feuch ri dèanamh cinnteach gu bheil iarrtasan cuideachd aâ cleachdadh sgĂŹreachadh far a bheil sin comasach cho mòr âs a ghabhas.

Agus aâ toirt geĂ rr-chunntas air an òraid ghoirid seo, faodaidh sinn a rĂ dh gu bheil ClickHouse a-nis air seilbh lĂ idir a ghabhail air fearann ââââan dĂ chuid stòran-dĂ ta malairteach agus stòran-dĂ ta fosgailte, ie, gu sònraichte airson anailisean. Bidh e aâ freagairt gu foirfe ris aâ chruth-tĂŹre seo. Agus a bharrachd air an sin, bidh e gu slaodach aâ tòiseachadh a âtoirt a-mach feadhainn eile, oir nuair a bhios ClickHouse agad, chan fheum thu InfiniDB. Is dòcha nach bi feum air Vertika a dh'aithghearr ma nĂŹ iad taic Ă bhaisteach SQL. Gabh tlachd!

-Tapadh leibh airson an aithris! Glè inntinneach! An robh coimeas ann le Apache Phoenix?
Chan e, cha chuala mi coimeas idir. Feuchaidh sinn fhèin agus Yandex ri sÚil a chumail air a h-uile coimeas ClickHouse le diofar stòran-dà ta. Air sgà th 's ma tha rudeigin gu h-obann a' tionndadh gu bhith nas luaithe na ClickHouse, chan urrainn dha Lesha Milovidov cadal air an oidhche agus tòisichidh i ga luathachadh gu luath. Cha chuala mi iomradh air a leithid de choimeas.
(Aleksey Milovidov) Tha Apache Phoenix na einnsean SQL le cumhachd Hbase. Tha Hbase gu sònraichte airson suidheachadh obrach prĂŹomh luach. An sin, anns gach loidhne, faodaidh Ă ireamh neo-riaghailteach de cholbhan a bhith ann le ainmean neo-riaghailteach. Faodar seo a rĂ dh mu shiostaman leithid Hbase, Cassandra. Agus is e dĂŹreach ceistean anailis trom nach obraich gu h-Ă bhaisteach dhaibh. No is dòcha gu bheil thu aâ smaoineachadh gu bheil iad ag obair gu math mura h-eil eòlas sam bith agad le ClickHouse.
ХпаŃийО
Feasgar math Tha Úidh mhòr agam sa chuspair seo mu thrà th, oir tha fo-shiostam anailis agam. Ach nuair a choimheadas mi air ClickHouse, gheibh mi am faireachdainn gu bheil ClickHouse gu math freagarrach airson mion-sgrÚdadh tachartais, mutable. Agus ma dh'fheumas mi tòrr dà ta gnÏomhachais a mhion-sgrÚdadh le dòrlach de chlà ran mòra, an uairsin chan eil ClickHouse, cho fad 'sa tha mi a' tuigsinn, gu math freagarrach dhomh? Gu sònraichte ma tha iad ag atharrachadh. A bheil seo ceart no a bheil eisimpleirean ann as urrainn seo a dhiÚltadh?
Tha seo ceart. Agus tha seo fÏor mun mhòr-chuid de stòran-dà ta anailis sònraichte. Tha iad air an dèanamh freagarrach airson gu bheil aon no barrachd chlà ran mòra ann a tha mutable, agus airson mòran de fheadhainn bheaga a bhios ag atharrachadh gu slaodach. Is e sin, chan eil ClickHouse coltach ri Oracle, far an urrainn dhut a h-uile cà il a chuir agus cuid de cheistean fÏor iom-fhillte a thogail. Gus ClickHouse a chleachdadh gu h-èifeachdach, feumaidh tu sgeama a thogail ann an dòigh a tha ag obair gu math ann an ClickHouse. Is e sin, seachain cus gnà thachadh, cleachd faclairean, feuch ri nas lugha de cheanglaichean fada a dhèanamh. Agus ma thèid an sgeama a thogail san dòigh seo, faodar gnÏomhan gnÏomhachais den aon seòrsa fhuasgladh air ClickHouse mòran nas èifeachdaiche na air stòr-dà ta dà imh traidiseanta.
Tapadh leibh airson an aithris! Tha ceist agam mun chĂšis ionmhais as Ăšire. Bha analytics aca. Bha e riatanach coimeas a dhèanamh eadar mar a thèid iad suas is sĂŹos. Agus tha mi aâ tuigsinn gun do thog thu an siostam gu sònraichte airson an anailis seo? Ma tha a-mĂ ireach, mar eisimpleir, feumaidh iad aithisg eile air an dĂ ta seo, am feum iad an sgeama ath-thogail agus an dĂ ta a luchdachadh suas? Is e sin, a bhith aâ dèanamh seòrsa de ro-phròiseasadh gus an t-iarrtas fhaighinn?
Gu dearbh, is e seo cleachdadh ClickHouse airson gnĂŹomh sònraichte. Dhâ fhaodadh e a bhith air fhuasgladh nas traidiseanta taobh a-staigh Hadoop. Airson Hadoop, is e obair air leth a tha seo. Ach air Hadoop tha e gu math slaodach. Agus is e an t-amas agam sealltainn gun urrainn ClickHouse gnĂŹomhan fhuasgladh a tha mar as trice air am fuasgladh ann an dòighean gu tur eadar-dhealaichte, ach aig an aon Ă m a dhèanamh tòrr nas èifeachdaiche. Tha e air a dhealbh airson obair shònraichte. Tha e soilleir ma tha duilgheadas ann le rudeigin coltach ris, faodar a rèiteachadh san aon dòigh.
Tha e soilleir. Thuirt thu gun deach 50 uair a ghiullachd. An ann bhon fhĂŹor thoiseach, cuin a luchdaich thu an dĂ ta no a fhuair thu na toraidhean?
Seadh Tha.
OK tapadh leat gu mòr.
Tha seo air buidheann de 3 frithealaichean.
Beannachdan! Tapadh leibh airson an aithris! Tha a h-uile dad gu math inntinneach. Cha bhith mi aâ faighneachd beagan mu ghnĂŹomhachd, ach mu chleachdadh ClickHouse a thaobh seasmhachd. Is e sin, an robh gin agad, an robh agad ri ath-nuadhachadh? Ciamar a bhios ClickHouse gad ghiĂšlan fhèin sa chĂšis seo? Agus an do thachair e gu robh mac-samhail agad cuideachd? Mar eisimpleir, thachair sinn ri duilgheadas le ClickHouse nuair a tha e fhathast aâ faighinn a-mach Ă s a chrĂŹoch agus aâ tuiteam.
Gu dearbh, chan eil siostaman foirfe ann. Agus tha na duilgheadasan aige fhèin aig ClickHouse cuideachd. Ach an cuala tu mu dheidhinn Yandex.Metrica nach eil ag obair airson Ăšine mhòr? Is dòcha nach eil. Tha e air a bhith ag obair gu earbsach bho 2012-2013 air ClickHouse. Is urrainn dhomh an aon rud a rĂ dh mun eòlas agam. Cha robh fĂ illigidhean iomlan againn a-riamh. Dhâ fhaodadh cuid de rudan pĂ irteach tachairt, ach cha robh iad a-riamh deatamach gu leòr airson buaidh mhòr a thoirt air aâ ghnĂŹomhachas. Cha do thachair e a-riamh. Tha ClickHouse gu math earbsach agus cha bhith e aâ tuiteam air thuaiream. Chan fheum thu a bhith draghail mu dheidhinn. Chan e rud amh a thâ ann. Tha seo air a dhearbhadh le mòran chompanaidhean.
Halò! Thuirt thu gum feum thu smaoineachadh air an sgeama dĂ ta sa bhad. Dè ma thachair? Tha an dĂ ta agam a 'dòrtadh agus a' dòrtadh. Bidh sia mĂŹosan aâ dol seachad, agus tha mi aâ tuigsinn gu bheil e do-dhèanta a bhith beò mar seo, feumaidh mi an dĂ ta ath-luchdachadh suas agus rudeigin a dhèanamh leotha.
Tha seo gu dearbh an urra ris an t-siostam agad. Tha grunn dhòighean ann seo a dhèanamh le cha mhòr gun stad. Mar eisimpleir, is urrainn dhut Sealladh TĂ thaichte a chruthachadh anns an dèan thu structar dĂ ta eadar-dhealaichte mas urrainnear a mhapadh gun samhail. Is e sin, ma cheadaicheas e mapadh aâ cleachdadh ClickHouse, i.e. thoir a-mach cuid de rudan, atharraich am prĂŹomh iuchair, atharraich sgaradh, faodaidh tu Sealladh Stuth a dhèanamh. SgrĂŹobh thairis air an t-seann dĂ ta agad an sin, thèid feadhainn Ăšra a sgrĂŹobhadh gu fèin-ghluasadach. Agus an uairsin dĂŹreach gluais gu bhith aâ cleachdadh an Materialized View, an uairsin atharraich an clĂ r agus cuir Ă s don t-seann chlĂ r. San fharsaingeachd is e dòigh neo-stad a tha seo.
Tapadh leibh.
Source: www.habr.com
