Is e seo an dĂ rna pĂ irt de shreath artaigilean mu shiostaman anailis ().

An-diugh chan eil teagamh sam bith ann gum faod lĂ imhseachadh dĂ ta faiceallach agus mĂŹneachadh thoraidhean cuideachadh le cha mhòr seòrsa sam bith de ghnĂŹomhachas. A thaobh seo, tha siostaman anailis a âsĂŹor fhĂ s lĂ n de pharamadairean, agus tha an Ă ireamh de luchd-brosnachaidh agus tachartasan luchd-cleachdaidh ann an tagraidhean aâ fĂ s.
Air sgĂ th seo, tha companaidhean aâ toirt barrachd is barrachd fiosrachaidh amh don luchd-anailis aca airson mion-sgrĂšdadh agus tionndadh gu co-dhĂšnaidhean math. Cha bu chòir dĂŹ-meas a dhèanamh air cho cudromach sa tha siostam anailitigeach airson companaidh, agus feumaidh an siostam fhèin a bhith earbsach agus seasmhach.
Luchd-anailis luchd-cleachdaidh
Is e seirbheis a thâ ann an anailis teachdaiche a bhios companaidh aâ ceangal ris an lĂ rach-lĂŹn no an aplacaid aice tron ââSDK oifigeil, aâ fighe a-steach don bhun-chòd aca fhèin agus aâ taghadh brosnachaidhean tachartais. Tha eas-bhuannachd follaiseach san dòigh-obrach seo: is dòcha nach tèid an dĂ ta gu lèir a chaidh a chruinneachadh a phròiseasadh dĂŹreach mar a bu toil leat air sgĂ th cuingealachaidhean seirbheis sam bith a thaghas tu. Mar eisimpleir, air aon shiostam cha bhith e furasta gnĂŹomhan MapReduce a ruith, air siostam eile cha bhith e comasach dhut do mhodail a ruith. Is e ana-cothrom eile a bhios ann am bile cunbhalach (drĂšidhteach) airson seirbheisean.
Tha mòran fhuasglaidhean anailis teachdaiche air aâ mhargaidh, ach nas luaithe no nas fhaide tha luchd-anailis mu choinneimh nach eil seirbheis uile-choitcheann ann a tha iomchaidh airson a h-uile gnĂŹomh (fhad âs a tha prĂŹsean nan seirbheisean sin uile ag èirigh fad na h-Ăšine). Ann an suidheachadh mar sin, bidh companaidhean gu tric aâ co-dhĂšnadh an siostam sgrĂšdaidh aca fhèin a chruthachadh leis na roghainnean agus na comasan gnĂ thaichte riatanach.
Mion-sgrĂšdairean frithealaiche
Is e seirbheis a thâ ann an anailisean taobh frithealaiche a dhâ fhaodar a chleachdadh taobh a-staigh companaidh air na frithealaichean aige fhèin agus (mar as trice) leis na h-oidhirpean aige fhèin. Anns a âmhodail seo, tha a h-uile tachartas cleachdaiche air a stòradh air frithealaichean a-staigh, aâ leigeil le luchd-leasachaidh diofar stòran-dĂ ta stòraidh fheuchainn agus an ailtireachd as freagarraiche a thaghadh. Agus eadhon ged a tha thu fhathast airson anailisean teachdaiche treas-phĂ rtaidh a chleachdadh airson cuid de ghnĂŹomhan, bidh e comasach fhathast.
Faodar anailisean taobh frithealaiche a chleachdadh ann an dà dhòigh. An toiseach: tagh cuid de ghoireasan stòr fosgailte, cuir an sàs iad air na h-innealan agad agus leasaich loidsig gnÏomhachais.
ĐĐťŃŃŃ
ĐинŃŃŃ
Faodaidh tu rud sam bith a tha thu ag iarraidh a ghnĂ thachadh
Tha seo gu math duilich gu tric agus tha feum air luchd-leasachaidh air leth
San dà rna h-à ite: gabh seirbheisean SaaS (Amazon, Google, Azure) an à ite a bhith ga chleachdadh thu fhèin. Bruidhnidh sinn mu SaaS ann am barrachd mionaideachd anns an treas pà irt.
ĐĐťŃŃŃ
ĐинŃŃŃ
Is dòcha gum bi e nas saoire aig meudan meadhanach, ach le fàs mòr bidh e fhathast ro dhaor
Cha bhith e comasach smachd a chumail air a h-uile paramadair
Tha rianachd gu tur air a ghluasad gu guailnean an t-solaraiche seirbheis
Chan eil fios an-còmhnaidh dè a tha taobh a-staigh na seirbheis (is dòcha nach bi feum air)
Mar a chruinnicheas tu mion-sgrĂšdadh frithealaiche
Ma tha sinn airson gluasad air falbh bho bhith aâ cleachdadh mion-sgrĂšdaidhean teachdaiche agus an fheadhainn againn fhèin a thogail, an toiseach feumaidh sinn smaoineachadh tro ailtireachd an t-siostaim Ăšir. Gu h-ĂŹosal innsidh mi dhut ceum air cheum na dhâ fheumas tu beachdachadh, carson a tha feum air gach ceum agus dè na h-innealan as urrainn dhut a chleachdadh.
1. A 'faighinn dĂ ta
DĂŹreach mar a tha ann an cĂšis anailis teachdaiche, an toiseach, bidh luchd-anailis chompanaidhean aâ taghadh na seòrsaichean thachartasan a tha iad airson a sgrĂšdadh san Ă m ri teachd agus gan cruinneachadh ann an liosta. Mar as trice, bidh na tachartasan sin aâ tachairt ann an òrdugh sònraichte, ris an canar âpĂ tran tachartais.â
An uairsin, smaoinich gu bheil luchd-cleachdaidh cunbhalach (innealan) agus mòran luchd-frithealaidh aig tagradh gluasadach (lĂ rach-lĂŹn). Gus tachartasan a ghluasad gu tèarainte bho innealan gu frithealaichean, tha feum air sreath eadar-mheadhanach. A rèir an ailtireachd, dhâ fhaodadh grunn ciudhaichean tachartais a bhith ann.
A bheil , a tha air a chleachdadh mar ciudha airson tachartasan a chruinneachadh.
A rèir ann an 2014, cho-dhĂšin neach-cruthachaidh Apache Kafka am bathar-bog ainmeachadh Ă s deidh Franz Kafka air sgĂ th âis e siostam a thâ ann airson sgrĂŹobhadh âagus leis gu robh e dèidheil air obraichean Kafka. -
Anns an eisimpleir againn, tha mòran riochdairean dĂ ta agus luchd-cleachdaidh dĂ ta (innealan agus frithealaichean), agus tha Kafka a âcuideachadh le bhith gan ceangal ri chèile. Thèid cunntas nas mionaidiche a thoirt air luchd-cleachdaidh anns na ceumannan a leanas, far am bi iad nam prĂŹomh chuspairean. A-nis beachdaichidh sinn dĂŹreach air riochdairean dĂ ta (tachartasan).
Tha Kafka aâ toirt a-steach bun-bheachdan ciudha agus sgaradh; tha e nas fheĂ rr leughadh nas mionaidiche mu dheidhinn seo ann an Ă iteachan eile (mar eisimpleir, ann an ). Gun a bhith aâ dol a-steach gu mion-fhiosrachadh, smaoinichidh sinn gu bheil tagradh gluasadach air a chuir air bhog airson dĂ OS eadar-dhealaichte. An uairsin bidh gach dreach aâ cruthachadh a shruth tachartais fa leth fhèin. Bidh riochdairean a 'cur thachartasan gu Kafka, tha iad air an clĂ radh ann an ciudha iomchaidh.

(dealbh )
Aig an aon Ă m, leigidh Kafka leat leughadh ann an cnapan agus pròiseas sreath de thachartasan ann am pĂŹosan beaga. Tha Kafka na inneal gu math goireasach a tha a âdol gu math le feumalachdan a tha aâ sĂŹor fhĂ s (mar eisimpleir, le bhith a âsuidheachadh thachartasan).
Mar as trice tha aon shard gu leòr, ach bidh cĂšisean aâ fĂ s nas toinnte nuair a bhios iad aâ sgèileadh (mar a bhios iad an-còmhnaidh). Is dòcha nach bi duine airson dĂŹreach aon shard corporra a chleachdadh ann an cinneasachadh, oir feumaidh an ailtireachd a bhith fulangach le lochdan. A bharrachd air Kafka, tha fuasgladh ainmeil eile ann - RabbitMQ. Cha do chleachd sinn e ann an cinneasachadh mar ciudha airson mion-sgrĂšdadh tachartais (ma tha an leithid de eòlas agad, innis dhuinn mu dheidhinn anns na beachdan!). Ach, chleachd sinn AWS Kinesis.
Mus gluais sinn air adhart chun ath cheum, feumaidh sinn iomradh a thoirt air aon shreath eile den t-siostam - stòradh log amh. Chan e Ïre riatanach a tha seo, ach bidh e feumail ma thèid rudeigin ceà rr agus na ciudhaichean tachartais ann an Kafka ath-shuidheachadh. Chan fheum stòradh logaichean amh fuasgladh iom-fhillte agus daor; faodaidh tu dÏreach an sgrÏobhadh an à iteigin san òrdugh cheart (eadhon air clà r cruaidh).

2. Pròiseas sruthan tachartais
Ăs deidh dhuinn na tachartasan gu lèir ullachadh agus an cur anns na ciudhaichean iomchaidh, gluaisidh sinn air adhart chun cheum giollachd. An seo innsidh mi dhut mun dĂ roghainn giollachd as cumanta.
Is e aâ chiad roghainn cothrom a thoirt do Spark Streaming ann an siostam Apache. Bidh a h-uile toradh Apache beò air HDFS, siostam faidhle tèarainte le mac-samhail faidhle. Tha Spark Streaming na inneal furasta a chleachdadh a bhios aâ lĂ imhseachadh dĂ ta sruthadh agus lannan gu math. Ge-tĂ , dh'fhaodadh gum bi e doirbh a chumail suas.
Is e roghainn eile an neach-lĂ imhseachaidh tachartais agad fhèin a thogail. Gus seo a dhèanamh, feumaidh tu, mar eisimpleir, tagradh Python a sgrĂŹobhadh, a thogail ann an Docker agus fo-sgrĂŹobhadh don ciudha Kafka. Nuair a ruigeas luchd-brosnachaidh an luchd-lĂ imhseachaidh docker, tòisichidh giullachd. Leis an dòigh seo, feumaidh tu tagraidhean a chumail a âdol fad na h-Ăšine.
Gabhamaid ris gu bheil sinn air aon de na roghainnean a tha air am mĂŹneachadh gu h-Ă rd a thaghadh agus gluasad air adhart chun ghiullachd fhèin. Bu chòir do phròiseasan tòiseachadh le bhith aâ sgrĂšdadh dligheachd an dĂ ta, aâ sĂŹoladh sgudal agus tachartasan âbristeâ. Airson dearbhadh bidh sinn mar as trice aâ cleachdadh . Ăs deidh seo, faodaidh tu mapadh dĂ ta a dhèanamh: tha dĂ ta bho dhiofar thĂšsan air a Ă bhaisteachadh agus air a riaghailteachadh gus a chuir ri clĂ r cumanta.

3. Stòr-dà ta
Is e an treas ceum tachartasan à bhaisteach a chumail suas. Nuair a bhios sinn ag obair le siostam anailis deiseil, feumaidh sinn faighinn thuca gu tric, agus mar sin tha e cudromach stòr-dà ta iomchaidh a thaghadh.
Ma tha an dà ta a 'freagairt gu math ri sgeama stèidhichte, faodaidh tu taghadh no stòr-dà ta colbh eile. San dòigh seo obraichidh na cruinneachaidhean gu math luath. Is e an Ïsleachadh gu bheil an sgeama stèidhichte gu teann agus mar sin cha bhith e comasach nithean neo-riaghailteach a chuir ris gun atharrachadh (mar eisimpleir, nuair a thachras tachartas neo-à bhaisteach). Ach faodaidh tu cunntadh gu math luath.
Airson dĂ ta neo-structaraichte, faodaidh tu NoSQL a ghabhail, mar eisimpleir, . Bidh e aâ ruith air HDFS, ag ath-riochdachadh gu math, is urrainn dhut iomadh suidheachadh a thogail, agus tha e fulangach air lochdan.
Faodaidh tu cuideachd rudeigin nas sĂŹmplidh a thogail, mar eisimpleir, . Tha e gu math slaodach agus airson meudan beaga. Ach is e a âbhuannachd a thâ ann gu bheil e gu math sĂŹmplidh agus mar sin freagarrach airson tòiseachadh.

4. Comh-thional
Ăs deidh dhuinn na tachartasan gu lèir a shĂ bhaladh gu faiceallach, tha sinn airson a h-uile fiosrachadh cudromach a chruinneachadh bhon bhaidse a rĂ inig agus an stòr-dĂ ta Ăšrachadh. Gu cruinneil, tha sinn airson clĂ ran-dannsa agus meatrach iomchaidh fhaighinn. Mar eisimpleir, cruinnich pròifil neach-cleachdaidh bho thachartasan agus dòigh air choireigin tomhas giĂšlan. Bidh tachartasan air an cruinneachadh, air an cruinneachadh, agus air an sĂ bhaladh a-rithist (ann an clĂ ran luchd-cleachdaidh). Aig an aon Ă m, faodaidh tu siostam a thogail gus an urrainn dhut cuideachd criathrag a cheangal ris aâ cho-òrdanaiche cruinneachaidh: cruinnich luchd-cleachdaidh a-mhĂ in bho sheòrsa sònraichte de thachartas.
Ăs deidh sin, mura feum cuideigin san sgioba ach mion-sgrĂšdaidhean Ă rd-ĂŹre, faodar siostaman anailis taobh a-muigh a cheangal. Faodaidh tu Mixpanel a ghabhail a-rithist. ach leis gu bheil e gu math daor, chan eil a h-uile tachartas luchd-cleachdaidh air an cur ann, ach dĂŹreach na tha a dhĂŹth. Gus seo a dhèanamh, feumaidh sinn co-òrdanaiche a chruthachadh a ghluaiseas cuid de thachartasan amh no rudeigin a chruinnich sinn fhĂŹn na bu thrĂ ithe gu siostaman taobh a-muigh, APIan no Ă rd-Ăšrlaran sanasachd.

5. Aghaidh
Feumaidh tu an aghaidh aghaidh a cheangal ris an t-siostam cruthaichte. Is e deagh eisimpleir seirbheis , na GUI stòr-dĂ ta a chuidicheas le bhith aâ togail deas-bhòrdan. Mar a tha an eadar-obrachadh ag obair:
- Bidh an neach-cleachdaidh aâ dèanamh ceist SQL.
- Mar fhreagairt gheibh e soidhne.
- Bidh e aâ cruthachadh âsealladh Ăšrâ air a shon agus aâ faighinn graf Ă lainn as urrainn dhut a shĂ bhaladh dhut fhèin.
Tha Ïomhaighean san t-seirbheis ag Úrachadh gu fèin-ghluasadach, faodaidh tu do sgrÚdadh a ghnà thachadh agus a leantainn. Tha Redash an-asgaidh ma tha e fèin-aoigheachd, ach mar SaaS cosgaidh e $50 gach mÏos.

co-dhĂšnadh
Ăs deidh dhut na ceumannan gu h-Ă rd a chrĂŹochnachadh, cruthaichidh tu anailisean an fhrithealaiche agad. Thoir an aire nach eil seo cho sĂŹmplidh ri dĂŹreach a bhith aâ ceangal anailisean teachdaiche, oir feumaidh a h-uile dad a bhith air a rèiteachadh leat fhèin. Mar sin, mus cruthaich thu an siostam agad fhèin, is fhiach coimeas a dhèanamh eadar an fheum air fĂŹor shiostam anailitigeach agus na goireasan a tha thu deònach a riarachadh dha.
Ma tha thu air am matamataigs a dhèanamh agus air faighinn a-mach gu bheil na cosgaisean ro à rd, anns an ath phà irt bruidhnidh mi mu mar a nÏ thu dreach nas saoire de anailisean taobh an fhrithealaiche.
Tapadh leibh airson an leughadh! Bidh mi toilichte ceistean fhaighneachd anns na beachdan.
Source: www.habr.com
