ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Iesaku izlasÄ«t Igora Strihara 2017. gada ziņojuma ā€œClickHouse ā€“ vizuāli ātra un skaidra datu analÄ«ze Tabixā€ atÅ”ifrējumu.

Web interfeiss ClickHouse projektā Tabix.
Galvenās iezīmes:

  • Strādā ar ClickHouse tieÅ”i no pārlÅ«kprogrammas, bez nepiecieÅ”amÄ«bas instalēt papildu programmatÅ«ru;
  • Vaicājumu redaktors ar sintakses izcelÅ”anu;
  • Komandu automātiskā pabeigÅ”ana;
  • Vaicājumu izpildes grafiskās analÄ«zes rÄ«ki;
  • Krāsu shēmas, no kurām izvēlēties.
    ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars


ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Esmu SMI2 tehniskais direktors. Mēs esam ziņu apmaiņas ziņu apkopotājs. Mēs glabājam daudz datu, ko saņemam no saviem partneriem un reÄ£istrējam ClickHouse ā€“ aptuveni 30 000 pieprasÄ«jumu sekundē.

Tie ir tādi dati kā:

  • KlikŔķi uz ziņām.
  • Ziņas tiek rādÄ«tas apkopotājā.
  • Reklāmkarogi tiek rādÄ«ti mÅ«su tÄ«klā.
  • Un mēs reÄ£istrējam notikumus no sava skaitÄ«tāja, kas ir lÄ«dzÄ«gs Yandex.Metrica. Å Ä« ir mÅ«su paÅ”u mikroanalÄ«tika.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Pirms ClickHouse mums bija ļoti drudžaina dzÄ«ve. Mēs daudz cietām, mēģinot kaut kur saglabāt Å”os datus un kaut kā tos analizēt.

DzÄ«ve pirms ClickHouse ā€“ infiniDB

Pirmā lieta, kas mums bija, bija infiniDB. Viņa dzīvoja pie mums 4 gadus. Mēs to iedarbinājām ar grūtībām.

  • Tas neatbalsta grupÄ“Å”anu vai sadalÄ«Å”anu. Pēc noklusējuma no kastes neiznāca tādas gudras lietas.
  • Viņai ir grÅ«tÄ«bas ar datu ielādi. Tikai konkrēta konsoles utilÄ«ta, kas varēja ielādēt tikai CSV failus un tikai kaut kādā ļoti neskaidrā veidā.
  • Datu bāze ir viena pavediena. Varēji gan rakstÄ«t, gan lasÄ«t. Bet tas ļāva apstrādāt lielu datu apjomu.
  • Un viņai bija arÄ« interesants kruÄ·is. Katru vakaru serveris bija jāpārstartē, pretējā gadÄ«jumā tas nedarbosies.

Viņa strādāja pie mums līdz 2016. gada beigām, kad mēs pilnībā pārgājām uz ClickHouse.

DzÄ«ve pirms ClickHouse ā€“ Kasandra

Tā kā infiniDB bija viens pavediens, mēs nolēmām, ka mums ir vajadzīga sava veida vairāku pavedienu datubāze, kurā vienlaikus varētu ierakstīt daudzus pavedienus.

Izmēģinājām daudz interesantu lietu. Tad mēs nolēmām izmēģināt Kasandru. Ar Kasandru viss bija lieliski. 10 000 pieprasÄ«jumu sekundē par solÄ«jumu. 2 lasÄ«Å”anas pieprasÄ«jumu.

Bet viņai bija arÄ« savas intereses. Reizi mēnesÄ« vai divos mēneÅ”os viņa piedzÄ«voja datu bāzes desinhronizāciju. Un man bija jāmostas un jāskrien salabot Kasandru. Serveri tika restartēti pa vienam. Un viss kļuva gluds un skaists.

DzÄ«ve pirms ClickHouse ā€” DruÄ«ds

Tad sapratām, ka jāraksta vēl vairāk datu. 2016. gadā sākām skatīties Druīdu.

Druid ir atvērtā pirmkoda programmatÅ«ra, kas rakstÄ«ta Java valodā. Ä»oti specifisks. Un tas bija piemērots klikŔķu straumei, kad mums ir jāsaglabā kāda veida notikumu straume un pēc tam jāveic to apkopoÅ”ana vai analÄ«tiskas atskaites.

Druīdam bija versija 0.9.X.

Pati datubāze ir ļoti grÅ«ti izvietojama. Tā ir infrastruktÅ«ras sarežģītÄ«ba. Lai to izvietotu, bija jāinstalē daudz, daudz dzelzs. Un katra aparatÅ«ras daļa bija atbildÄ«ga par savu atseviŔķu lomu.

Lai tajā ielādētu datus, bija jāizmanto kaut kāds Å”amanisms. Ir atvērtā koda projekts - Tranquility, kas straumē zaudēja datus no mums. Kad mēs ielādējām tajā datus, tas tos pazaudēja.

Bet kaut kā sākām to Ä«stenot. Mēs kā eži, kas lietoja narkotikas, bet turpināja ēst kaktusu, sākām to ieviest. Mums vajadzēja apmēram mēnesi, lai sagatavotu tam visu infrastruktÅ«ru. Tas ir, pasÅ«tiet serverus, konfigurējiet lomas un pilnÄ«bā automatizējiet izvietoÅ”anu. Tas nozÄ«mē, ka klastera kļūmes gadÄ«jumā automātiski tiks izvietots otrais klasteris.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Bet tad notika brīnums. Es biju atvaļinājumā, un mani kolēģi man atsūtīja saiti uz habr, kurā teikts, ka Yandex nolēma atvērt ClickHouse. Es saku, pamēģināsim.

Un burtiski 2 dienu laikā mēs izvietojām ClickHouse testa kopu. Mēs sākām tajā ielādēt datus. Salīdzinot ar infiniDB, tas ir elementāri; salīdzinot ar Druid, tas ir elementāri. Salīdzinot ar Kasandru, tas ir arī elementāri. Jo, ja jūs ielādējat datus no PHP Cassandra, tad tas nav elementāri.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Ko mēs saņēmām? Sniegums ātrumā. Veiktspēja datu glabāŔanā. Tas nozÄ«mē, ka diskā tiek izmantots daudz mazāk vietas. ClickHouse ir ātrs, tas ir ļoti ātrs salÄ«dzinājumā ar citiem produktiem.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

PalaiÅ”anas brÄ«dÄ«, kad Yandex publicēja ClickHouse programmā OpenSource, bija tikai konsoles klients. Mēs savā uzņēmumā SMI2 nolēmām mēģināt izveidot vietēju tÄ«mekļa klientu, lai mēs varētu atvērt lapu no pārlÅ«kprogrammas, uzrakstÄ«t pieprasÄ«jumu un iegÅ«t rezultātu, jo mēs sākām rakstÄ«t daudz pieprasÄ«jumu. RakstÄ«t konsolē ir grÅ«ti. Un mēs izveidojām savu pirmo versiju.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Un kaut kur tuvāk pagājuŔā gada ziemai sāka parādīties treŔo puŔu rīki darbam ar ClickHouse. Tie ir tādi rīki kā:

Es apskatīŔu dažus no Ŕiem rīkiem, tas ir, tos, ar kuriem esmu strādājis.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Labs rÄ«ks, bet priekÅ” Druid. Kad Druid tika ieviests, es testēju SuperSet. Man viņŔ patika. DruÄ«dam tas ir ļoti ātri.

Tas nav piemērots ClickHouse. Tas ir, tas atbilst, tas sākas, bet ir gatavs apstrādāt tikai elementārus vaicājumus, piemēram: SELECT notikumu, GROUP BY notikumu. Tas neatbalsta sarežģītāku ClickHouse sintaksi.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Nākamais rīks ir Apache Zeppelin. Šī ir laba un interesanta lieta. Darbojas. Tā atbalsta piezīmjdatorus, informācijas paneļus un atbalsta mainīgos. Es zinu, ka kāds no ClickHouse kopienas to izmanto.

Bet ClickHouse sintakse neatbalsta, t.i., vaicājumi bÅ«s jāraksta vai nu konsolē, vai kaut kur citur. Pēc tam pārbaudiet, vai tas viss darbojas. Tas ir vienkārÅ”i neērti. Bet tam ir labs informācijas paneļa atbalsts.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Nākamais rÄ«ks ir Redash.IO. Redash ir mitināts internetā. Tas ir, atŔķirÄ«bā no iepriekŔējiem rÄ«kiem, tas nav jāinstalē. Un Å”is ir informācijas panelis ar iespēju konsolidēt datus no dažādiem datu avotiem. Tas ir, jÅ«s varat lejupielādēt no ClickHouse, no MySQL, no PostgreSQL un citām datu bāzēm.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Tikai pirms mēneÅ”a (2017. gada martā) Grafana parādÄ«jās atbalsts. Kad programmā Grafana veidojat pārskatus, piemēram, par aparatÅ«ras stāvokli vai dažiem rādÄ«tājiem, tagad varat izveidot to paÅ”u grafiku vai kāda veida paneli tieÅ”i no ClickHouse datiem. Tas ir ļoti ērti, un mēs to izmantojam paÅ”i. Tas ļauj jums atrast anomālijas. Tas ir, ja kaut kas notiek un kāda aparatÅ«ra nokrÄ«t vai kļūst saspringta, varat apskatÄ«t iemeslu, kāpēc Å”iem datiem izdevās iekļūt ClickHouse.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Man bija ļoti neērti rakstÄ«t Å”ajos rÄ«kos vai konsolē. Un es nolēmu uzlabot mÅ«su pirmo saskarni. Un ideju ieguvu no EventSQL, SeperSet, Zeppelin.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Ko tu gribēji? Es gribēju iegÅ«t grafiku, uzlabotu redaktoru un ieviest atbalstu padomu vārdnÄ«cām. Jo ClickHouse ir lieliska iespēja - vārdnÄ«cas. Taču ir grÅ«ti strādāt ar vārdnÄ«cām, jo ā€‹ā€‹ir jāatceras saglabāto vērtÄ«bu formāts, t.i., vai tas ir cipars vai virkne utt. Un tā kā mēs bieži izmantojam vārdnÄ«cas dažādās variācijās, bija diezgan grÅ«ti rakstÄ«t vaicājumus.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Ir pagājuÅ”i 3 mēneÅ”i kopÅ” mÅ«su pirmās versijas izlaiÅ”anas. Es veicu apmēram 330 saistÄ«bas privātā filiālē, un tas izrādÄ«jās Tabix.

AtŔķirÄ«bā no iepriekŔējās versijas, kas saucās ClickHouse-Frontend, es nolēmu to pārdēvēt par vienkārÅ”u nosaukumu. Un izrādÄ«jās, Tabix.

Kas parādījās?

Zīmē grafikus. Atbalsta ClickHouse SQL sintaksi. Sniedz padomus par funkcijām un var paveikt daudz interesantu lietu.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Šādi izskatās vispārējā Tabix shēma. Kreisajā pusē ir koks. Centrā ir vaicājumu redaktors. Un zemāk ir Ŕī pieprasÄ«juma rezultāts.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Tālāk es jums parādīŔu, kā darbojas vaicājumu redaktors.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Šeit automātiskā pabeigŔana automātiski darbojas tabulā un attiecīgi pieprasa lauku automātisko pabeigŔanu. Un padomi par funkcijām. Nospiežot ctrl enter, pieprasījums tiks izpildīts vai neizdosies ar kļūdu. VienkārŔākais pieprasījums tiek nosūtīts Tabix un tiek iegūts rezultāts, t.i., var ātri strādāt ar ClickHouse.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Vārdnīcas, kā jau teicu, ir ļoti interesanta lieta, ar kuru mēs daudz strādājam. Un kas ļāva mums darīt daudzas lietas. Pieņemsim, ka visas pilsētas glabājam vārdnīcās. Mēs saglabājam pilsētas identifikatoru un pilsētas nosaukumu, tās platuma un garuma grādus. Un datubāzē mēs glabājam tikai pilsētas identifikatoru. Attiecīgi mēs ļoti spēcīgi saspiežam datus.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Å Ä·iet, ka tā ir vienkārÅ”a lieta, taču tā palÄ«dz ClickHouse ļoti interesantā veidā. Sakarā ar to, ka ClickHouse atbalsta tikai ligzdotos savienojumus, vaicājums aug uz leju un pietiekami plats. Un, kad tiek atvērta kronÅ”teina un parādās kāda gara izteiksme, tad kaut kas tik vienkārÅ”s kā vaicājuma sakļauÅ”ana atvieglo darbu ar paÅ”u vaicājumu. Jo, ja vaicājums ir 200-300 rindiņas garÅ” un ļoti milzÄ«gs platums, ir ļoti noderÄ«gi sakļaut vaicājumu un pēc tam atrast kādu vietu vai kaut kā to lokalizēt.

Objektu koks, daudzvaicājumi un cilnes (Video 13:46 https://youtu.be/w1-XsL3nbRg?t=826)

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Tālāk es jums parādÄ«Å”u par koku un cilnēm. Kreisajā pusē ir koks; augÅ”pusē varat izveidot vairākas cilnes. Cilnes ir kā darbvieta. Varat izveidot vairākas cilnes un nosaukt katru no tām atŔķirÄ«gi. Tā ir kā mini sistēma atskaites veidoÅ”anai.

Cilnes tiek automātiski saglabātas. Ja restartējat pārlūkprogrammu vai aizverat vai atverat Tabix, tas viss tiks saglabāts.

Hotkey - ērti (Video 14:39 https://youtu.be/w1-XsL3nbRg?t=879)

Ir karstie taustiņi, un to ir diezgan daudz. Šeit kā piemēru esmu izvilcis dažus no tiem. Tā ir ciļņu maiņa, pieprasījuma izpilde vai vairāku pieprasījumu izpilde.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Es jums parādÄ«Å”u, kā strādāt ar rezultātu. NosÅ«tām pieprasÄ«jumu. Å eit es zÄ«mēju sin, cos un tg. Varat izcelt rezultātu, t.i., uzzÄ«mēt tipisku karti kolonnai. Varat izcelt pozitÄ«vas vai negatÄ«vas vērtÄ«bas. Vai vienkārÅ”i izkrāsojiet konkrētu galda elementu. Tas ir ērti, ja galds ir milzÄ«gs un ar acÄ«m jāatrod kāda anomālija. Kad es meklēju anomālijas, es izcēlu dažas lÄ«nijas, dažus elementus zaļā vai sarkanā krāsā.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Tur ir daudz interesantu lietu. Piemēram, kā kopēt Redmine Markdown. Ja jums kaut kur jākopē rezultāts, tas ir ļoti ērti. Varat vienkārÅ”i atlasÄ«t apgabalu, sakiet ā€œKopēt uz Redmineā€, un tas tiks kopēts Redmine Markdown vai izveidos vaicājumu Kur.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Nākamā ir vaicājuma optimizācija. Es reiz aizmirsu norādÄ«t lauku ā€œdatumsā€. Un mans pieprasÄ«jums ClickHouse tika apstrādāts nevis ļoti, ļoti ātri, bet ātri, t.i., mazāk par sekundi. Kad es redzēju, cik daudz rindu viņŔ izskrēja, man kļuva bail. Mēs neierakstām tik daudz rindu Å”ajā tabulā vienā dienā. Sāku analizēt pieprasÄ«jumu un ieraudzÄ«ju, ka vienā vietā esmu nokavējis randiņu. Tas ir, es aizmirsu norādÄ«t, ka man nav nepiecieÅ”ami dati par visu tabulu, bet gan par konkrētu periodu.

Tabix ir cilne ā€œStatistikaā€, kurā tiek glabāta visa nosÅ«tÄ«to pieprasÄ«jumu vēsture, t.i., tur var redzēt, cik rindiņu Å”is pieprasÄ«jums nolasÄ«ja un cik ilgi tas prasÄ«ja izpildi. Tas ļauj optimizēt.

Varat izveidot rakurstabulu virs vaicājuma rezultāta. JÅ«s nosÅ«tÄ«jāt pieprasÄ«jumu ClickHouse un saņēmāt dažus datus. Un tad jÅ«s varat pārvietot Å”os datus ar peli un izveidot sava veida rakurstabulu.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Nākamā interesanta lieta ir plānoÅ”ana. Pieņemsim, ka mums ir Ŕāds pieprasÄ«jums: grēkam, cos no 0 lÄ«dz 299. Un, lai to uzzÄ«mētu, jums jāizvēlas cilne ā€œZÄ«mētā€, un jÅ«s iegÅ«sit grafiku ar grēku un cos.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Varat to sadalīt dažādās asīs, t.i., varat vienlaikus zīmēt divus grafikus blakus. Uzrakstiet vienu komandu un otru komandu.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Jūs varat zīmēt histogrammas.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Varat to sadalīt grafiku matricā.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

JÅ«s varat izveidot siltuma karti.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

JÅ«s varat izveidot termisko kalendāru. Starp citu, Ŕī ir ļoti ērta lieta, ja gada laikā jāanalizē anomālijas, t.i., jāatrod vai nu tapas, vai kritumi. Å Ä« datu vizualizācija man to palÄ«dzēja.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Nākamais ir Treemap.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Sankeys ir interesanta diagramma. ViņŔ ir vai nu Streamgrahps, vai River. Bet es to saucu par upi. Tas arÄ« ļauj jums meklēt jebkādas anomālijas. Tas ir ļoti ērti. Iesaku to izmantot meklÄ“Å”anai.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Nākamā interesanta lieta ir dinamiskas kartes zÄ«mÄ“Å”ana. Ja savā datu bāzē saglabājat platuma un garuma grādus un, teiksim, saglabājat galamērÄ·i, ja jums, piemēram, lido kravas vai lidmaŔīnas, varat zÄ«mēt galamērÄ·a ceļus. ArÄ« tur jÅ«s varat iestatÄ«t ātrumu un izmēru Å”iem objektiem, kuros tie lido.

Bet problēma ar Å”o karti ir tā, ka tā zÄ«mē tikai pasaules karti, nav nekādu detaļu.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Vēlāk pievienoju Google karti. Ja saglabājat platumu, garumu, tad rezultātu varat uzzÄ«mēt Google kartē, bet bez lidmaŔīnas atbalsta.

Mēs esam apsprieduÅ”i galvenās funkcijas darbā ar rezultātiem un vaicājumiem Tabix.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Nākamā ir jÅ«su ClickHouse servera analÄ«ze. Ir atseviŔķa cilne ā€œMetricsā€, kurā var redzēt katras kolonnas saglabāto datu lielumu. Ekrānuzņēmums parāda, ka Å”is ā€œnovirzÄ«tājaā€ lauks aizņem aptuveni 730 Gb. Ja mēs atteiksimies no Ŕī lauka, mēs ietaupÄ«sim trÄ«s 700 GB Ŕķembas, t.i., apmēram 2 TB, kas mums nav nepiecieÅ”ami.

Mums ir arÄ« lauks "request_id", ko mēs saglabājam virknē. Bet, ja mēs sāksim to glabāt skaitliskā formā, Å”is lauks ievērojami saruks.

Tas parāda arī servera konfigurāciju un jūsu klastera mezglu sarakstu.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Nākamā cilne ir metrika. Viņi iekļūst reāllaikā ar ClickHouse un vienkārÅ”i ļauj analizēt servera stāvokli un saprast, kas ar to notiek. Tas neaizstāj pilnu Grafana. Tas ir nepiecieÅ”ams ātrai analÄ«zei.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Nākamā cilne ir procesi. No tiem var saprast, kas notiek serverÄ«. Saproti, kas tur notiek. Man bija pieprasÄ«jums, kas katru reizi patērēja 200 GB lasÄ«Å”anas. Es to redzēju, pateicoties Å”ai saskarnei. Es viņu noķēru un izlaboju. Un tas izrādÄ«jās apmēram 30 GB, t.i., dažkārt veiktspēja.

ClickHouse ā€“ vizuāli ātra un intuitÄ«va datu analÄ«ze Tabix. Igors Strihars

Paldies! Un tas ir atvērtā koda versijā

ES pabeidzu. Un, starp citu, tas ir OpenSource, tas ir bezmaksas un jums pat nav nepiecieÅ”ams to lejupielādēt. Atveriet to pārlÅ«kprogrammā, un viss darbosies.

jautājumi

Igor, kas tālāk? Kur jūs izstrādāsit Ŕo rīku?

Pēc tam tiks parādīti informācijas paneļi, t.i., iespējams, tiks parādīti informācijas paneļi. Integrācija ar citām datu bāzēm. Es to izdarīju, bet vēl neesmu publicējis to OpenSource. Tas ir MySQL un, iespējams, PostgreSQL. Tas ir, pieprasījumus no Tabix būs iespējams nosūtīt ne tikai uz ClickHouse, bet arī uz citiem rīkiem.

Skaidrs, ka ir paveikts milzÄ«gs darbs. Tā izrādÄ«jās diezgan pilnÄ«ga ideja. Tas tika darÄ«ts pārlÅ«kprogrammā, acÄ«mredzot, lai novērstu kruÄ·us uz visādiem cirvjiem un ātri visu samestu kopā. Es dzirdēju, ka esat ieslēgts php darbu, tāpēc vienkārŔākais veids ir ierakstÄ«t to pārlÅ«kprogrammā, un tas darbosies visur. Par Å”o jautājumu nav nekādu jautājumu. Jautājums ir Ŕāds. Tur tieŔām daudz kas ir paveikts. Cik cilvēku pie tā strādāja? Un cik ilgi tas viss prasÄ«ja? Tā kā pielāgotajiem rÄ«kiem parasti nav tik daudz funkcionalitātes.

Viens cilvēks no mÅ«su komandas strādāja no vasaras lÄ«dz rudenim. Å Ä« bija pirmā versija. Tad es viens pats veicu 330 apņemÅ”anās. Ko jÅ«s redzat, mēs ar kolēģi to izdarÄ«jām uz pusēm. 3 mēneÅ”u laikā no paÅ”as pirmās versijas lÄ«dz pēdējai pārsvarā to darÄ«ju vienatnē. Bet es pārāk labi nepārzinu Javascript. Å is bija mans vienÄ«gais un, ceru, arÄ« pēdējais Javascript projekts, ar kuru strādāju. Sapratu, paskatÄ«jos ā€“ ak, Å”ausmas. Bet es ļoti gribēju pabeigt produktu, un tas notika.

Liels paldies par ziņojumu! Tas ir lielisks rīks. AR Glezna Vai esi salīdzinājis?

Paldies. Tāpēc es to nosaucu par Tabix, jo pirmie burti ir vienādi.

Tāpēc, ka tu konkurē?

Investīcijas būs lielas, konkurēsim.

Kā jÅ«s varat piedāvāt pārdot iekŔējiem analÄ«tiÄ·iem, ko Å”is rÄ«ks pilnÄ«bā aizstās *tabula*? Kādi bÅ«s argumenti?

Sadarbojas ar ClickHouse. Izmēģināju Tableau, bet tur nevar rakstÄ«t atbalstu vārdnÄ«cām un tamlÄ«dzÄ«gi. Es zinu, kā cilvēki strādā ar Tabix. Viņi raksta vaicājumu, augÅ”upielādē to CSV un augÅ”upielādē BI. Un viņi jau tur kaut ko dara. Bet man ir grÅ«ti iedomāties, kā viņi to dara, jo tas ir grafisks rÄ«ks. Tas var izlādēt 5 rindu, maksimāli 000 rindu, bet ne vairāk, pretējā gadÄ«jumā pārlÅ«kprogramma netiks galā.

Tas nozīmē, ka datu apjomam ir daži nopietni ierobežojumi, vai ne?

Jā. Es nevaru iedomāties, ka jÅ«s vēlaties augÅ”upielādēt 10 000 rindu savā tabulā savā pārlÅ«kprogrammas ekrānā. Par ko?

Vai tas nozÄ«mē, ka Ŕī ir saskarne ātrai datu apskatei? Nedaudz pagriezt, pagriezt?

Jā, ātri redziet, kā tas darbojas, un vienkārÅ”i izveidojiet kopsavilkuma diagrammu. Un tad iedod kaut kur. Mums ir sava ziņoÅ”anas sistēma, no kuras es vienkārÅ”i ņemu Å”o pieprasÄ«jumu. Es zÄ«mēju Tabix un nosÅ«tu to mÅ«su ziņojumiem.

Un vēl jautājums. Kohortas analīze?

Ja būs kādi pieprasījumi, pievienosim.

Kad jūs tikko sākāt to lietot? ClickHouse, cik ilgi notika ievieŔana? NoklikŔķiniet uz Māja un atvedot uz ražoŔanas stāvoklis?

Kā jau teicu, mēs ieviesām testa kopu ļoti Ä«sā laikā. Mēs to izvietojām divās dienās. Un mēs to pārbaudÄ«jām vēl pāris nedēļas. Un ražoÅ”anu sasniedzām 3 mēneÅ”os.Bet mums bija savs ETL, t.i., datu ierakstÄ«Å”anas rÄ«ks. Un viņŔ rakstÄ«ja visu, ko varēja. ViņŔ var rakstÄ«t MongoDB, Cassandra, MySQL. Bija viegli iemācÄ«t viņam rakstÄ«t ClickHouse. Mums bija gatava infrastruktÅ«ra ātrai ievieÅ”anai. 3 mēneÅ”u laikā sākām izmest pirmo komponentu. 6 mēneÅ”u laikā mēs pilnÄ«bā atteicāmies no visa pārējā. Mums ir palicis tikai viens ClickHouse.

Igor, liels paldies par ziņojumu. Man ļoti patika taku veidoÅ”anas funkcionalitāte, izmantojot kartes. Vai ir kādi plāni integrācijai ar Yandex.Maps un jo Ä«paÅ”i ar pielāgotu Yandex.Maps?

Es mēģināju integrēt Google kartes vietā, bet Yandex.Maps neatradu tumÅ”u tēmu. Es tev neteicu vienu gabalu. Es attÄ«Å”u, lai pievienotu.

Slaids ā€“ Google karte. Tur ir komanda ā€œDRAW_GMAPSā€, kas uzzÄ«mē karti. Ir komanda ā€œDRAW_YMAPSā€, t.i., tā var uzzÄ«mēt Yandex.Map. Bet patiesÄ«bā zem Ŕīs komandas ir Javascript, t.i., datus, ko saņemat no ClickHouse, var pārsÅ«tÄ«t uz Javascript, ko jÅ«s Å”eit ierakstāt. Un jums ir izvades laukums, kur tas bÅ«tu jāuzzÄ«mē. JÅ«s varat uzzÄ«mēt jebkuru grafiku, t.i., jebkuru grafiku, karti, jÅ«s varat uzzÄ«mēt savu komponentu. Pirms tam man bija cita bibliotēka paÅ”u grafiku zÄ«mÄ“Å”anai.

Tas ir, vai ir kāds rīks displeja funkcionalitātes pielāgoŔanai?

JebkurÅ”. JÅ«s varat ņemt un pārkrāsot Å”os punktus, padarot tos nevis sarkanus, bet zilus, zaļus.

Paldies par ziņojumu! Jums bija slaids, kurā tika parādÄ«ti alternatÄ«vi vaicājuma rÄ«ki NoklikŔķiniet uz Māja informācijas paneļu un analÄ«tisko pārskatu izveidei. Es to saprotu brÄ«dÄ«, kad sāki strādāt ar ClickHouse, Å”iem rÄ«kiem nav rakstÄ«ti adapteri. Un es domāju, kāpēc jÅ«s nolēmāt izveidot savu rÄ«ku, nevis rakstÄ«t adapteri kādam gatavam instrumentam? Es domāju, ka testa redaktora pielāgoÅ”ana ir ātra. Kāpēc jÅ«s nolēmāt darÄ«t tik daudz darba?

Å eit ir interesants moments - fakts ir tāds, ka es esmu tehniskais direktors, nevis datu zinātnieks. LÄ«dz brÄ«dim, kad sākām ieviest Druid, manā ceļvedÄ« bija aptuveni 50% uzdevumu ā€” aprēķināsim to, aprēķināsim to, vai analizēsim Å”o. Un izrādÄ«jās, ka mēs ieviesām ClickHouse. Un viņŔ sāka ātri visu bÅ«vēt, skaitÄ«t un ātri aizvēra savu ceļvedi. Un lÄ«dz tam laikam es sapratu, ka man trÅ«kst zināŔanu datu zinātnē un datu vizualizācijā. Tabix ir sava veida mans mājasdarbs datu vizualizācijas apguvei. SkatÄ«jos, kā papildināt Zeppelin. Man ir neliela nepatika pret viņa programmÄ“Å”anu. Redash paskatÄ«jos kā pievienot, bet man pietika ar parastu redaktoru. Un SuperSet ir arÄ« rakstÄ«ts valodā, kas man Ä«sti nepatÄ«k. Un tāpēc es nolēmu braukt ar velosipēdu, un tas notika.

Igor, vai tu pieņem Pull pieprasījumus?

Jā.

Liels paldies par ziņojumu! Un divi jautājumi. Pirmkārt, jÅ«s nerunājat ļoti glaimojoÅ”i Javascript. Vai rakstÄ«jāt tukŔā Javascript vai tas ir kaut kāds ietvars?*

Labāk tukŔā Javascript.

Tātad, kāds ietvars?

Leņķisks.

Tas ir skaidrs. Un otrais jautājums. Vai esat apsvēris R Šø *SpÄ«dÄ«gs**?*

Uzskatīja to. Spēlēja.

Varat arī vienkārŔi uzrakstīt adapteri.

ViņŔ ir. Å Ä·iet, ka kopienai tas izdevās, taču, atbildot uz iepriekŔējo jautājumu, es gribēju to izmēģināt pats.

*Nē, attiecībā uz vizualizāciju, tā ir arī tur.

JÅ«s sakāt, ka tāda ir, un tas jums uzzÄ«mēs grafiku. Atvēru grāmatu par datu vizualizāciju. Un es domāju: ā€œÄ»aujiet man mēģināt vizualizēt Å”os datus. Es viņam uzrakstÄ«Å”u, lai viņŔ varētu atjaunot datus. Un es sāku labāk izprast datu plÅ«smas tehnoloÄ£iju. Un, ja es bÅ«tu paņēmis gatavu komponentu, es personÄ«gi bÅ«tu sliktāk iemācÄ«jies to lietot, tas ir, vizualizāciju. Bet jā, man patika R, bet grāmatu ā€œR for Dummiesā€ vēl neesmu lasÄ«jusi.

Paldies!

VienkārÅ”s jautājums. Vai ir kādi veidi, kā ātri augÅ”upielādēt zÄ«mi vai grafiku?

Var augÅ”upielādēt CSV vai Excel formātā.

Nevis dati, bet gatava plāksne, gatavs grafiks? Piemēram, lai parādÄ«tu priekÅ”niekam.

Ir poga ā€œAugÅ”upielādētā€ un ir poga ā€œAugÅ”upielādēt grafiku png formātā, jpg formātāā€.

Paldies!

PS Mini instrukcijas tabix instalēŔanai

  • lejuplādēt jaunākais izlaidums
  • Izpakojiet, kopējiet direktoriju build nginx saknes_ceļā
  • Konfigurējiet nginx

Avots: www.habr.com

Pievieno komentāru