ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Navrhujem, aby ste si prečítali prepis správy Igora Stryhara za rok 2017 „ClickHouse – vizuálne rýchla a prehľadná analýza údajov v Tabixe“.

Webové rozhranie pre ClickHouse v projekte Tabix.
Kľúčové vlastnosti:

  • Funguje s ClickHouse priamo z prehliadača, bez potreby inštalácie ďalšieho softvéru;
  • Editor dotazov so zvýraznením syntaxe;
  • Automatické dokončovanie príkazov;
  • Nástroje na grafickú analýzu vykonávania dotazov;
  • Farebné schémy na výber.
    ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar


ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Som technický riaditeľ SMI2. Sme agregátor správ na burze správ. Ukladáme množstvo údajov, ktoré dostávame od našich partnerov a registrujeme ich v ClickHouse – približne 30 000 požiadaviek za sekundu.

Ide o údaje ako:

  • Kliknutia na novinky.
  • Novinky sa zobrazujú v agregátore.
  • Banner sa zobrazuje v našej sieti.
  • A zaznamenávame udalosti z vlastného počítadla, ktoré je podobné ako Yandex.Metrica. Toto je naša vlastná mikroanalýza.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Pred ClickHouse sme mali veľmi hektický život. Veľa sme trpeli, snažili sme sa tieto dáta niekde uložiť a nejako ich analyzovať.

Život pred ClickHouse – infiniDB

Prvá vec, ktorú sme mali, bola infiniDB. Žila s nami 4 roky. Spustili sme to s ťažkosťami.

  • Nepodporuje klastrovanie ani sharding. Žiadne takéto chytré veci štandardne nevyšli z krabice.
  • Má problémy s načítaním údajov. Iba špecifická konzolová utilita, ktorá dokázala načítať iba súbory CSV a iba nejakým veľmi nejasným spôsobom.
  • Databáza je jednovláknová. Mohli ste písať alebo čítať. Ale umožnilo to spracovať veľké množstvo dát.
  • A mala aj zaujímavú barličku. Každý večer musel byť server reštartovaný, inak by nefungoval.

Pracovala u nás do konca roka 2016, kedy sme úplne prešli na ClickHouse.

Život pred ClickHouse – Cassandra

Keďže infiniDB bol jednovláknový, rozhodli sme sa, že potrebujeme nejakú viacvláknovú databázu, v ktorej by sme mohli písať veľa vlákien súčasne.

Vyskúšali sme veľa zaujímavých vecí. Potom sme sa rozhodli vyskúšať Cassandru. S Cassandrou bolo všetko skvelé. 10 000 požiadaviek za sekundu na ponuku. 2 žiadostí niekde na prečítanie.

Mala však aj svoje záujmy. Raz za mesiac alebo raz za dva mesiace zažila desynchronizáciu databázy. A musel som sa zobudiť a bežať opraviť Cassandru. Servery boli reštartované jeden po druhom. A všetko sa stalo hladkým a krásnym.

Život pred ClickHouse – Druid

Potom sme si uvedomili, že potrebujeme napísať ešte viac údajov. V roku 2016 sme začali pozerať Druida.

Druid je softvér s otvoreným zdrojovým kódom napísaný v jazyku Java. Veľmi konkrétne. A bol vhodný pre clickstream, keď sme potrebovali uložiť nejaký stream udalostí a následne na nich vykonávať agregáciu alebo robiť analytické reporty.

Druid mal verziu 0.9.X.

Samotná databáza je veľmi náročná na nasadenie. Toto je zložitosť infraštruktúry. Na jeho nasadenie bolo potrebné namontovať veľa, veľa železa. A každý kus hardvéru bol zodpovedný za svoju samostatnú úlohu.

Na načítanie dát do nej bolo potrebné použiť nejaký druh šamanizmu. Existuje projekt OpenSource - Tranquility, ktorý od nás strácal dáta v streame. Keď sme do neho nahrali dáta, stratil ich.

Ale nejako sme to začali realizovať. My, ako ježkovia, ktorí brali drogy, no naďalej jedli kaktusy, sme ho začali zavádzať. Pripraviť na to všetku infraštruktúru nám trvalo asi mesiac. To znamená objednávať servery, konfigurovať roly a plne automatizovať nasadenie. To znamená, že v prípade zlyhania klastra sa automaticky nasadí druhý klaster.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Potom sa však stal zázrak. Bol som na dovolenke a kolegovia mi poslali odkaz na habr, ktorá hovorí, že Yandex sa rozhodol otvoriť ClickHouse. Hovorím, skúsme to.

A doslova za 2 dni sme nasadili testovací klaster ClickHouse. Začali sme do nej načítavať dáta. V porovnaní s infiniDB je to elementárne, v porovnaní s Druidom je to elementárne. V porovnaní s Cassandrou je to tiež elementárne. Pretože ak načítate dáta z PHP do Cassandry, tak to nie je elementárne.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

čo sme dostali? Výkon v rýchlosti. Výkon pri ukladaní údajov. To znamená, že sa používa oveľa menej miesta na disku. ClickHouse je rýchly, v porovnaní s inými produktmi je veľmi rýchly.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

V čase spustenia, keď Yandex zverejnil ClickHouse v OpenSource, existoval iba konzolový klient. My v našej spoločnosti SMI2 sme sa rozhodli, že skúsime spraviť natívneho klienta pre web, aby sme si otvorili stránku z prehliadača, napísali požiadavku a dostali výsledok, pretože sme začali písať veľa požiadaviek. Písanie v konzole je ťažké. A urobili sme našu prvú verziu.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

A niekde bližšie k zime minulého roka sa začali objavovať nástroje tretích strán na prácu s ClickHouse. Sú to nástroje ako:

Pozriem sa na niektoré z týchto nástrojov, teda na tie, s ktorými som pracoval.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Dobrý nástroj, ale pre Druida. Keď bol Druid implementovaný, testoval som SuperSet. Mal som ho rád. Pre Druida je to veľmi rýchle.

Nie je vhodný pre ClickHouse. To znamená, že sa hodí, spustí sa, ale je pripravený spracovať iba elementárne dotazy ako: udalosť SELECT, udalosť GROUP BY. Nepodporuje zložitejšiu syntax ClickHouse.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Ďalším nástrojom je Apache Zeppelin. To je dobrá a zaujímavá vec. Tvorba. Podporuje notebooky, dashboardy a podporuje premenné. Viem, že niekto z komunity ClickHouse to používa.

Neexistuje však žiadna podpora syntaxe ClickHouse, t.j. budete musieť písať dotazy buď v konzole alebo niekde inde. Ďalej skontrolujte, či to všetko funguje. Je to len nepohodlné. Má však dobrú podporu palubnej dosky.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Ďalším nástrojom je Redash.IO. Redash je hosťovaný na internete. To znamená, že na rozdiel od predchádzajúcich nástrojov sa nemusí inštalovať. A toto je dashboard s možnosťou konsolidácie údajov z rôznych zdrojov údajov. To znamená, že si môžete stiahnuť z ClickHouse, z MySQL, z PostgreSQL az iných databáz.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Len pred mesiacom (marec 2017) sa v Grafane objavila podpora. Keď v Grafane vytvárate prehľady napríklad o stave vášho hardvéru alebo o niektorých metrikách, teraz môžete ten istý graf alebo nejaký panel zostaviť priamo z údajov z ClickHouse. Je to veľmi pohodlné a sami to používame. To vám umožní nájsť anomálie. To znamená, že ak sa niečo stane a niektorý hardvér spadne alebo sa napne, môžete sa pozrieť na dôvod, či sa tieto údaje podarilo dostať do ClickHouse.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Zdalo sa mi veľmi nepohodlné písať v týchto nástrojoch alebo v konzole. A rozhodol som sa vylepšiť naše prvé rozhranie. A nápad som dostal od EventSQL, SeperSet, Zeppelin.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Čo si chcel? Chcel som získať grafiku, vylepšený editor a implementovať podporu pre slovníky tipov. Pretože ClickHouse má skvelú funkciu – slovníky. So slovníkmi sa však ťažko pracuje, pretože si musíte zapamätať formát uložených hodnôt, teda či je to číslo alebo reťazec atď. A keďže často používame slovníky v rôznych variáciách, bolo dosť ťažké písať dopyty.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Od vydania našej prvej verzie ubehli 3 mesiace. Urobil som asi 330 záväzkov súkromnej pobočke a ukázalo sa, že je to Tabix.

Na rozdiel od predchádzajúcej verzie, ktorá sa volala ClickHouse-Frontend, som sa rozhodol premenovať ju na jednoduchý názov. A ukázalo sa, že Tabix.

Čo sa objavilo?

Kreslí grafy. Podporuje syntax ClickHouse SQL. Poskytuje rady ohľadom funkcií a dokáže veľa zaujímavých vecí.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Takto vyzerá všeobecná schéma Tabix. Na ľavej strane je strom. V strede je editor dotazov. A nižšie je výsledok tejto žiadosti.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Ďalej vám ukážem, ako funguje editor dotazov.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Tu automatické dopĺňanie automaticky funguje na tabuľke a podľa toho vyzve na automatické dopĺňanie polí. A tipy na funkcie. Ak stlačíte ctrl enter, požiadavka sa vykoná alebo zlyhá s chybou. Najjednoduchšia požiadavka sa odošle do Tabix a získa sa výsledok, t.j. môžete rýchlo pracovať s ClickHouse.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Slovníky, ako som už povedal, sú veľmi zaujímavá vec, s ktorou veľa pracujeme. A čo nám umožnilo robiť veľa vecí. Povedzme, že všetky mestá uložíme do slovníkov. Ukladáme identifikátor mesta a názov mesta, jeho zemepisnú šírku a dĺžku. A v databáze ukladáme len identifikátor mesta. Podľa toho dáta veľmi silno komprimujeme.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Zdá sa, že je to jednoduchá vec, ale v ClickHouse to pomáha veľmi zaujímavým spôsobom. Vzhľadom na skutočnosť, že ClickHouse podporuje iba vnorené spojenia, dopyt rastie smerom nadol a je dostatočne široký. A keď sa otvorí zátvorka a vstúpi nejaký dlhý výraz, potom niečo také jednoduché, ako je zbalenie dotazu, uľahčí prácu so samotným dotazom. Pretože keď je dopyt dlhý 200 – 300 riadkov a má veľkú šírku, je veľmi užitočné dopyt zbaliť a potom nájsť nejaké miesto alebo ho nejako lokalizovať.

Strom objektov, multiquery a karty (Video 13:46 https://youtu.be/w1-XsL3nbRg?t=826)

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Ďalej vám ukážem strom a karty. Vľavo je strom, navrchu môžete vytvoriť niekoľko kariet. Karty sú ako pracovný priestor. Môžete vytvoriť niekoľko kariet a každú z nich pomenovať inak. Je to ako mini-systém na zostavenie správy.

Karty sa automaticky ukladajú. Ak reštartujete prehliadač alebo zatvoríte alebo otvoríte Tabix, všetko sa uloží.

Klávesová skratka – pohodlné (Video 14:39 https://youtu.be/w1-XsL3nbRg?t=879)

Existujú klávesové skratky a je ich pomerne veľa. Niektoré z nich som tu vybral ako príklad. Ide o prepínanie kariet, vykonanie požiadavky alebo vykonanie niekoľkých požiadaviek.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Ukážem vám, ako pracovať s výsledkom. Posielame žiadosť. Tu kreslím hriech, cos a tg. Výsledok môžete zvýrazniť, t.j. nakresliť typickú mapu pre stĺpec. Môžete zvýrazniť kladné alebo záporné hodnoty. Alebo jednoducho vyfarbite konkrétny prvok tabuľky. To je výhodné, keď je stôl obrovský a potrebujete očami nájsť nejakú anomáliu. Keď som hľadal anomálie, niektoré čiary, niektoré prvky som zvýraznil zelenou alebo červenou farbou.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Je tam veľa zaujímavých vecí. Napríklad, ako skopírovať do Redmine Markdown. Ak potrebujete výsledok niekam skopírovať, je to veľmi výhodné. Môžete jednoducho vybrať oblasť, povedať „Kopírovať do Redmine“ a skopíruje sa do Redmine Markdown alebo vytvorí dotaz Kam.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Ďalej je optimalizácia dopytov. Raz som zabudol zadať pole „dátum“. A moja požiadavka v ClickHouse nebola spracovaná veľmi, veľmi rýchlo, ale rýchlo, t.j. menej ako sekundu. Keď som videl, koľko riadkov prešiel, dostal som strach. Za deň do tejto tabuľky nenapíšeme toľko riadkov. Začal som analyzovať žiadosť a zistil som, že som na jednom mieste zmeškal rande. To znamená, že som zabudol uviesť, že nepotrebujem údaje za celú tabuľku, ale za konkrétne obdobie.

Tabix má záložku „Štatistiky“, v ktorej je uložená celá história odoslaných požiadaviek, t.j. tam vidíte, koľko riadkov bola táto požiadavka prečítaná a ako dlho trvalo jej vykonanie. To umožňuje optimalizáciu.

Nad výsledkom dotazu môžete vytvoriť kontingenčnú tabuľku. Poslali ste žiadosť spoločnosti ClickHouse a dostali ste nejaké údaje. A potom môžete tieto údaje presunúť pomocou myši a vytvoriť si nejakú kontingenčnú tabuľku.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Ďalšou zaujímavou vecou je plánovanie. Povedzme, že máme nasledujúcu požiadavku: pre hriech, cos od 0 do 299. A aby ste ho nakreslili, musíte vybrať kartu „Draw“ a dostanete graf s vaším hriechom a cos.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Môžete to rozdeliť na rôzne osi, t.j. môžete nakresliť dva grafy vedľa seba naraz. Napíšte jeden príkaz a druhý príkaz.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Môžete kresliť histogramy.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Môžete to rozdeliť do matice grafov.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Môžete vytvoriť tepelnú mapu.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Môžete si vytvoriť termálny kalendár. Mimochodom, je to veľmi výhodná vec, keď potrebujete analyzovať anomálie viac ako rok, t. j. nájsť špičky alebo kvapky. Táto vizualizácia dát mi v tom pomohla.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Ďalším je Treemap.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Sankeys je zaujímavý graf. Je to buď Streamgrahps alebo River. Ale ja tomu hovorím rieka. Umožňuje tiež hľadať akékoľvek anomálie. Je to veľmi pohodlné. Odporúčam použiť na vyhľadávanie.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Ďalšou zaujímavosťou je kreslenie dynamickej mapy. Ak do databázy uložíte zemepisnú šírku, dĺžku a povedzme uložíte cieľ, ak napríklad lietate nákladným autom alebo lietadlám, môžete kresliť cieľové cesty. Tiež tam môžete nastaviť rýchlosť a veľkosť týchto objektov, do ktorých vletia.

Problém tejto mapy je ale v tom, že kreslí iba mapu sveta, nie je tam žiadny detail.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Neskôr som pridal Google mapu. Ak uložíte zemepisnú šírku a dĺžku, potom môžete výsledok nakresliť na mapu Google, ale bez podpory lietadla.

Rozoberali sme hlavné funkcie práce s výsledkami a dotazmi v Tabixe.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Ďalšou je analýza vášho servera ClickHouse. Existuje samostatná karta „Metriky“, kde môžete vidieť veľkosť uložených údajov pre každý stĺpec. Snímka obrazovky ukazuje, že toto pole „referrer“ zaberá približne 730 Gb. Ak toto pole opustíme, ušetríme tri 700 GB úlomky, teda asi 2 TB, ktoré nepotrebujeme.

Máme tiež pole „request_id“, ktoré ukladáme do reťazca. Ak ho ale začneme ukladať v číselnej podobe, toto pole sa enormne zmenší.

Zobrazuje tiež konfiguráciu servera a zoznam uzlov vo vašom klastri.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Ďalšou kartou sú metriky. S ClickHouse sa dostanú do reálneho času a jednoducho vám umožnia analyzovať stav servera a pochopiť, čo sa s ním deje. Toto nie je náhrada za plnú Grafanu. To je potrebné pre rýchlu analýzu.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Ďalšou kartou sú procesy. Z nich môžete pochopiť, čo sa deje na serveri. Pochopte, čo sa tam deje. Mal som požiadavku, ktorá zakaždým spotrebovala 200 GB čítania. Videl som to vďaka tomuto rozhraniu. Chytil som ho a opravil. A ukázalo sa, že je to asi 30 GB, teda občas výkon.

ClickHouse – vizuálne rýchla a intuitívna analýza dát v Tabix. Igor Stryhar

Ďakujem! A toto je v OpenSource

Skončil som. A mimochodom, je to OpenSource, je zadarmo a ani si ho nemusíte sťahovať. Otvorte ho v prehliadači a všetko bude fungovať.

otázky

Igor, čo ďalej? Kde budete tento nástroj vyvíjať?

Ďalej sa zobrazia informačné panely, t.j. možno sa objavia informačné panely. Integrácia s inými databázami. Urobil som to, ale ešte som to nepublikoval v OpenSource. Toto je MySQL a možno PostgreSQL. To znamená, že z Tabixu bude možné posielať požiadavky nielen do ClickHouse, ale aj do iných nástrojov.

Je jasné, že sa urobil obrovský kus práce. Ukázalo sa, že ide o celkom ucelený nápad. Bolo to urobené v prehliadači, zrejme, aby sa odstránili barličky na všetkých druhoch osí a rýchlo sa to celé spojilo. Počul som, že si zapnutý php funguje, takže najjednoduchšie je napísať ho do prehliadača a bude fungovať všade. V tejto súvislosti nie sú žiadne otázky. Otázkou je toto. Urobilo sa tam naozaj veľa. Koľko ľudí na tom pracovalo? A ako dlho to celé trvalo? Pretože vlastné nástroje zvyčajne nemajú toľko funkcií.

Jeden človek z nášho tímu pracoval od leta do jesene. Toto bola prvá verzia. Potom som sám urobil 330 záväzkov. Čo vidíte, my sme to s kolegom zvládli na polovicu. Za 3 mesiace, od úplne prvej verzie po poslednú, som to väčšinou robil sám. Javascript ale moc dobre neovládam. Toto bol môj jediný a dúfam, že aj môj posledný Javascript projekt, s ktorým som pracoval. Mám to, pozrel som - oh, hrôza. Ale naozaj som chcel dokončiť produkt a toto sa stalo.

Ďakujem veľmi pekne za správu! Je to skvelý nástroj. S Výjav Porovnali ste?

Ďakujem. Preto som ho nazval Tabix, pretože prvé písmená sú rovnaké.

Pretože súťažíte?

Bude sa veľa investovať, budeme súťažiť.

Ako môžete ponúknuť predaj interným analytikom, ktorých tento nástroj úplne nahradí *Tabuľka*? Aké budú argumenty?

Natívne funguje s ClickHouse. Skúšal som Tableau, ale nedá sa tam napísať podpora pre slovníky a podobne. Viem, ako ľudia pracujú s Tabixom. Napíšu dotaz, nahrajú ho do CSV a nahrajú do BI. A už tam niečo robia. Ale ťažko si viem predstaviť, ako to robia, pretože ide o grafický nástroj. Dokáže uvoľniť 5 000 riadkov, maximálne 6 000 riadkov, ale nie viac, inak si prehliadač neporadí.

To znamená, že existujú určité vážne obmedzenia množstva údajov, však?

Áno. Neviem si predstaviť, že by ste chceli nahrať 10 000 riadkov do tabuľky na obrazovku prehliadača. Prečo?

Znamená to, že ide o rozhranie na rýchle prezeranie údajov? Trochu to pokrútiť, pokrútiť?

Áno, rýchlo sa pozrite, ako to funguje, a vytvorte súhrnný graf. A potom to niekam dať. Máme vlastný systém nahlasovania, odkiaľ túto požiadavku jednoducho preberám. Kreslím v Tabixe a posielam do nášho spravodajstva.

A ďalšia otázka. Kohortová analýza?

Ak budú nejaké požiadavky, doplníme ich.

Kedy ste ho práve začali používať? ClickHouse, ako dlho trvala implementácia? clickhouse a prinášanie do stav výroby?

Ako som povedal, implementovali sme testovací klaster vo veľmi krátkom čase. Nasadili sme to za dva dni. A testovali sme to ešte pár týždňov. A výrobu sme dosiahli za 3 mesiace, ale mali sme vlastný ETL, teda nástroj na zaznamenávanie dát. A písal všetko, čo mohol. Vie písať v MongoDB, Cassandra, MySQL. Bolo ľahké ho naučiť písať v ClickHouse. Mali sme pripravenú infraštruktúru na rýchlu implementáciu. Do 3 mesiacov sme začali vyhadzovať prvú zložku. Za 6 mesiacov sme úplne opustili všetko ostatné. Ostal nám už len jeden ClickHouse.

Igor, ďakujem veľmi pekne za správu. Veľmi sa mi páčila funkčnosť budovania ciest pomocou máp. Existujú nejaké plány na integráciu s Yandex.Maps a najmä s vlastnými Yandex.Maps?

Snažil som sa integrovať namiesto Google mapy, ale nenašiel som tmavý motív na Yandex.Maps. Nepovedal som ti ani jeden kúsok. Pretočím, aby som pridal.

Snímka – mapa Google. Existuje príkaz „DRAW_GMAPS“, ktorý nakreslí mapu. Existuje príkaz „DRAW_YMAPS“, to znamená, že môže nakresliť mapu Yandex. Ale v skutočnosti sa pod týmto príkazom nachádza Javascript, t.j. údaje, ktoré dostanete od ClickHouse, môžete preniesť do Javascriptu, ktorý tu napíšete. A máte výstupnú oblasť, kde by sa to malo nakresliť. Môžete nakresliť akýkoľvek graf, teda akýkoľvek graf, mapu, môžete si nakresliť svoj vlastný komponent. Predtým som mal inú knižnicu na kreslenie samotných grafov.

To znamená, existuje nástroj na prispôsobenie funkčnosti zobrazenia?

Akýkoľvek. Môžete si vziať a prefarbiť tieto bodky, takže nie sú červené, ale modré, zelené.

Ďakujeme za správu! Mali ste snímku, ktorá predstavovala alternatívne nástroje dotazovania clickhouse na vytváranie dashboardov a analytických správ. Chápem to v momente, keď ste začali spolupracovať s ClickHouse, pre tieto nástroje neboli napísané žiadne adaptéry. A ja sa pýtam, prečo ste sa rozhodli vyrobiť si vlastný nástroj, namiesto písania adaptéra na nejaký hotový nástroj? Myslím si, že ladenie testovacieho editora je rýchle. Prečo ste sa rozhodli robiť toľko práce?

Je tu jeden zaujímavý bod – faktom je, že som technický riaditeľ, nie dátový vedec. V čase, keď sme začali implementovať Druid, mala moja cestovná mapa asi 50% úloh – poďme vypočítať toto, alebo poďme vypočítať toto, alebo toto analyzovať. A ukázalo sa, že sme implementovali ClickHouse. A začal rýchlo všetko stavať, počítať a rýchlo uzavrel svoju cestovnú mapu. A v tom čase som si uvedomil, že mi chýbajú znalosti v oblasti Data Science a vizualizácie údajov. Tabix je taká moja domáca úloha na učenie sa vizualizácie dát. Hľadal som, ako doplniť Zeppelin. Mám mierny odpor k jeho programovaniu. Redash Pozeral som ako to pridať, ale stačil mi obyčajný editor. A SuperSet je tiež napísaný v jazyku, ktorý sa mi veľmi nepáči. A tak som sa rozhodol bicyklovať a stalo sa toto.

Igor, akceptuješ Pull žiadosti?

Áno.

Ďakujem veľmi pekne za správu! A dve otázky. Po prvé, nehovoríte o tom veľmi lichotivo Javascript. Písali ste v holom Javascripte alebo je to nejaký rámec?*

Lepšie v holom Javascripte.

Aký rámec teda?

Hranatá.

To je jasné. A druhá otázka. Zvažovali ste R и *Lesklé**?*

Zvažovali to. Hrané.

Môžete tiež napísať adaptér.

On je. Zdá sa, že komunita to urobila, ale ako som odpovedal na predchádzajúcu otázku, chcel som to vyskúšať sám.

*Nie, čo sa týka vizualizácie, je tam tiež.

Poviete si, že niečo také existuje a nakreslí vám to graf. Otvoril som knihu o vizualizácii dát. A pomyslel som si: „Pokúsim sa tieto údaje vizualizovať. Napíšem mu, aby mohol údaje obnoviť." A začal som lepšie rozumieť technológii dodávky dát. A ak by som si zobral hotový komponent, osobne by som sa ho naučil horšie používať, teda vizualizáciu. Ale áno, páčilo sa mi R, ale knihu „R for Dummies“ som ešte nečítal.

Ďakujeme!

Jednoduchá otázka. Existujú nejaké spôsoby, ako rýchlo nahrať značku alebo plán?

Dá sa nahrať do CSV alebo Excelu.

Nie dáta, ale hotový tanier, hotový graf? Napríklad ukázať šéfovi.

Je tu tlačidlo „Nahrať“ a tlačidlo „Nahrať graf v png, v jpg“.

Ďakujeme!

PS Mini-inštrukcie na inštaláciu tabix

  • Stiahnuť najnovšie vydanie
  • Rozbaľte, skopírujte adresár build v koreňovej_ceste nginx
  • Nakonfigurujte nginx

Zdroj: hab.com

Pridať komentár