ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

Jag föreslÄr att du lÀser utskriften av 2017 Ärs rapport av Igor Stryhar "ClickHouse - visuellt snabb och tydlig dataanalys i Tabix."

WebbgrÀnssnitt för ClickHouse i Tabix-projektet.
Viktiga funktioner:

  • Fungerar med ClickHouse direkt frĂ„n webblĂ€saren, utan att behöva installera ytterligare programvara;
  • FrĂ„geredigerare med syntaxmarkering;
  • Autoslutförande av kommandon;
  • Verktyg för grafisk analys av frĂ„gekörning;
  • FĂ€rgscheman att vĂ€lja mellan.
    ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar


ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

Jag Ă€r teknisk chef för SMI2. Vi Ă€r en nyhetsförmedlare för nyhetsutbyten. Vi lagrar mycket data som vi fĂ„r frĂ„n vĂ„ra partners och registrerar det i ClickHouse – cirka 30 000 förfrĂ„gningar per sekund.

Detta Àr data som:

  • Klickar pĂ„ nyheter.
  • Nyheter visas i aggregatorn.
  • Banner visas i vĂ„rt nĂ€tverk.
  • Och vi registrerar hĂ€ndelser frĂ„n vĂ„r egen disk, som liknar Yandex.Metrica. Detta Ă€r vĂ„r egen mikroanalys.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

Vi hade ett vÀldigt hektiskt liv innan ClickHouse. Vi led mycket, försökte lagra denna data nÄgonstans och pÄ nÄgot sÀtt analysera den.

Livet före ClickHouse – infiniDB

Det första vi hade var infiniDB. Hon bodde hos oss i 4 Är. Vi lanserade det med svÄrighet.

  • Det stöder inte klustring eller skĂ€rning. Inga sĂ„dana smarta saker kom ur lĂ„dan som standard.
  • Hon har svĂ„rt att ladda data. Endast ett specifikt konsolverktyg som bara kunde ladda CSV-filer och bara pĂ„ nĂ„got mycket otydligt sĂ€tt.
  • Databasen Ă€r entrĂ„dig. Du kan antingen skriva eller lĂ€sa. Men det gjorde det möjligt att bearbeta en stor mĂ€ngd data.
  • Och hon hade ocksĂ„ en intressant krycka. Varje natt behövde servern startas om, annars skulle den inte fungera.

Hon arbetade för oss fram till slutet av 2016, dÄ vi helt bytte till ClickHouse.

Livet före ClickHouse – Cassandra

Eftersom infiniDB var enkeltrÄdad bestÀmde vi oss för att vi behövde nÄgon form av flertrÄdad databas dÀr vi kunde skriva mÄnga trÄdar samtidigt.

Vi provade mÄnga intressanta saker. Sedan bestÀmde vi oss för att prova Cassandra. Allt var bra med Cassandra. 10 000 förfrÄgningar per sekund per bud. 2 000 förfrÄgningar nÄgonstans för lÀsning.

Men hon hade ocksÄ sina egna intressen. En gÄng i mÄnaden eller en gÄng varannan mÄnad upplevde hon en databasavsynkronisering. Och jag var tvungen att vakna och springa för att fixa Cassandra. Servrarna startades om en efter en. Och allt blev smidigt och vackert.

Livet före ClickHouse – Druid

DÄ insÄg vi att vi behövde skriva Ànnu mer data. 2016 började vi titta pÄ Druid.

Druid Àr en programvara med öppen kÀllkod skriven i Java. Mycket specifik. Och det var lÀmpligt för clickstream, nÀr vi behöver lagra nÄgon slags ström av hÀndelser och sedan utföra aggregering pÄ dem eller göra analytiska rapporter.

Druid hade version 0.9.X.

SjÀlva databasen Àr mycket svÄr att distribuera. Detta Àr komplexiteten i infrastrukturen. För att distribuera det var det nödvÀndigt att installera mycket, mycket jÀrn. Och varje hÄrdvara var ansvarig för sin egen separata roll.

För att ladda in data i den var det nödvÀndigt att anvÀnda nÄgon form av shamanism. Det finns ett OpenSource-projekt - Tranquility, som förlorade data frÄn oss i en ström. NÀr vi laddade in data i den tappade den bort den.

Men pÄ nÄgot sÀtt började vi implementera det. Vi, som igelkottar som tog droger men fortsatte att Àta kaktus, började introducera det. Det tog oss ungefÀr en mÄnad att förbereda all infrastruktur för det. Det vill sÀga bestÀlla servrar, konfigurera roller och helt automatisera distributionen. Det vill sÀga, i hÀndelse av ett klusterfel kommer det andra klustret automatiskt att distribueras.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

Men sÄ hÀnde ett mirakel. Jag var pÄ semester och mina kollegor skickade en lÀnk till mig habr, som sÀger att Yandex bestÀmde sig för att öppna ClickHouse. Jag sÀger lÄt oss prova det.

Och bokstavligen pÄ tvÄ dagar distribuerade vi ett ClickHouse-testkluster. Vi började ladda in data i den. JÀmfört med infiniDB Àr detta elementÀrt; jÀmfört med Druid Àr detta elementÀrt. JÀmfört med Cassandra Àr det ocksÄ elementÀrt. För om du laddar data frÄn PHP till Cassandra, sÄ Àr detta inte elementÀrt.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

Vad fick vi? Prestanda i hastighet. Prestanda i datalagring. Det vill sÀga mycket mindre diskutrymme anvÀnds. ClickHouse Àr snabbt, det Àr vÀldigt snabbt jÀmfört med andra produkter.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

Vid tidpunkten för lanseringen, nÀr Yandex publicerade ClickHouse i OpenSource, fanns det bara en konsolklient. Vi pÄ vÄrt företag SMI2 bestÀmde oss för att försöka skapa en inbyggd klient för webben, sÄ att vi kunde öppna en sida frÄn en webblÀsare, skriva en förfrÄgan och fÄ resultatet, eftersom vi började skriva mÄnga förfrÄgningar. Att skriva i konsolen Àr svÄrt. Och vi gjorde vÄr första version.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

Och nÄgonstans nÀrmare vintern förra Äret började tredjepartsverktyg för att arbeta med ClickHouse dyka upp. Dessa Àr verktyg som:

Jag ska titta pÄ nÄgra av dessa verktyg, det vill sÀga de som jag har arbetat med.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

Ett bra verktyg, men för Druid. NÀr Druid implementerades testade jag SuperSet. Jag gillade honom. För Druid Àr det vÀldigt snabbt.

Den Àr inte lÀmplig för ClickHouse. Det vill sÀga, det passar, det startar, men Àr redo att endast behandla elementÀra frÄgor som: SELECT-hÀndelse, GROUP BY-hÀndelse. Den stöder inte den mer komplexa ClickHouse-syntaxen.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

NÀsta verktyg Àr Apache Zeppelin. Det hÀr Àr en bra och intressant sak. Arbetar. Den stöder bÀrbara datorer, instrumentpaneler och stöder variabler. Jag vet att nÄgon i ClickHouse-gemenskapen anvÀnder det.

Men det finns inget stöd för ClickHouse-syntax, det vill sÀga du mÄste skriva frÄgor antingen i konsolen eller nÄgon annanstans. Kontrollera sedan att allt fungerar. Det Àr bara obekvÀmt. Men den har bra stöd för instrumentpanelen.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

NÀsta verktyg Àr Redash.IO. Redash finns pÄ Internet. Det vill sÀga, till skillnad frÄn tidigare verktyg behöver det inte installeras. Och det hÀr Àr en instrumentpanel med möjligheten att konsolidera data frÄn olika datakÀllor. Det vill sÀga att du kan ladda ner frÄn ClickHouse, frÄn MySQL, frÄn PostgreSQL och frÄn andra databaser.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

För bara en mÄnad sedan (mars 2017) dök support upp i Grafana. NÀr du bygger rapporter i Grafana, till exempel om tillstÄndet för din hÄrdvara eller pÄ vissa mÀtvÀrden, kan du nu bygga samma graf eller nÄgon form av panel frÄn data frÄn ClickHouse direkt. Detta Àr vÀldigt bekvÀmt och vi anvÀnder det sjÀlva. Detta gör att du kan hitta anomalier. Det vill sÀga, om nÄgot hÀnder och nÄgon hÄrdvara faller eller blir anstrÀngd, dÄ kan du titta pÄ orsaken om denna data lyckades komma in i ClickHouse.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

Jag tyckte att det var vÀldigt besvÀrligt att skriva i dessa verktyg eller i konsolen. Och jag bestÀmde mig för att förbÀttra vÄrt första grÀnssnitt. Och jag fick idén frÄn EventSQL, SeperSet, Zeppelin.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

Vad ville du? Jag ville skaffa grafik, en förbÀttrad redigerare och implementera stöd för tipsordböcker. Eftersom ClickHouse har en fantastisk funktion - ordböcker. Men det Àr svÄrt att arbeta med ordböcker, eftersom du mÄste komma ihÄg formatet pÄ de lagrade vÀrdena, det vill sÀga Àr det ett nummer eller en strÀng, etc. Och eftersom vi ofta anvÀnder ordböcker i deras olika varianter, var det ganska svÄrt att skriva frÄgor.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

3 mÄnader har gÄtt sedan slÀppet av vÄr första version. Jag gjorde cirka 330 commits till en privat filial och det visade sig vara Tabix.

Till skillnad frÄn den tidigare versionen, som hette ClickHouse-Frontend, bestÀmde jag mig för att döpa om den till ett enkelt namn. Och det blev Tabix.

Vad dök upp?

Ritar grafer. Stöder ClickHouse SQL-syntax. Ger rÄd om funktioner och kan göra mycket intressant.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

SÄ hÀr ser det allmÀnna Tabix-schemat ut. Till vÀnster Àr ett trÀd. I mitten finns frÄgeredigeraren. Och nedan Àr resultatet av denna begÀran.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

NÀsta ska jag visa dig hur frÄgeredigeraren fungerar.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

HÀr fungerar autocomplete automatiskt pÄ tabellen och uppmanar, följaktligen, autocomplete för fÀlten. Och tips om funktioner. Om du trycker pÄ ctrl enter kommer begÀran att exekveras eller misslyckas med ett fel. Den enklaste förfrÄgan skickas till Tabix och resultatet erhÄlls, det vill sÀga du kan snabbt arbeta med ClickHouse.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

Ordböcker Àr som jag redan har sagt en vÀldigt intressant sak som vi jobbar mycket med. Och som gjorde att vi kunde göra mÄnga saker. LÄt oss sÀga att vi lagrar alla stÀder i ordböcker. Vi lagrar stadsidentifieraren och stadens namn, dess latitud och longitud. Och i databasen lagrar vi bara stadsidentifieraren. DÀrför komprimerar vi data mycket kraftigt.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

Detta verkar vara en enkel sak, men det hjÀlper i ClickHouse pÄ ett mycket intressant sÀtt. PÄ grund av det faktum att ClickHouse endast stöder kapslade kopplingar, vÀxer frÄgan nedÄt och tillrÀckligt bred. Och nÀr parentesen öppnas och nÄgot lÄngt uttryck kommer in, dÄ gör nÄgot sÄ enkelt som att komprimera frÄgan det lÀttare att arbeta med sjÀlva frÄgan. För nÀr frÄgan Àr 200-300 rader lÄng och vÀldigt stor i bredd Àr det mycket anvÀndbart att komprimera frÄgan och sedan hitta nÄgon plats eller pÄ nÄgot sÀtt lokalisera den.

ObjekttrÀd, multiqueries och flikar (Video 13:46 https://youtu.be/w1-XsL3nbRg?t=826)

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

HÀrnÀst ska jag visa dig om trÀdet och flikarna. Till vÀnster finns ett trÀd, överst kan du skapa flera flikar. Flikar Àr som en arbetsyta. Du kan skapa flera flikar och namnge var och en pÄ ett annat sÀtt. Det Àr som ett minisystem för att bygga en rapport.

Flikar sparas automatiskt. Om du startar om din webblÀsare eller stÀnger eller öppnar Tabix kommer allt detta att sparas.

Snabbtangent - bekvÀmt (Video 14:39 https://youtu.be/w1-XsL3nbRg?t=879)

Det finns snabbtangenter och det finns ganska mÄnga av dem. Jag har tagit fram nÄgra av dem hÀr som exempel. Detta Àr att byta flik, utföra en begÀran eller utföra flera förfrÄgningar.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

Jag ska visa dig hur du arbetar med resultatet. Vi skickar en förfrÄgan. HÀr ritar jag synd, cos och tg. Du kan markera resultatet, det vill sÀga rita en typisk karta för en kolumn. Du kan markera positiva eller negativa vÀrden. Eller helt enkelt fÀrglÀgg ett specifikt bordselement. Detta Àr praktiskt nÀr bordet Àr stort och du behöver hitta en anomali med dina ögon. NÀr jag letade efter anomalier markerade jag nÄgra linjer, nÄgra element i grönt eller rött.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

Det finns mycket intressant dÀr. Till exempel hur man kopierar till Redmine Markdown. Om du behöver kopiera resultatet nÄgonstans Àr detta vÀldigt bekvÀmt. Du kan helt enkelt vÀlja ett omrÄde, sÀga "Kopiera till Redmine" sÄ kopieras det till Redmine Markdown eller skapa en Where-frÄga.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

NÀsta Àr frÄgeoptimering. Jag glömde en gÄng att ange "datum"-fÀltet. Och min förfrÄgan i ClickHouse behandlades inte sÀrskilt, vÀldigt snabbt, utan snabbt, dvs mindre Àn en sekund. NÀr jag sÄg hur mÄnga rader han sprang igenom blev jag rÀdd. Vi skriver inte sÄ mÄnga rader till den hÀr tabellen pÄ en dag. Jag började analysera förfrÄgan och sÄg att jag hade missat en dejt pÄ ett stÀlle. Det vill sÀga jag glömde att ange att jag inte behöver data för hela tabellen, utan för en specifik period.

Tabix har en "Stats"-flik, som lagrar hela historiken för skickade förfrÄgningar, det vill sÀga dÀr kan du se hur mÄnga rader som lÀstes av denna begÀran och hur lÄng tid det tog att exekvera. Detta möjliggör optimering.

Du kan bygga en pivottabell över frÄgeresultatet. Du skickade en förfrÄgan till ClickHouse och fick lite data. Och sedan kan du flytta denna data med musen och bygga nÄgon form av pivottabell.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

NÀsta intressanta sak Àr plottning. LÄt oss sÀga att vi har följande begÀran: för sin, cos frÄn 0 till 299. Och för att rita den mÄste du vÀlja fliken "Rita" och du fÄr en graf med din sin och cos.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

Du kan dela upp detta i olika axlar, dvs du kan rita tvÄ grafer sida vid sida samtidigt. Skriv ett kommando och ett andra kommando.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

Du kan rita histogram.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

Du kan dela upp detta i en matris med grafer.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

Du kan bygga en vÀrmekarta.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

Du kan bygga en termisk kalender. Detta Àr förresten en mycket bekvÀm sak nÀr du behöver analysera anomalier under ett Är, d.v.s. hitta antingen spikar eller droppar. Denna datavisualisering hjÀlpte mig med detta.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

NÀsta Àr Treemap.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

Sankeys Àr ett intressant diagram. Han Àr antingen Streamgrahps eller River. Men jag kallar det River. Det lÄter dig ocksÄ leta efter eventuella anomalier. Det Àr vÀldigt bekvÀmt. Jag rekommenderar att du anvÀnder den för att söka.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

NĂ€sta intressanta sak Ă€r att rita en dynamisk karta. Om du lagrar latitud, longitud i din databas och till exempel lagrar en destination, om du till exempel har lastbil eller flygplan som flyger, sĂ„ kan du rita destinationsvĂ€gar. Även dĂ€r kan du stĂ€lla in hastigheten och storleken pĂ„ dessa objekt som de flyger in i.

Men problemet med den hÀr kartan Àr att den bara ritar en karta över vÀrlden, det finns ingen detalj.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

Senare la jag till Google map. Om du lagrar latitud, longitud kan du rita resultatet pÄ Google map, men utan flygplansstöd.

Vi har diskuterat huvudfunktionerna för att arbeta med resultat och frÄgor i Tabix.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

NĂ€sta Ă€r en analys av din ClickHouse-server. Det finns en separat "MĂ€trik"-flik, dĂ€r du kan se storleken pĂ„ lagrad data för varje kolumn. SkĂ€rmdumpen visar att detta "referrer"-fĂ€lt tar upp cirka 730 Gb. Om vi ​​överger det hĂ€r fĂ€ltet kommer vi att spara tre skĂ€rvor pĂ„ 700 GB vardera, det vill sĂ€ga cirka 2 TB som vi inte behöver.

Vi har ocksÄ ett "request_id"-fÀlt som vi lagrar i en strÀng. Men om vi börjar lagra det i numerisk form kommer detta fÀlt att krympa enormt.

Den visar ocksÄ serverkonfigurationen och en lista över noder i ditt kluster.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

NÀsta flik Àr mÀtvÀrden. De kommer in i realtid med ClickHouse och lÄter dig helt enkelt analysera serverns tillstÄnd och förstÄ vad som hÀnder med den. Detta Àr inte en ersÀttning för hela Grafana. Detta Àr nödvÀndigt för snabb analys.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

NÀsta flik Àr processer. FrÄn dem kan du förstÄ vad som hÀnder pÄ servern. FörstÄr vad som hÀnder dÀr. Jag hade en förfrÄgan som förbrukade 200 GB lÀsning varje gÄng. Jag sÄg detta tack vare det hÀr grÀnssnittet. Jag fÄngade honom och rÀttade honom. Och det visade sig handla om 30 GB, d.v.s en prestanda ibland.

ClickHouse – visuellt snabb och intuitiv dataanalys i Tabix. Igor Stryhar

Tack! Och det Àr i OpenSource

Jag avslutade. Och förresten, det Ă€r OpenSource, det Ă€r gratis och du behöver inte ens ladda ner det. Öppna den i en webblĂ€sare och allt fungerar.

frÄgor

Igor, vad hÀnder hÀrnÀst? Var kommer du att utveckla det hÀr verktyget?

DÀrefter kommer instrumentpaneler att dyka upp, det vill sÀga kanske instrumentpaneler dyker upp. Integration med andra databaser. Jag gjorde detta, men har Ànnu inte publicerat det i OpenSource. Detta Àr MySQL och möjligen PostgreSQL. Det vill sÀga att det kommer att vara möjligt att skicka förfrÄgningar frÄn Tabix inte bara till ClickHouse, utan Àven till andra verktyg.

Det Àr tydligt att ett enormt arbete har lagts ned. Det visade sig vara en ganska komplett idé. Detta gjordes tydligen i webblÀsaren för att eliminera kryckor pÄ alla möjliga yxor och snabbt slÀnga ihop det hela. Jag hörde att du Àr pÄ php fungerar, sÄ det enklaste sÀttet Àr att skriva det i webblÀsaren sÄ fungerar det överallt. Det finns inga frÄgor om detta. FrÄgan Àr denna. Det har verkligen gjorts mycket dÀr. Hur mÄnga arbetade med detta? Och hur lÄng tid tog det hela? Eftersom anpassade verktyg vanligtvis inte har sÄ mycket funktionalitet.

En person frÄn vÄrt team arbetade frÄn sommar till höst. Detta var den första versionen. Sedan gjorde jag 330 commits ensam. Vad du ser, min kollega och jag gjorde det pÄ hÀlften. PÄ 3 mÄnader, frÄn den allra första versionen till den sista, gjorde jag det mestadels ensam. Men jag kan inte Javascript sÄ bra. Detta var mitt enda och, hoppas jag, mitt sista Javascript-projekt som jag arbetade med. Jag fick det, jag tittade - Äh, skrÀck. Men jag ville verkligen avsluta produkten och det hÀr Àr vad som hÀnde.

Tack sÄ mycket för rapporten! Detta Àr ett utmÀrkt verktyg. MED Tableau Har du jÀmfört?

Tack. Det var dÀrför jag döpte den till Tabix, eftersom de första bokstÀverna Àr desamma.

För att du tÀvlar?

Det blir mycket investeringar, vi ska konkurrera.

Hur kan du erbjuda att sÀlja till interna analytiker som detta verktyg helt kommer att ersÀtta *TablÄ*? Vilka blir argumenten?

Fungerar inbyggt med ClickHouse. Jag provade Tableau, men dÀr kan man inte skriva stöd för ordböcker och liknande. Jag vet hur mÀnniskor arbetar med Tabix. De skriver en frÄga, laddar upp den till CSV och laddar upp den till BI. Och de gör redan nÄgot dÀr. Men jag har svÄrt att förestÀlla mig hur de gör det hÀr, eftersom det Àr ett grafiskt verktyg. Den kan ladda 5 000 rader, max 6 000 rader, men inte fler, annars klarar inte webblÀsaren.

Det vill sÀga att det finns nÄgra allvarliga begrÀnsningar för mÀngden data, eller hur?

Ja. Jag kan inte förestÀlla mig att du skulle vilja ladda upp 10 000 rader till din tabell pÄ din webblÀsarskÀrm. För vad?

Betyder detta att detta Àr ett grÀnssnitt för att snabbt kunna se data? Vrid det lite, vrid det?

Ja, se snabbt hur det fungerar och bygg bara en sammanfattningsgraf. Och sedan ge det nÄgonstans. Vi har ett eget rapporteringssystem, varifrÄn jag helt enkelt tar denna begÀran. Jag ritar in Tabix och skickar till vÄr rapportering.

Och en annan frÄga. Kohortanalys?

Om det finns nÄgra önskemÄl kommer vi att lÀgga till det.

NÀr började du anvÀnda den? ClickHouse, hur lÄng tid tog implementeringen? klickhus och föra till produktionslÀge?

Vi implementerade som sagt ett testkluster pÄ vÀldigt kort tid. Vi installerade den pÄ tvÄ dagar. Och vi testade det i ett par veckor till. Och vi nÄdde produktion pÄ 3 mÄnader. Men vi hade vÄr egen ETL, det vill sÀga ett verktyg för att registrera data. Och han skrev i allt han kunde. Han kan skriva i MongoDB, Cassandra, MySQL. Det var lÀtt att lÀra honom hur man skriver i ClickHouse. Vi hade en fÀrdig infrastruktur för snabb implementering. Inom 3 mÄnader började vi kasta ut den första komponenten. PÄ 6 mÄnader övergav vi allt annat helt. Vi har bara ett ClickHouse kvar.

Igor, tack sÄ mycket för rapporten. Jag gillade verkligen funktionaliteten i att bygga banor med hjÀlp av kartor. Finns det nÄgra planer pÄ integration med Yandex.Maps och i synnerhet med anpassade Yandex.Maps?

Jag försökte integrera istÀllet för Google map, men jag hittade inget mörkt tema pÄ Yandex.Maps. Jag sa inte till dig en bit. Jag spola tillbaka för att lÀgga till.

Slide – Google map. DĂ€r finns kommandot "DRAW_GMAPS", som ritar en karta. Det finns ett kommando "DRAW_YMAPS", dvs det kan rita en Yandex.Map. Men i sjĂ€lva verket, under detta kommando finns Javascript, det vill sĂ€ga data som du fĂ„r frĂ„n ClickHouse kan överföras till Javascript, som du skriver hĂ€r. Och du har ett utdataomrĂ„de dĂ€r det ska ritas. Du kan rita vilken graf som helst, d.v.s. vilken graf som helst, karta, du kan rita din egen komponent. Innan detta hade jag ett annat bibliotek för att rita graferna sjĂ€lva.

Det vill sÀga, finns det nÄgot verktyg för att anpassa displayens funktionalitet?

NÄgra. Du kan ta och fÀrga om dessa prickar, vilket gör dem inte röda, utan blÄ, gröna.

Tack för rapporten! Du hade en bild som presenterade alternativa frÄgeverktyg klickhus för att bygga instrumentpaneler och analytiska rapporter. Det förstÄr jag just nu nÀr du började jobba med ClickHouse, inga adaptrar har skrivits för dessa verktyg. Och jag undrar varför du bestÀmde dig för att göra ditt eget verktyg, istÀllet för att skriva en adapter för nÄgot fÀrdigt verktyg? Jag tror att det gÄr snabbt att justera testredigeraren. Varför bestÀmde du dig för att göra sÄ mycket arbete?

Det finns en intressant poÀng hÀr - faktum Àr att jag Àr en teknisk chef, inte en datavetare. NÀr vi började implementera Druid hade min fÀrdplan ungefÀr 50 % av uppgifterna - lÄt oss berÀkna detta, eller lÄt oss berÀkna detta, eller analysera det hÀr. Och det visade sig att vi implementerade ClickHouse. Och han började snabbt bygga allt, rÀkna och stÀngde snabbt sin fÀrdplan. Och vid det laget insÄg jag att jag saknade kunskap inom datavetenskap och datavisualisering. Tabix Àr typ av min hemlÀxa för att lÀra mig datavisualisering. Jag tittade pÄ hur jag skulle komplettera Zeppelin. Jag har en liten motvilja mot hans programmering. Redash Jag tittade pÄ hur man lÀgger till det, men en normal editor rÀckte för mig. Och SuperSet Àr ocksÄ skrivet pÄ ett sprÄk som jag inte riktigt gillar. Och sÄ jag bestÀmde mig för att cykla, och det hÀr Àr vad som hÀnde.

Igor, accepterar du Pull-förfrÄgningar?

Ja.

Tack sÄ mycket för rapporten! Och tvÄ frÄgor. För det första pratar du inte sÀrskilt smickrande om Javascript. Skrev du i blott Javascript eller Àr det nÄgon form av ramverk?*

BĂ€ttre i bara Javascript.

SĂ„ vilken ram?

Vinkel.

Kusten Àr klar. Och den andra frÄgan. Har du övervÀgt R О *Skinande**?*

ÖvervĂ€gde det. Spelade.

Du kan ocksÄ bara skriva en adapter.

Han Àr. Det verkar som om samhÀllet klarade det, men nÀr jag svarade pÄ föregÄende frÄga ville jag testa det sjÀlv.

*Nej, nÀr det gÀller visualisering, den finns dÀr ocksÄ.

Du sÀger att det finns nÄgot sÄdant och det kommer att rita dig en graf. Jag öppnade en bok om datavisualisering. Och jag tÀnkte: "LÄt mig försöka visualisera denna data. Jag kommer att skriva till honom sÄ att han kan bygga om data." Och jag började bÀttre förstÄ dataförsörjningstekniken. Och om jag hade tagit en fÀrdig komponent hade jag personligen lÀrt mig sÀmre hur man anvÀnder den, det vill sÀga visualisering. Men ja, jag gillade R, men jag har inte lÀst boken "R for Dummies" Àn.

Tack!

Enkel frÄga. Finns det nÄgra sÀtt att snabbt ladda upp en skylt eller ett schema?

Kan laddas upp till CSV eller Excel.

Inte data, utan en fÀrdig platta, en fÀrdig graf? Till exempel för att visa chefen.

Det finns en knapp "Ladda upp" och det finns en knapp "Ladda upp graf i png, i jpg".

Tack!

PS Mini-instruktioner för installation av tabix

KĂ€lla: will.com

LĂ€gg en kommentar