ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Saya cadangkan anda membaca transkrip laporan 2017 oleh Igor Stryhar "ClickHouse - analisis data yang cepat dan jelas secara visual dalam Tabix."

Antara muka web untuk ClickHouse dalam projek Tabix.
Ciri-ciri utama:

  • Bekerja dengan ClickHouse terus dari pelayar, tanpa perlu memasang perisian tambahan;
  • Editor pertanyaan dengan penyerlahan sintaks;
  • Autolengkap arahan;
  • Alat untuk analisis grafik pelaksanaan pertanyaan;
  • Skim warna untuk dipilih.
    ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar


ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Saya pengarah teknikal SMI2. Kami adalah pengumpul berita pertukaran berita. Kami menyimpan banyak data yang kami terima daripada rakan kongsi kami dan mendaftarkannya dalam ClickHouse - kira-kira 30 permintaan sesaat.

Ini adalah data seperti:

  • Klik pada berita.
  • Paparan berita dalam pengagregat.
  • Paparan sepanduk pada rangkaian kami.
  • Dan kami mendaftarkan acara dari kaunter kami sendiri, yang serupa dengan Yandex.Metrica. Ini adalah analisis mikro kami sendiri.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Kami mempunyai kehidupan yang sangat sibuk sebelum ClickHouse. Kami sangat menderita, cuba menyimpan data ini di suatu tempat dan entah bagaimana menganalisisnya.

Kehidupan sebelum ClickHouse – infiniDB

Perkara pertama yang kami ada ialah infiniDB. Dia tinggal bersama kami selama 4 tahun. Kami melancarkannya dengan susah payah.

  • Ia tidak menyokong pengelompokan atau sharding. Tiada perkara pintar seperti itu keluar dari kotak secara lalai.
  • Dia mengalami kesukaran memuatkan data. Hanya utiliti konsol khusus yang hanya boleh memuatkan fail CSV dan hanya dalam beberapa cara yang sangat tidak jelas.
  • Pangkalan data adalah satu benang. Anda boleh sama ada menulis atau membaca. Tetapi ia memungkinkan untuk memproses sejumlah besar data.
  • Dan dia juga mempunyai tongkat yang menarik. Setiap malam pelayan perlu dibut semula, jika tidak, ia tidak akan berfungsi.

Dia bekerja untuk kami sehingga penghujung tahun 2016, apabila kami beralih sepenuhnya kepada ClickHouse.

Kehidupan sebelum ClickHouse – Cassandra

Memandangkan infiniDB adalah satu-benang, kami memutuskan bahawa kami memerlukan beberapa jenis pangkalan data berbilang benang di mana kami boleh menulis banyak utas pada masa yang sama.

Kami mencuba banyak perkara menarik. Kemudian kami memutuskan untuk mencuba Cassandra. Semuanya hebat dengan Cassandra. 10 permintaan sesaat setiap bida. 000 permintaan di suatu tempat untuk membaca.

Tetapi dia juga mempunyai minatnya sendiri. Sebulan sekali atau dua bulan sekali dia mengalami penyahsegerakan pangkalan data. Dan saya terpaksa bangun dan berlari untuk membaiki Cassandra. Pelayan dimulakan semula satu demi satu. Dan semuanya menjadi lancar dan cantik.

Kehidupan sebelum ClickHouse – Druid

Kemudian kami menyedari bahawa kami perlu menulis lebih banyak data. Pada tahun 2016 kami mula menonton Druid.

Druid ialah perisian sumber terbuka yang ditulis dalam Java. Sangat spesifik. Dan ia sesuai untuk aliran klik, apabila kita perlu menyimpan beberapa jenis strim peristiwa dan kemudian melakukan pengagregatan padanya atau membuat laporan analisis.

Druid mempunyai versi 0.9.X.

Pangkalan data itu sendiri sangat sukar untuk digunakan. Inilah kerumitan infrastruktur. Untuk memasangnya, perlu memasang banyak, banyak besi. Dan setiap bahagian perkakasan bertanggungjawab untuk peranannya yang tersendiri.

Untuk memuatkan data ke dalamnya, perlu menggunakan sejenis dukun. Terdapat projek OpenSource - Tranquility, yang kehilangan data daripada kami dalam aliran. Apabila kami memuatkan data ke dalamnya, ia kehilangannya.

Tetapi entah bagaimana kami mula melaksanakannya. Kami, seperti landak yang mengambil dadah tetapi terus makan kaktus, mula memperkenalkannya. Kami mengambil masa kira-kira sebulan untuk menyediakan semua infrastruktur untuknya. Iaitu, memesan pelayan, mengkonfigurasi peranan dan mengautomasikan sepenuhnya penggunaan. Iaitu, sekiranya berlaku kegagalan kluster, kluster kedua akan digunakan secara automatik.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Tetapi kemudian keajaiban berlaku. Saya sedang bercuti dan rakan sekerja saya menghantar pautan kepada saya habr, yang mengatakan bahawa Yandex memutuskan untuk membuka ClickHouse. Saya katakan mari cuba.

Dan secara literal dalam 2 hari kami menggunakan kluster ujian ClickHouse. Kami mula memuatkan data ke dalamnya. Berbanding dengan infiniDB, ini adalah asas; berbanding dengan Druid, ini adalah asas. Berbanding dengan Cassandra, ia juga rendah. Kerana jika anda memuatkan data dari PHP ke Cassandra, maka ini bukan asas.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Apa yang kita dapat? Prestasi dalam kelajuan. Prestasi dalam storan data. Iaitu, lebih kurang ruang cakera digunakan. ClickHouse memang pantas, sangat laju berbanding produk lain.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Pada masa pelancaran, apabila Yandex menerbitkan ClickHouse dalam OpenSource, hanya terdapat pelanggan konsol. Kami di syarikat kami SMI2 memutuskan untuk mencuba membuat klien asli untuk web, supaya kami boleh membuka halaman dari penyemak imbas, menulis permintaan dan mendapatkan hasilnya, kerana kami mula menulis banyak permintaan. Menulis dalam konsol adalah sukar. Dan kami membuat versi pertama kami.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Dan di suatu tempat yang lebih dekat dengan musim sejuk tahun lepas, alat pihak ketiga untuk bekerja dengan ClickHouse mula muncul. Ini adalah alat seperti:

Saya akan melihat beberapa alat ini, iaitu alat yang telah saya gunakan.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Alat yang bagus, tetapi untuk Druid. Apabila Druid sedang dilaksanakan, saya sedang menguji SuperSet. Saya suka dia. Untuk Druid ia sangat pantas.

Ia tidak sesuai untuk ClickHouse. Iaitu, ia sesuai, ia bermula, tetapi bersedia untuk memproses pertanyaan asas sahaja seperti: PILIH acara, KUMPULAN OLEH acara. Ia tidak menyokong sintaks ClickHouse yang lebih kompleks.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Alat seterusnya ialah Apache Zeppelin. Ini adalah perkara yang baik dan menarik. Berfungsi. Ia menyokong buku nota, papan pemuka, dan menyokong pembolehubah. Saya tahu seseorang dalam komuniti ClickHouse menggunakannya.

Tetapi tiada sokongan untuk sintaks ClickHouse, iaitu anda perlu menulis pertanyaan sama ada dalam konsol atau di tempat lain. Seterusnya, pastikan semuanya berfungsi. Ia hanya menyusahkan. Tetapi ia mempunyai sokongan papan pemuka yang baik.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Alat seterusnya ialah Redash.IO. Redash dihoskan di Internet. Iaitu, tidak seperti alat sebelumnya, ia tidak perlu dipasang. Dan ini ialah papan pemuka dengan keupayaan untuk menyatukan data daripada Sumber Data yang berbeza. Iaitu, anda boleh memuat turun dari ClickHouse, dari MySQL, dari PostgreSQL dan dari pangkalan data lain.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Hanya sebulan yang lalu (Mac 2017), sokongan muncul dalam Grafana. Apabila anda membina laporan dalam Grafana, contohnya, pada keadaan perkakasan anda atau pada beberapa metrik, kini anda boleh membina graf yang sama atau beberapa jenis panel daripada data daripada ClickHouse secara langsung. Ini sangat mudah, dan kami menggunakannya sendiri. Ini membolehkan anda mencari anomali. Iaitu, jika sesuatu berlaku dan beberapa perkakasan jatuh atau menjadi tegang, maka anda boleh melihat sebab jika data ini berjaya masuk ke ClickHouse.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Saya mendapati ia sangat janggal untuk menulis dalam alat ini atau dalam konsol. Dan saya memutuskan untuk menambah baik antara muka pertama kami. Dan saya mendapat idea daripada EventSQL, SeperSet, Zeppelin.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Apa yang awak mahu? Saya ingin mendapatkan grafik, editor yang dipertingkatkan dan melaksanakan sokongan untuk kamus petunjuk. Kerana ClickHouse mempunyai ciri yang hebat - kamus. Tetapi sukar untuk bekerja dengan kamus, kerana anda perlu mengingati format nilai yang disimpan, iaitu nombor atau rentetan, dsb. Dan memandangkan kami sering menggunakan kamus dalam variasi berbezanya, agak sukar untuk menulis pertanyaan.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

3 bulan telah berlalu sejak keluaran versi pertama kami. Saya membuat kira-kira 330 komitmen ke cawangan swasta dan ia ternyata Tabix.

Tidak seperti versi sebelumnya, yang dipanggil ClickHouse-Frontend, saya memutuskan untuk menamakan semula kepada nama yang mudah. Dan ternyata Tabix.

Apa yang muncul?

Melukis graf. Menyokong sintaks ClickHouse SQL. Memberi nasihat tentang fungsi dan boleh melakukan banyak perkara menarik.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Inilah rupa skema Tabix umum. Di sebelah kiri adalah pokok. Di tengah ialah editor pertanyaan. Dan di bawah adalah hasil daripada permintaan ini.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Seterusnya saya akan menunjukkan kepada anda cara editor pertanyaan berfungsi.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Di sini autolengkap berfungsi secara automatik pada jadual dan menggesa, sewajarnya, autolengkap untuk medan. Dan petunjuk tentang fungsi. Jika anda menekan ctrl enter, permintaan akan dilaksanakan atau gagal dengan ralat. Permintaan paling mudah dihantar ke Tabix dan hasilnya diperolehi, iaitu anda boleh bekerja dengan cepat dengan ClickHouse.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Kamus, seperti yang telah saya katakan, adalah perkara yang sangat menarik yang kami banyak bekerja. Dan yang membolehkan kami melakukan banyak perkara. Katakan kita menyimpan semua bandar dalam kamus. Kami menyimpan pengecam bandar dan nama bandar, latitud dan longitudnya. Dan dalam pangkalan data kami hanya menyimpan pengecam bandar. Sehubungan itu, kami memampatkan data dengan sangat kuat.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Ini nampaknya satu perkara yang mudah, tetapi ia membantu dalam ClickHouse dengan cara yang sangat menarik. Disebabkan fakta bahawa ClickHouse hanya menyokong gabungan bersarang, pertanyaan berkembang ke bawah dan cukup luas. Dan apabila kurungan dibuka dan beberapa ungkapan panjang masuk, maka sesuatu yang mudah seperti meruntuhkan pertanyaan memudahkan untuk bekerja dengan pertanyaan itu sendiri. Kerana apabila pertanyaan adalah 200-300 baris panjang dan sangat besar lebarnya, ia sangat membantu untuk meruntuhkan pertanyaan dan kemudian mencari tempat atau entah bagaimana menyetempatkannya.

Pokok objek, berbilang pertanyaan dan tab (Video 13:46 https://youtu.be/w1-XsL3nbRg?t=826)

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Seterusnya saya akan menunjukkan kepada anda tentang pokok dan tab. Di sebelah kiri ialah pokok; di atas anda boleh membuat beberapa tab. Tab adalah seperti ruang kerja. Anda boleh membuat beberapa tab dan menamakan setiap satu secara berbeza. Ia seperti sistem mini untuk membina laporan.

Tab disimpan secara automatik. Jika anda memulakan semula pelayar anda atau menutup atau membuka Tabix, semua ini akan disimpan.

Hotkey - mudah (Video 14:39 https://youtu.be/w1-XsL3nbRg?t=879)

Terdapat hotkeys dan terdapat banyak daripada mereka. Saya telah mengekstrak sebahagian daripada mereka di sini sebagai contoh. Ini ialah menukar tab, melaksanakan permintaan atau melaksanakan beberapa permintaan.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Saya akan menunjukkan kepada anda cara bekerja dengan hasilnya. Kami menghantar permintaan. Di sini saya melukis dosa, cos dan tg. Anda boleh menyerlahkan hasilnya, iaitu melukis peta biasa untuk lajur. Anda boleh menyerlahkan nilai positif atau negatif. Atau hanya warnakan elemen jadual tertentu. Ini mudah apabila meja besar dan anda perlu mencari beberapa anomali dengan mata anda. Semasa saya mencari anomali, saya menyerlahkan beberapa baris, beberapa elemen dalam warna hijau atau merah.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Terdapat banyak perkara menarik di sana. Contohnya, cara menyalin ke Redmine Markdown. Jika anda perlu menyalin hasilnya di suatu tempat, ini sangat mudah. Anda hanya boleh memilih kawasan, sebut "Salin ke Redmine" dan ia akan menyalin ke Redmine Markdown atau membuat pertanyaan Where.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Seterusnya ialah pengoptimuman pertanyaan. Saya pernah terlupa untuk menyatakan medan "tarikh". Dan permintaan saya dalam ClickHouse tidak diproses dengan sangat, sangat cepat, tetapi cepat, iaitu kurang daripada satu saat. Apabila saya melihat berapa banyak baris yang dilaluinya, saya menjadi takut. Kami tidak menulis begitu banyak baris ke jadual ini dalam sehari. Saya mula menganalisis permintaan itu dan melihat bahawa saya telah terlepas tarikh di satu tempat. Iaitu, saya terlupa untuk menunjukkan bahawa saya tidak memerlukan data untuk keseluruhan jadual, tetapi untuk tempoh tertentu.

Tabix mempunyai tab "Statistik", yang menyimpan keseluruhan sejarah permintaan yang dihantar, iaitu di sana anda boleh melihat berapa banyak baris dibaca oleh permintaan ini dan berapa lama masa yang diambil untuk dilaksanakan. Ini membolehkan pengoptimuman.

Anda boleh membina jadual pangsi di atas hasil pertanyaan. Anda menghantar permintaan kepada ClickHouse dan menerima beberapa data. Dan kemudian anda boleh mengalihkan data ini dengan tetikus anda dan membina beberapa jenis jadual pangsi.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Perkara menarik seterusnya ialah merancang. Katakan kita mempunyai permintaan berikut: untuk sin, cos dari 0 hingga 299. Dan untuk melukisnya, anda perlu memilih tab “Draw” dan anda akan mendapat graf dengan sin dan cos anda.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Anda boleh membahagikannya kepada paksi yang berbeza, iaitu anda boleh melukis dua graf bersebelahan sekaligus. Tulis satu arahan dan perintah kedua.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Anda boleh melukis histogram.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Anda boleh memecahkan ini kepada matriks graf.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Anda boleh membina peta haba.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Anda boleh membina kalendar haba. Dengan cara ini, ini adalah perkara yang sangat mudah apabila anda perlu menganalisis anomali selama setahun, iaitu, mencari sama ada pancang atau titisan. Visualisasi data ini membantu saya dengan ini.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Seterusnya ialah Treemap.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Sankeys ialah carta yang menarik. Dia sama ada Streamgrahps atau River. Tetapi saya memanggilnya Sungai. Ia juga membolehkan anda mencari sebarang anomali. Ia sangat selesa. Saya mengesyorkan menggunakannya untuk mencari.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Perkara menarik seterusnya ialah melukis peta dinamik. Jika anda menyimpan latitud, longitud dalam pangkalan data anda dan, katakan, menyimpan destinasi, jika anda, sebagai contoh, mempunyai trak atau kapal terbang yang terbang, maka anda boleh melukis laluan destinasi. Juga di sana anda boleh menetapkan kelajuan dan saiz objek ini di mana ia terbang.

Tetapi masalah dengan peta ini ialah ia hanya melukis peta dunia, tidak ada perincian.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Kemudian saya menambah peta Google. Jika anda menyimpan latitud, longitud, maka anda boleh melukis hasilnya pada peta Google, tetapi tanpa sokongan kapal terbang.

Kami telah membincangkan fungsi utama bekerja dengan hasil dan pertanyaan dalam Tabix.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Yang seterusnya ialah analisis pelayan ClickHouse anda. Terdapat tab "Metrik" yang berasingan, di mana anda boleh melihat saiz data yang disimpan untuk setiap lajur. Tangkapan skrin menunjukkan bahawa medan "perujuk" ini mengambil masa kira-kira 730 Gb. Jika kita meninggalkan medan ini, kita akan menyimpan tiga serpihan 700 GB setiap satu, iaitu kira-kira 2 TB yang kita tidak perlukan.

Kami juga mempunyai medan "request_id" yang kami simpan dalam rentetan. Tetapi jika kita mula menyimpannya dalam bentuk berangka, medan ini akan mengecut dengan sangat besar.

Ia juga menunjukkan konfigurasi pelayan dan senarai nod dalam kelompok anda.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Tab seterusnya ialah metrik. Mereka masuk ke masa nyata dengan ClickHouse dan hanya membenarkan anda menganalisis keadaan pelayan dan memahami apa yang berlaku padanya. Ini bukan pengganti untuk Grafana penuh. Ini perlu untuk analisis cepat.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Tab seterusnya ialah proses. Daripada mereka anda boleh memahami apa yang berlaku pada pelayan. Fahami apa yang berlaku di sana. Saya mempunyai permintaan yang menggunakan 200 GB bacaan setiap kali. Saya melihat ini terima kasih kepada antara muka ini. Saya menangkapnya dan membetulkannya. Dan ternyata kira-kira 30 GB, iaitu prestasi pada masa-masa tertentu.

ClickHouse – analisis data secara visual pantas dan intuitif dalam Tabix. Igor Stryhar

Terima kasih! Dan ia ada dalam OpenSource

saya selesai. Lagipun, ia adalah OpenSource, ia percuma dan anda tidak perlu memuat turunnya. Bukanya dalam penyemak imbas dan semuanya akan berfungsi.

soalan

Igor, apa seterusnya? Di manakah anda akan membangunkan alat ini?

Seterusnya, papan pemuka akan muncul, iaitu, mungkin papan pemuka akan muncul. Integrasi dengan pangkalan data lain. Saya melakukan ini, tetapi belum lagi menerbitkannya dalam OpenSource. Ini adalah MySQL dan mungkin PostgreSQL. Iaitu, ia akan menjadi mungkin untuk menghantar permintaan daripada Tabix bukan sahaja kepada ClickHouse, tetapi juga kepada alatan lain.

Adalah jelas bahawa sejumlah besar kerja telah dilakukan. Ia ternyata idea yang cukup lengkap. Ini dilakukan dalam penyemak imbas, nampaknya, untuk menghapuskan tongkat pada semua jenis kapak dan dengan cepat membuang semuanya bersama-sama. Saya mendengar bahawa anda berada di php berfungsi, jadi cara paling mudah ialah menaipnya dalam penyemak imbas dan ia akan berfungsi di mana-mana sahaja. Tiada soalan mengenai perkara ini. Soalannya begini. Banyak sebenarnya telah dilakukan di sana. Berapa ramai orang yang bekerja untuk ini? Dan berapa lama semuanya diambil? Kerana alat tersuai biasanya tidak mempunyai banyak fungsi.

Seorang daripada pasukan kami bekerja dari musim panas hingga musim luruh. Ini adalah versi pertama. Kemudian saya membuat 330 komitmen sahaja. Apa yang anda lihat, rakan sekerja saya dan saya melakukannya separuh. Dalam 3 bulan, dari versi pertama hingga yang terakhir, saya kebanyakannya melakukannya sendirian. Tetapi saya tidak tahu Javascript dengan baik. Ini adalah satu-satunya dan, saya harap, projek Javascript terakhir saya yang saya bekerjasama. Saya faham, saya nampak - oh, seram. Tetapi saya benar-benar mahu menghabiskan produk dan inilah yang berlaku.

Terima kasih banyak atas laporan itu! Ini adalah alat yang hebat. DENGAN Tablo Sudahkah anda membandingkan?

Terima kasih. Sebab tu saya namakan Tabix, sebab huruf pertamanya sama.

Kerana anda bersaing?

Akan ada banyak pelaburan, kita akan bersaing.

Bagaimanakah anda boleh menawarkan untuk menjual kepada penganalisis dalaman bahawa alat ini akan menggantikan sepenuhnya *Tableau*? Apa yang akan menjadi hujah?

Berfungsi secara asli dengan ClickHouse. Saya mencuba Tableau, tetapi anda tidak boleh menulis sokongan untuk kamus dan sebagainya di sana. Saya tahu cara orang bekerja dengan Tabix. Mereka menulis pertanyaan, memuat naiknya ke CSV dan memuat naiknya ke BI. Dan mereka sudah melakukan sesuatu di sana. Tetapi saya sukar membayangkan bagaimana mereka melakukan ini, kerana ia adalah alat grafik. Ia boleh memunggah 5 baris, maksimum 000 baris, tetapi tidak lebih, jika tidak, penyemak imbas tidak akan mengatasinya.

Iaitu, terdapat beberapa batasan yang serius pada jumlah data, bukan?

ya. Saya tidak dapat membayangkan bahawa anda ingin memuat naik 10 baris ke dalam jadual anda pada skrin penyemak imbas anda. Untuk apa?

Adakah ini bermakna ini adalah antara muka untuk melihat data dengan cepat? Pusing sikit, putar belit?

Ya, cepat lihat cara ia berfungsi dan cuma bina graf ringkasan. Dan kemudian berikannya di suatu tempat. Kami mempunyai sistem pelaporan kami sendiri, dari mana saya hanya mengambil permintaan ini. Saya menarik Tabix dan menghantarnya ke laporan kami.

Dan satu lagi soalan. Analisis kohort?

Jika ada sebarang permintaan, kami akan menambahnya.

Bilakah anda baru mula menggunakannya? ClickHouse, berapa lama pelaksanaannya? Klik Rumah dan membawa kepada keadaan pengeluaran?

Seperti yang saya katakan, kami melaksanakan kluster ujian dalam masa yang sangat singkat. Kami mengerahkannya dalam dua hari. Dan kami mengujinya selama beberapa minggu lagi. Dan kami mencapai pengeluaran dalam masa 3 bulan. Tetapi kami mempunyai ETL kami sendiri, iaitu alat untuk merekod data. Dan dia menulis semua yang dia boleh. Dia boleh menulis dalam MongoDB, Cassandra, MySQL. Ia adalah mudah untuk mengajarnya cara menulis dalam ClickHouse. Kami mempunyai infrastruktur sedia untuk pelaksanaan pantas. Dalam masa 3 bulan kami mula membuang komponen pertama. Dalam 6 bulan kami meninggalkan segala-galanya. Kami hanya mempunyai satu ClickHouse yang tinggal.

Igor, terima kasih banyak atas laporan itu. Saya sangat menyukai fungsi membina laluan menggunakan peta. Adakah terdapat sebarang rancangan untuk penyepaduan dengan Yandex.Maps dan khususnya dengan Yandex.Maps tersuai?

Saya cuba menyepadukan bukannya peta Google, tetapi saya tidak menemui tema gelap di Yandex.Maps. Saya tidak memberitahu anda satu bahagian. Saya akan gulung semula untuk menambah.

Slaid – Peta Google. Terdapat arahan "DRAW_GMAPS", yang melukis peta. Terdapat arahan "DRAW_YMAPS", iaitu ia boleh melukis Yandex.Map. Tetapi sebenarnya, di bawah arahan ini terdapat Javascript, iaitu data yang anda terima daripada ClickHouse boleh dipindahkan ke Javascript, yang anda tulis di sini. Dan anda mempunyai kawasan keluaran di mana ia perlu dilukis. Anda boleh melukis mana-mana graf, iaitu mana-mana graf, peta, anda boleh melukis komponen anda sendiri. Sebelum ini, saya mempunyai perpustakaan lain untuk melukis graf itu sendiri.

Iaitu, adakah terdapat alat untuk menyesuaikan fungsi paparan?

mana-mana. Anda boleh mengambil dan mewarna semula titik ini, menjadikannya bukan merah, tetapi biru, hijau.

Terima kasih atas laporan itu! Anda mempunyai slaid yang memaparkan alat pertanyaan alternatif Klik Rumah untuk membina papan pemuka dan laporan analisis. Saya faham bahawa pada masa anda mula bekerja dengannya ClickHouse, tiada penyesuai telah ditulis untuk alat ini. Dan saya tertanya-tanya mengapa anda memutuskan untuk membuat alat anda sendiri, bukannya menulis penyesuai untuk beberapa alat siap sedia? Saya fikir mengubah suai editor ujian adalah pantas. Mengapa anda memutuskan untuk melakukan begitu banyak kerja?

Terdapat satu perkara yang menarik di sini - hakikatnya ialah saya seorang pengarah teknikal, bukan seorang saintis data. Pada masa kami mula melaksanakan Druid, peta jalan saya mempunyai kira-kira 50% daripada tugasan - mari kita mengira ini, atau mari kita mengira ini, atau menganalisis ini. Dan ternyata kami melaksanakan ClickHouse. Dan dia mula membina segala-galanya dengan cepat, mengira, dan dengan cepat menutup peta jalannya. Dan pada masa itu saya menyedari bahawa saya kurang pengetahuan dalam Sains Data dan visualisasi data. Tabix adalah jenis kerja rumah saya untuk mempelajari visualisasi data. Saya sedang melihat bagaimana untuk melengkapkan Zeppelin. Saya mempunyai sedikit rasa tidak suka untuk pengaturcaraannya. Redash Saya melihat bagaimana untuk menambahnya, tetapi editor biasa sudah cukup untuk saya. Dan SuperSet juga ditulis dalam bahasa yang saya tidak suka. Jadi saya memutuskan untuk berbasikal, dan inilah yang berlaku.

Igor, adakah anda menerima permintaan Tarik?

Ya.

Terima kasih banyak atas laporan itu! Dan dua soalan. Pertama, anda tidak bercakap sangat memuji Javascript. Adakah anda menulis dalam Javascript kosong atau adakah ia sejenis rangka kerja?*

Lebih baik dalam Javascript kosong.

Jadi rangka kerja apa?

bersudut.

Ia jelas. Dan soalan kedua. Sudahkah anda pertimbangkan R и *Berkilat**?*

Dikira. Dimainkan.

Anda juga boleh hanya menulis penyesuai.

Dia adalah. Nampaknya komuniti berjaya melakukannya, tetapi, semasa saya menjawab soalan sebelumnya, saya ingin mencubanya sendiri.

*Tidak, mengenai visualisasi, ia juga ada.

Anda mengatakan bahawa terdapat perkara sedemikian dan ia akan menarik anda graf. Saya membuka buku mengenai visualisasi data. Dan saya fikir: "Biar saya cuba memvisualisasikan data ini. Saya akan menulis kepadanya supaya dia boleh membina semula data." Dan saya mula memahami teknologi suapan data dengan lebih baik. Dan jika saya telah mengambil komponen siap pakai, saya secara peribadi akan belajar lebih teruk cara menggunakannya, iaitu visualisasi. Tetapi ya, saya suka R, tetapi saya belum membaca buku "R for Dummies" lagi.

Thank you!

Soalan mudah. Adakah terdapat sebarang cara untuk memuat naik papan tanda atau jadual dengan cepat?

Boleh dimuat naik ke CSV atau Excel.

Bukan data, tetapi plat siap pakai, graf siap pakai? Sebagai contoh, untuk menunjukkan kepada bos.

Terdapat butang "Muat naik" dan terdapat butang "Muat naik graf dalam png, dalam jpg".

Thank you!

PS Mini-arahan untuk memasang tabix

  • Muat keluaran terbaru
  • Buka bungkusan, salin direktori build dalam nginx root_path
  • Konfigurasikan nginx

Sumber: www.habr.com

Tambah komen