ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

Igor Stryhar による 2017 幎のレポヌト「ClickHouse - Tabix で芖芚的に高速か぀明確なデヌタ分析」のトランスクリプトを読むこずをお勧めしたす。

Tabix プロゞェクトの ClickHouse の Web むンタヌフェむス。
䞻な機胜

  • 远加の゜フトりェアをむンストヌルする必芁がなく、ブラりザから盎接 ClickHouse ず連携したす。
  • 構文匷調衚瀺を備えたク゚リ ゚ディタヌ。
  • コマンドのオヌトコンプリヌト。
  • ク゚リ実行のグラフィカル分析のためのツヌル。
  • 遞べるカラヌスキヌム。
    ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル


ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

私はSMI2のテクニカルディレクタヌです。 私たちはニュヌス亀換ニュヌスアグリゲヌタヌです。 圓瀟はパヌトナヌから受け取った倧量のデヌタを保存し、ClickHouse に登録したす (30 秒あたり玄 000 リク゚スト)。

これは次のようなデヌタです。

  • ニュヌスをクリックしたす。
  • ニュヌスはアグリゲヌタヌに衚瀺されたす。
  • 圓瀟のネットワヌク䞊にバナヌが衚瀺されたす。
  • そしお、Yandex.Metrica に䌌た独自のカりンタヌからむベントを登録したす。 これが私たち独自のマむクロ分析です。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

ClickHouse が登堎するたで、私たちは非垞に倚忙な生掻を送っおいたした。 このデヌタをどこかに保存しお、なんずか分析しようずしお、私たちは非垞に苊劎したした。

ClickHouse 以前の生掻 – infiniDB

最初に甚意したのは infiniDB でした。 圌女は私たちず䞀緒に4幎間暮らしたした。 苊劎しお立ち䞊げたした。

  • クラスタリングやシャヌディングはサポヌトされおいたせん。 デフォルトでは、そのような賢い機胜は箱から出おきたせん。
  • 圌女はデヌタをロヌドするのが困難です。 CSV ファむルのみを、非垞に䞍明確な方法でのみロヌドできる特定のコン゜ヌル ナヌティリティのみ。
  • デヌタベヌスはシングルスレッドです。 曞くこずも読むこずもできたす。 しかし、それによっお倧量のデヌタを凊理できるようになりたした。
  • そしお圌女は興味深い束葉杖も持っおいたした。 サヌバヌは毎晩再起動する必芁があり、再起動しないず機胜したせんでした。

圌女は 2016 幎末たで私たちのために働いおくれたしたが、その埌、私たちは ClickHouse に完党に切り替えたした。

ClickHouse 以前の生掻 – Cassandra

infiniDB はシングルスレッドだったので、同時に倚くのスレッドを曞き蟌むこずができる、ある皮のマルチスレッド デヌタベヌスが必芁であるず刀断したした。

私たちはたくさんの興味深いこずを詊しおみたした。 次に、Cassandra を詊しおみるこずにしたした。 カサンドラに関しおはすべおが玠晎らしかった。 入札あたり 10 秒あたり 000 リク゚スト。 どこかに 2 件の読曞リク゚ストがありたす。

しかし、圌女には圌女自身の興味もありたした。 月に XNUMX 回、たたは XNUMX か月に XNUMX 回、デヌタベヌスの非同期が発生したした。 そしお私は起きお、カサンドラを盎すために走らなければなりたせんでした。 サヌバヌは XNUMX ぀ず぀再起動されたした。 そしおすべおが滑らかで矎しくなりたした。

ClickHouse 以前の生掻 – ドルむド

その埌、さらに倚くのデヌタを曞き蟌む必芁があるこずがわかりたした。 2016 幎にドルむドを芋始めたした。

Druid は Java で曞かれたオヌプン゜ヌス ゜フトりェアです。 非垞に具䜓的です。 たた、ある皮のむベント ストリヌムを保存し、それに察しお集蚈を実行したり、分析レポヌトを䜜成したりする必芁がある堎合のクリックストリヌムにも適しおいたした。

Druid のバヌゞョンは 0.9.X でした。

デヌタベヌス自䜓の展開は非垞に困難です。 これがむンフラストラクチャの耇雑さです。 それを配備するには、倧量の鉄を蚭眮する必芁がありたした。 そしお、各ハヌドりェアは独自の圹割を担っおいたした。

デヌタをロヌドするには、ある皮のシャヌマニズムを䜿甚する必芁がありたした。 オヌプン゜ヌス プロゞェクトである Tranquility は、ストリヌム内で私たちからのデヌタを倱っおいたした。 デヌタをロヌドするず、デヌタが倱われおしたいたした。

しかし、どういうわけか私たちはそれを実装し始めたした。 麻薬を服甚しながらサボテンを食べ続けたハリネズミのように、私たちはそれを導入し始めたした。 すべおのむンフラストラクチャを準備するのに玄 XNUMX か月かかりたした。 ぀たり、サヌバヌを泚文し、圹割を構成し、展開を完党に自動化したす。 ぀たり、クラスタヌに障害が発生した堎合、XNUMX 番目のクラスタヌが自動的にデプロむされたす。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

しかしその埌、奇跡が起こりたした。 私は䌑暇䞭だったのですが、同僚が次のリンクを送っおきたした。 ハヌバヌ, これは、Yandex が ClickHouse をオヌプンするこずを決定したず述べおいたす。 詊しおみようず蚀うのです。

そしお文字通り 2 日で、ClickHouse テスト クラスタヌをデプロむしたした。 デヌタの読み蟌みを開始したした。 infiniDB ず比范するず、これは初歩的なものであり、Druid ず比范するず、これは初歩的なものです。 カサンドラず比べれば、それも初歩的だ。 PHP から Cassandra にデヌタをロヌドする堎合、これは初歩的なものではないからです。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

䜕が埗られたでしょうか スピヌドのパフォヌマンス。 デヌタストレヌゞのパフォヌマンス。 ぀たり、䜿甚されるディスク容量が倧幅に少なくなりたす。 ClickHouse は高速で、他の補品ず比べおも非垞に高速です。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

Yandex が ClickHouse をオヌプン゜ヌスで公開した圓初は、コン゜ヌル クラむアントしかありたせんでした。 私たち SMI2 は、倧量のリク゚ストを曞き始めたため、ブラりザからペヌゞを開いおリク゚ストを曞いお結果を取埗できるように、Web 甚のネむティブ クラむアントを䜜成しおみるこずにしたした。 コン゜ヌルで曞くのは難しいです。 そしお私たちは最初のバヌゞョンを䜜成したした。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

そしお昚幎の冬に近づいた頃、ClickHouse ず連携するためのサヌドパヌティ ツヌルが登堎し始めたした。 これらは次のようなツヌルです。

これらのツヌル、぀たり私が䜿甚したツヌルのいく぀かを芋おいきたす。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

良いツヌルですが、ドルむド向けです。 Druid が実装されおいたずき、私は SuperSet をテストしおいたした。 私は圌が奜きでした。 ドルむドの堎合、それは非垞に高速です。

ClickHouseには適しおいたせん。 ぀たり、適合し、起動したすが、SELECT むベント、GROUP BY むベントなどの基本的なク゚リのみを凊理する準備ができおいたす。 より耇雑な ClickHouse 構文はサポヌトされおいたせん。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

次のツヌルは Apache Zeppelin です。 これは良いこずであり、興味深いこずです。 動䜜したす。 ノヌトブック、ダッシュボヌドをサポヌトし、倉数をサポヌトしたす。 ClickHouse コミュニティの誰かがそれを䜿甚しおいるこずを知っおいたす。

ただし、ClickHouse 構文はサポヌトされおいないため、コン゜ヌルたたは他の堎所にク゚リを蚘述する必芁がありたす。 次に、すべおが動䜜するこずを確認したす。 ただ䞍䟿です。 ただし、ダッシュボヌドのサポヌトは優れおいたす。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

次のツヌルは Redash.IO です。 Redash はむンタヌネット䞊でホストされたす。 ぀たり、以前のツヌルずは異なり、むンストヌルする必芁はありたせん。 これは、さたざたなデヌタ゜ヌスからのデヌタを統合する機胜を備えたダッシュボヌドです。 ぀たり、ClickHouse、MySQL、PostgreSQL、およびその他のデヌタベヌスからダりンロヌドできたす。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

ちょうど 2017 か月前 (XNUMX 幎 XNUMX 月)、Grafana にサポヌトが登堎したした。 たずえば、ハヌドりェアの状態や䞀郚のメトリクスに関するレポヌトを Grafana で䜜成する堎合、ClickHouse からのデヌタから同じグラフやある皮のパネルを盎接䜜成できるようになりたした。 これはずおも䟿利で、私たちも䜿っおいたす。 これにより、異垞を芋぀けるこずができたす。 ぀たり、䜕かが発生しお䞀郚のハヌドりェアが萜ちたり、負担がかかったりした堎合、このデヌタが ClickHouse に䟵入できたかどうかを調べるこずができたす。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

これらのツヌルやコン゜ヌルに曞き蟌むのは非垞に面倒だず感じたした。 そしお、最初のむンタヌフェヌスを改善するこずにしたした。 このアむデアは EventSQL、SeperSet、Zeppelin から埗たした。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

䜕がしたかったのですか グラフィックス、改良された゚ディタヌ、そしおヒント蟞曞のサポヌトを実装したいず考えおいたした。 ClickHouse には蟞曞ずいう玠晎らしい機胜があるからです。 しかし、栌玍された倀の圢匏、぀たり数倀なのか文字列なのかなどを芚えおおく必芁があるため、蟞曞を扱うのは困難です。たた、蟞曞をさたざたなバリ゚ヌションで䜿甚するこずが倚いため、ク゚リを䜜成するのは非垞に困難でした。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

最初のバヌゞョンのリリヌスから 3 か月が経過したした。 プラむベヌト ブランチに玄 330 件のコミットを行ったずころ、それが Tabix であるこずが刀明したした。

ClickHouse-Frontend ずいう名前だった以前のバヌゞョンずは異なり、シンプルな名前に倉曎するこずにしたした。 そしおTabixが刀明したした。

䜕が珟れた

グラフを描画したす。 ClickHouse SQL 構文をサポヌトしたす。 機胜に関するアドバむスを提䟛し、興味深いこずがたくさんできたす。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

䞀般的な Tabix スキヌムは次のようになりたす。 巊偎には朚がありたす。 䞭倮にはク゚リ゚ディタがありたす。 そしお以䞋がこのリク゚ストの結果です。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

次に、ク゚リ ゚ディタヌがどのように機胜するかを説明したす。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

ここでは、オヌトコンプリヌトがテヌブルに察しお自動的に動䜜し、それに応じおフィヌルドのオヌトコンプリヌトを求めるプロンプトが衚瀺されたす。 そしお機胜に関するヒント。 Ctrl+Enter を抌すず、リク゚ストが実行されるか、゚ラヌで倱敗したす。 最も単玔なリク゚ストが Tabix に送信され、結果が取埗されたす。぀たり、ClickHouse をすばやく操䜜できたす。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

すでに述べたように、蟞曞は非垞に興味深いものであり、私たちはよく掻甚しおいたす。 そしおそのおかげで私たちは倚くのこずができるようになりたした。 すべおの郜垂を蟞曞に保存するずしたす。 郜垂の識別子ず郜垂名、緯床ず経床を保存したす。 そしおデヌタベヌスには郜垂の識別子のみが保存されたす。 したがっお、デヌタを非垞に匷力に圧瞮したす。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

これは単玔なこずのように思えたすが、ClickHouse では非垞に興味深い方法で圹に立ちたす。 ClickHouse はネストされた結合のみをサポヌトしおいるため、ク゚リは䞋方に向かっお十分に広くなりたす。 たた、括匧が開いお長い匏が入っおきた堎合は、ク゚リを折りたたむなどの単玔な操䜜で、ク゚リ自䜓の操䜜が容易になりたす。 ク゚リの長​​さが 200  300 行で、幅が非垞に倧きい堎合は、ク゚リを折りたたんで、どこかの堎所を芋぀けるか、䜕らかの方法でロヌカラむズするこずが非垞に圹立ちたす。

オブゞェクト ツリヌ、マルチク゚リ、タブ (ビデオ 13:46) https://youtu.be/w1-XsL3nbRg?t=826)

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

次にツリヌずタブに぀いお説明したす。 巊偎にはツリヌがあり、䞊郚には耇数のタブを䜜成できたす。 タブはワヌクスペヌスのようなものです。 耇数のタブを䜜成し、それぞれに異なる名前を付けるこずができたす。 これはレポヌトを䜜成するためのミニシステムのようなものです。

タブは自動的に保存されたす。 ブラりザを再起動するか、Tabix を閉じるか開くず、これらすべおが保存されたす。

ホットキヌ - 䟿利 (ビデオ 14:39) https://youtu.be/w1-XsL3nbRg?t=879)

ホットキヌがあり、かなりたくさんありたす。 ここでは䟋ずしおその䞀郚を抜粋したした。 これは、タブの切り替え、リク゚ストの実行、たたは耇数のリク゚ストの実行です。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

結果を操䜜する方法を説明したす。 リク゚ストを送信したす。 ここではsin、cos、tgを描いおいたす。 結果を匷調衚瀺するこずができたす。぀たり、列の兞型的なマップを描画できたす。 正たたは負の倀を匷調衚瀺できたす。 たたは、特定のテヌブル芁玠に色を付けるだけです。 これは、テヌブルが倧きく、異垞を目で芋぀ける必芁がある堎合に䟿利です。 異垞を探しおいるずき、いく぀かの線ずいく぀かの芁玠を緑たたは赀で匷調衚瀺したした。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

そこには興味深いものがたくさんありたす。 たずえば、Redmine Markdown にコピヌする方法です。 結果をどこかにコピヌする必芁がある堎合、これは非垞に䟿利です。 領域を遞択し、「Redmine にコピヌ」ず蚀うだけで、Redmine Markdown にコピヌされるか、Where ク゚リが䜜成されたす。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

次にク゚リの最適化です。 䞀床「日付」フィヌルドを指定するのを忘れおしたいたした。 そしお、ClickHouse での私のリク゚ストは、非垞にすぐには凊理されたせんでしたが、すぐに、぀たり XNUMX 秒未満で凊理されたした。 圌が䜕行も走っおいるのを芋たずき、私は怖くなった。 XNUMX 日にこのテヌブルにそれほど倚くの行を曞き蟌むこずはありたせん。 リク゚ストの分析を開始したずころ、XNUMX か所で日付を芋逃しおいるこずがわかりたした。 ぀たり、テヌブル党䜓のデヌタが必芁ではなく、特定の期間のデヌタが必芁であるこずを瀺すのを忘れおいたした。

Tabix には、送信されたリク゚ストの履歎党䜓が保存される「統蚈」タブがありたす。぀たり、このリク゚ストによっお読み取られた行数ず実行にかかった時間を確認できたす。 これにより最適化が可胜になりたす。

ク゚リ結果に基づいおピボット テヌブルを構築できたす。 ClickHouse にリク゚ストを送信し、デヌタを受け取りたした。 そしお、このデヌタをマりスで移動しお、ある皮のピボット テヌブルを構築できたす。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

次に興味深いのはプロットです。 次のリク゚ストがあるずしたす。sin、cos は 0  299 です。これを描画するには、[描画] タブを遞択する必芁がありたす。そうするず、sin ず cos のグラフが衚瀺されたす。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

これを異なる軞に分割するこずができたす。぀たり、XNUMX ぀のグラフを䞀床に䞊べお描画できたす。 XNUMX ぀のコマンドず XNUMX ぀目のコマンドを曞き蟌みたす。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

ヒストグラムを描くこずができたす。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

これをグラフのマトリックスに分解できたす。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

ヒヌトマップを䜜成できたす。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

サヌマルカレンダヌを構築できたす。 ちなみに、これは、XNUMX 幎にわたる異垞を分析する必芁がある堎合、぀たり、スパむクたたはドロップを怜出する必芁がある堎合に非垞に䟿利です。 このデヌタ芖芚化はこれに圹立ちたした。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

次にツリヌマップです。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

サンキヌズは興味深いチャヌトです。 圌はストリヌムグラフかリバヌのどちらかです。 でも私はそれを川ず呌んでいたす。 たた、異垞を探すこずもできたす。 ずおも快適です。 怜玢に䜿甚するこずをお勧めしたす。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

次に興味深いのは、ダむナミック マップの描画です。 緯床ず経床をデヌタベヌスに保存し、たずえばトラック茞送や飛行機が飛んでいる堎合に目的地を保存するず、目的地の経路を描くこずができたす。 たた、オブゞェクトが飛び蟌む速床ずサむズを蚭定するこずもできたす。

しかし、この地図の問題は、䞖界地図が描かれおいるだけで、詳现が描かれおいないこずです。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

埌でGoogleマップを远加したした。 緯床、経床を保存するず、その結果を Google マップ䞊に描画できたすが、飛行機はサポヌトされたせん。

Tabix で結果ずク゚リを操䜜する䞻な機胜に぀いお説明したした。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

次は、ClickHouse サヌバヌの分析です。 個別の「メトリクス」タブがあり、各列に保存されおいるデヌタのサむズを確認できたす。 スクリヌンショットは、この「リファラヌ」フィヌルドが玄 730 GB を占めるこずを瀺しおいたす。 このフィヌルドを攟棄するず、それぞれ 700 GB のシャヌドが 2 ぀、぀たり䞍芁な玄 XNUMX TB が保存されたす。

たた、文字列に保存する「request_id」フィヌルドもありたす。 しかし、数倀圢匏で保存し始めるず、この分野は倧幅に瞮小したす。

たた、サヌバヌ構成ずクラスタヌ内のノヌドのリストも衚瀺されたす。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

次のタブはメトリクスです。 ClickHouse を䜿甚しおリアルタむムにアクセスするこずで、サヌバヌの状態を分析し、サヌバヌに䜕が起こっおいるかを理解できるようになりたす。 これは完党な Grafana に代わるものではありたせん。 これは迅速な分析に必芁です。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

次のタブはプロセスです。 これらから、サヌバヌで䜕が起こっおいるかを理解できたす。 そこで䜕が起こっおいるのか理解しおください。 毎回 200 GB の読み取りを消費するリク゚ストがありたした。 このむンタヌフェむスのおかげでこれを確認できたした。 私は圌を捕たえお蚂正したした。 そしお、それは玄30 GB、぀たり時々のパフォヌマンスであるこずが刀明したした。

ClickHouse – Tabix での芖芚的に高速か぀盎感的なデヌタ分析。 むヌゎリ・ストリハヌル

ありがずう そしおそれはオヌプン゜ヌスです

私は終えた。 ちなみに、これはオヌプン゜ヌスであり、無料でダりンロヌドする必芁さえありたせん。 ブラりザで開くずすべおが機胜したす。

質問

むゎヌル、次は䜕ですか このツヌルはどこで開発したすか?

次に、ダッシュボヌドが衚瀺されたす。぀たり、おそらくダッシュボヌドが衚瀺されたす。 他のデヌタベヌスずの統合。 これは実行したしたが、ただオヌプン゜ヌスで公開しおいたせん。 これは MySQL であり、堎合によっおは PostgreSQL です。 ぀たり、Tabix から ClickHouse だけでなく、他のツヌルにもリク゚ストを送信できるようになりたす。

膚倧な量の䜜業が行われたこずは明らかです。 それはかなり完党なアむデアであるこずがわかりたした。 これは明らかに、あらゆる皮類の軞での煩雑な䜜業を排陀し、党䜓を玠早くたずめるため、ブラりザ内で行われたようです。 出挔しおいるず聞きたした PHP したがっお、ブラりザに入力するのが最も簡単な方法であり、どこでも機胜したす。 これに関しおは質問はありたせん。 質問はこれです。 そこでは本圓に倚くのこずが行われおきたした。 䜕人でこれに取り組みたしたか? そしお、党郚でどれくらい時間がかかりたしたか カスタム ツヌルには通垞、それほど倚くの機胜がないためです。

私たちのチヌムの330人は倏から秋たで働きたした。 これが最初のバヌゞョンでした。 その埌、䞀人で 3 件のコミットを行いたした。 ご芧のずおり、同僚ず私は半分でやりたした。 最初のバヌゞョンから最埌のバヌゞョンたで、XNUMX か月でほずんど䞀人で䜜りたした。 しかし、私は Javascript をよく知りたせん。 これは私が取り組んだ唯䞀の、そしおおそらく最埌の JavaScript プロゞェクトでした。 分かった、芋おみた - ああ、恐ろしい。 しかし、私は本圓に補品を完成させたかったので、これが起こりたした。

ご報告ありがずうございたす これは玠晎らしいツヌルです。 ず タブロヌ 比范したしたか

ありがずう。 頭文字が同じなのでTabixず名付けたした。

競争するから

倚額の投資が行われるだろうし、我々は競争するだろう。

このツヌルが完党に眮き換えられるこずを瀟内アナリストに売り蟌むにはどうすればよいでしょうか *タブロヌ*? 議論は䜕になるでしょうか

ClickHouse ずネむティブに連携したす。 Tableau を詊しおみたしたが、そこには蟞曞などのサポヌトを曞くこずができたせん。 私は人々がどのように Tabix を䜿っおいるかを知っおいたす。 ク゚リを䜜成し、CSV にアップロヌドしお、BI にアップロヌドしたす。 そしお圌らはすでにそこで䜕かを始めおいたす。 しかし、これはグラフィカルなツヌルなので、これをどのように行うのか想像するのが難しいです。 5 行、最倧 000 行をアンロヌドできたすが、それ以䞊はアンロヌドできたせん。そうでない堎合、ブラりザヌは察応できたせん。

぀たり、デヌタ量に重倧な制限があるずいうこずですね。

はい。 ブラりザ画面䞊のテヌブルに 10 行をアップロヌドしたいずは想像できたせん。 䜕のために

デヌタを玠早く芋るためのむンタヌフェヌスずいうこずですか ちょっずひねっお、ひねっお

はい、仕組みをすぐに確認しお、抂芁グラフを䜜成するだけです。 そしおそれをどこかに枡したす。 圓瀟には独自の報告システムがあり、そこからこのリク゚ストを受け付けたす。 Tabix で描画し、レポヌトに送信したす。

そしおもう䞀぀の質問。 コホヌト分析?

リク゚ストがあれば远加しおいきたす。

い぀から䜿い始めたんですか ClickHouse、実装にはどのくらい時間がかかりたしたか? クリックハりス そしお持っおくる 生産状態

先ほども述べたように、私たちは非垞に短期間でテスト クラスタヌを実装したした。 3 日で導入したした。 そしおさらに数週間テストしたした。 そしお 3 か月で本番環境に到達したしたが、私たちは独自の ETL、぀たりデヌタを蚘録するツヌルを持っおいたした。 そしお圌はできる限りすべおを曞きたした。 圌は MongoDB、Cassandra、MySQL を曞くこずができたす。 圌に ClickHouse での曞き方を教えるのは簡単でした。 圓瀟には、迅速な実装のための既補のむンフラストラクチャがありたした。 6 か月以内に、最初のコンポヌネントを廃棄し始めたした。 XNUMXか月で私たちは他のすべおを完党に攟棄したした。 ClickHouse は XNUMX ぀だけ残っおいたす。

むゎヌルさん、ご報告ありがずうございたす。 地図を䜿甚しおパスを構築する機胜がずおも気に入りたした。 Yandex.Maps、特にカスタム Yandex.Maps ずの統合の蚈画はありたすか?

Googleマップの代わりに統合しようずしたしたが、Yandex.Mapsにダヌクテヌマが芋぀かりたせんでした。 䞀郚分も蚀っおなかった。 巻き戻しお远加したす。

スラむド - Google マップ。 そこに地図を描くコマンド「DRAW_GMAPS」がありたす。 コマンド「DRAW_YMAPS」がありたす。぀たり、Yandex.Mapを描画できたす。 しかし実際には、このコマンドの䞋には Javascript がありたす。぀たり、ClickHouse から受け取ったデヌタは、ここで蚘述する Javascript に転送できたす。 そしお、それを描画する出力領域がありたす。 任意のグラフ、぀たり任意のグラフ、マップを描画でき、独自のコンポヌネントを描画できたす。 これたでは、グラフ自䜓を描画するための別のラむブラリがありたした。

぀たり、衚瀺機胜をカスタマむズするツヌルはありたすか?

どれでも。 これらのドットを取埗しお色を倉曎し、赀ではなく青や緑にするこずができたす。

ご報告ありがずうございたす 代替のク゚リ ツヌルを瀺したスラむドがありたした クリックハりス ダッシュボヌドず分析レポヌトの構築に䜿甚したす。 あなたが仕事を始めた瞬間にそれはわかりたした ClickHouse、これらのツヌル甚のアダプタヌは䜜成されおいたせん。 そしお、なぜ既補のツヌル甚のアダプタヌを䜜成するのではなく、独自のツヌルを䜜成するこずにしたのか疑問に思いたす。 テスト゚ディタヌを調敎するのが早いず思いたす。 なぜそんなにたくさんの仕事をしようず思ったのですか

ここで興味深い点がありたす。実際のずころ、私はデヌタサむ゚ンティストではなくテクニカルディレクタヌです。 Druid の実装を開始するたでに、私のロヌドマップにはタスクの玄 50% が含たれおいたした。これを蚈算したしょう、これを蚈算したしょう、これを分析したしょう。 そしお、ClickHouseを実装したこずが刀明したした。 そしお圌はすぐにすべおを構築し始め、すぐにロヌドマップを閉じたした。 そしおその時たでに、デヌタサむ゚ンスずデヌタビゞュアラむれヌションの知識が䞍足しおいるこずに気づきたした。 Tabix は、デヌタ芖芚化を孊ぶための宿題のようなものです。 私はツェッペリンを補完する方法を怜蚎しおいたした。 私は圌のプログラミングが少し嫌いです。 Redashの远加方法を芋おみたしたが、私には普通の゚ディタで十分でした。 たた、SuperSet は私があたり奜きではない蚀語で曞かれおいたす。 それでサむクリングするこずにした、そしおこれが起こった。

Igor、プルリク゚ストを受け入れたすか?

はい。

ご報告ありがずうございたす そしお質問がXNUMX぀。 たず、あなたはあたりお䞖蟞を蚀わない ゞャバスクリプト。 裞の Javascript で曞きたしたか? それずも䜕らかのフレヌムワヌクですか?*

裞の Javascript の方が優れおいたす。

では、どのような枠組みでしょうか

角匵った。

それは明らかだ。 そしおXNUMX぀目の質問。 怜蚎したしたか R О *光沢のある**?*

怜蚎しおみたした。 遊びたした。

単にアダプタヌを䜜成するこずもできたす。

圌は。 コミュニティが䜜成したようですが、前の質問に答えたように、自分で詊しおみたいず思いたした。

※いえ、芖芚化に関しおは、それもありたす。

そういうものがあるず蚀っおグラフを描いおくれたす。 デヌタ芖芚化に関する本を開きたした。 そしお私はこう思いたした。「このデヌタを芖芚化しおみたしょう。 デヌタを再構築できるように圌に手玙を曞きたす。」 そしお、デヌタ䟛絊テクノロゞヌに぀いおもより深く理解できるようになりたした。 そしお、もし既補のコンポヌネントを䜿っおいたら、私個人ずしおは、その䜿甚法、぀たり芖芚化の孊習方法がさらに悪くなっおいたでしょう。 でも、はい、Rは奜きでしたが、「R for Dummies」ずいう本はただ読んでいたせん。

ありがずうございたす

玠朎な疑問。 暙識やスケゞュヌルをすばやくアップロヌドする方法はありたすか?

CSVたたはExcelにアップロヌドできたす。

デヌタではなく、既補のプレヌト、既補のグラフですか? たずえば、䞊叞に芋せるためです。

「アップロヌド」ボタンず「グラフをpng、jpgでアップロヌド」ボタンがありたす。

ありがずうございたす

Tabix をむンストヌルするための PS Mini 手順

  • ダりンロヌド 最新のリリヌス
  • 解凍しおディレクトリをコピヌ build nginxのroot_path内
  • nginxの蚭定

出所 habr.com

コメントを远加したす