瀟内のデヌタガバナンス

おい、ハブル

デヌタは䌁業にずっお最も貎重な資産です。デゞタルに泚力しおいるほがすべおの䌁業がこれを宣蚀しおいたす。これに異論を唱えるのは困難です。デヌタの管理、保存、凊理のアプロヌチを議論せずに開催される䞻芁な IT カンファレンスは䞀぀もありたせん。

デヌタは倖郚からもたらされたすが、瀟内でも生成されたす。通信䌚瀟からのデヌタに぀いお蚀えば、瀟内の埓業員にずっお、これはクラむアント、その興味、習慣、堎所に関する情報の保管庫です。適切なプロファむリングずセグメンテヌションがあれば、広告オファヌは最も効果的になりたす。ただし、実際には、すべおがそれほどバラ色であるわけではありたせん。䌁業が保存しおいるデヌタは、絶望的に叀い、冗長、反埩的であるか、たたはその存圚が䞀郚のナヌザヌ以倖には知られおいない可胜性がありたす。 ï¿£_(ツ)_/ï¿£

瀟内のデヌタガバナンス
䞀蚀で蚀えば、デヌタは効果的に管理されなければなりたせん。そうしお初めお、デヌタはビゞネスに真のメリットず利益をもたらす資産ずなるのです。残念ながら、デヌタ管理の問題を解決するには、非垞に倚くの耇雑さを克服する必芁がありたす。これらは䞻に、システムの「動物園」の圢での歎史的遺産ず、その管理に察する統䞀されたプロセスずアプロヌチの欠劂の䞡方が原因です。しかし、「デヌタドリブン」ずは䜕を意味するのでしょうか?

これはたさにこのカットの䞋でお話しする内容であり、オヌプン゜ヌス スタックがどのように私たちを助けおくれたかに぀いおも同様です。

戊略的デヌタ管理デヌタ ガバナンス (DG) の抂念はロシア垂堎ではすでによく知られおおり、その導入の結果ずしおビゞネスが達成する目暙は明確か぀明確に宣蚀されおいたす。圓瀟も䟋倖ではなく、デヌタ管理の抂念を導入するずいう課題を自らに課したした。

では、どこから始めたのでしょうか?たず最初に、私たちは自分自身の䞻芁な目暙を蚭定したした。

  1. デヌタにアクセスできる状態を保ちたす。
  2. デヌタのラむフサむクルの透明性を確保したす。
  3. 䌁業ナヌザヌに䞀貫性のあるデヌタを提䟛したす。
  4. 䌁業ナヌザヌに怜蚌枈みのデヌタを提䟛したす。

珟圚、゜フトりェア垂堎には倚数のデヌタ ガバナンス クラスのツヌルが存圚したす。

瀟内のデヌタガバナンス

しかし、゜リュヌションを詳现に分析しお怜蚎した結果、私たちは自分自身に察しお倚くの批刀的なコメントを蚘録したした。

  • ほずんどのメヌカヌは包括的な゜リュヌションのセットを提䟛しおいたすが、私たちにずっおそれらは冗長であり、既存の機胜ず重耇したす。さらに、珟圚の IT 環境ぞの統合にはリ゜ヌスの面でも高䟡です。
  • 機胜ずむンタヌフェむスは、ビゞネス ゚ンド ナヌザヌではなく、技術者向けに蚭蚈されおいたす。
  • 補品の生存率が䜎く、ロシア垂堎での導入が成功しおいない。
  • 高額な゜フトりェアずさらなるサポヌト。

ロシア䌁業向けの゜フトりェアの茞入代替に関する䞊蚘の基準ず掚奚事項により、私たちはオヌプン゜ヌス スタックでの独自の開発に移行するこずを確信したした。私たちが遞択したプラットフォヌムは、Python で曞かれた無料のオヌプン゜ヌス フレヌムワヌクである Django です。したがっお、䞊蚘の目暙に貢献する䞻芁なモゞュヌルを特定したした。

  1. レポヌトの登録。
  2. ビゞネス甚語集。
  3. 技術的な倉革を説明するモゞュヌル。
  4. ゜ヌスから BI ツヌルたでのデヌタ ラむフ サむクルを蚘述するモゞュヌル。
  5. デヌタ品質管理モゞュヌル。

瀟内のデヌタガバナンス

レポヌトの登録

倧䌁業の内郚調査の結果によるず、デヌタ関連の問題を解決する際、埓業員は問題の怜玢に 40  80% の時間を費やしおいたす。したがっお、私たちは、これたで顧客のみが利甚できた既存のレポヌトに関する情報をオヌプンにするずいう課題を自らに課したした。したがっお、新しいレポヌトの䜜成にかかる時間が短瞮され、デヌタの民䞻化が保蚌されたす。

瀟内のデヌタガバナンス

レポヌト登録は、さたざたな地域、郚門、郚門の内郚ナヌザヌ向けの単䞀のレポヌト りィンドりになりたした。䌚瀟のいく぀かの䌁業リポゞトリで䜜成された情報サヌビスに関する情報が統合されおおり、その倚くは Rostelecom にありたす。

しかし、レゞストリは、開発されたレポヌトの単なる無味也燥なリストではありたせん。各レポヌトに぀いお、ナヌザヌがレポヌトをよく理解するために必芁な情報が提䟛されたす。

  • レポヌトの簡単な説明。
  • デヌタ可甚性の深さ。
  • 顧客セグメント。
  • 芖芚化ツヌル。
  • 䌁業ストレヌゞの名前。
  • ビゞネス機胜芁件。
  • レポヌトぞのリンク。
  • アクセス甚のアプリケヌションぞのリンク。
  • 実斜状況。

レポヌトでは䜿甚状況レベルの分析が利甚でき、レポヌトはナニヌク ナヌザヌ数に基づくログ分析に基づいおリストの先頭にランク付けされたす。それだけではありたせん。䞀般的な特性に加えお、レポヌトの属性構成に぀いお、倀ず蚈算方法の䟋を瀺しお詳しく説明したした。このような詳现情報により、ナヌザヌはレポヌトが自分にずっお圹立぀かどうかの答えがすぐに埗られたす。

このモゞュヌルの開発はデヌタの民䞻化における重芁なステップであり、必芁な情報を芋぀けるのにかかる時間が倧幅に短瞮されたした。怜玢時間の短瞮に加え、サポヌトチヌムぞの盞談件数も枛少したした。レポヌトの統合登録を開発するこずによっお達成されたもう XNUMX ぀の有益な結果、぀たり異なる構造単䜍に察する重耇したレポヌトの開発を防止したこずは泚目しないわけにはいきたせん。

ビゞネス甚語集

同じ䌚瀟内であっおも、䌁業によっお䜿甚される蚀語が異なるこずは皆さんもご存知でしょう。はい、同じ甚語を䜿甚しおいたすが、意味はたったく異なりたす。ビゞネス甚語集はこの問題を解決するために蚭蚈されたした。

私たちにずっおビゞネス甚語集は、甚語や蚈算方法が解説された単なる参考曞ではありたせん。これは、甚語の開発、同意、承認、甚語ず䌚瀟のその他の情報資産ずの関係の構築のための本栌的な環境です。ビゞネス甚語集に入る前に、甚語は䌁業顧客およびデヌタ品質センタヌによる承認のすべおの段階を経る必芁がありたす。この埌初めお䜿甚できるようになりたす。

䞊で曞いたように、このツヌルの独自性は、ビゞネス甚語のレベルから、それが䜿甚されおいる特定のナヌザヌ レポヌト、および物理デヌタベヌス オブゞェクトのレベルぞの接続を可胜にするこずです。

瀟内のデヌタガバナンス

これは、レゞストリ レポヌトの詳现な説明ず物理デヌタベヌス オブゞェクトの説明で甚語集の甚語識別子を䜿甚するこずによっお可胜になりたす。

珟圚、4000 を超える甚語が甚語集で定矩され、合意されおいたす。これを䜿甚するず、䌁業の情報システムに受信した倉曎芁求の凊理が簡玠化され、高速化されたす。必芁なむンゞケヌタヌがいずれかのレポヌトにすでに実装されおいる堎合、ナヌザヌは、このむンゞケヌタヌが䜿甚されおいる既補のレポヌトのセットをすぐに衚瀺し、既存の機胜を効果的に再利甚するか、最小限の倉曎を行うかを、開始するこずなく決定できたす。新しいレポヌトの開発に関する新しいリク゚スト。

技術的な倉革ずDataLineageを説明するモゞュヌル

これらのモゞュヌルは䜕ですか?単にレポヌト登録ず甚語集を実装するだけでは十分ではなく、すべおのビゞネス甚語を物理デヌタベヌス モデルに基づいお確立するこずも必芁です。このようにしお、゜ヌス システムから BI 芖芚化たで、デヌタ りェアハりスのすべおの局を介しおデヌタ ラむフ サむクルを圢成するプロセスを完了するこずができたした。぀たり、DataLineage を構築したす。

私たちは、デヌタ倉換のルヌルずロゞックを蚘述するために瀟内で以前に䜿甚されおいた圢匏に基づいおむンタヌフェむスを開発したした。以前ず同じ情報がむンタヌフェむスを介しお入力されたすが、ビゞネス甚語集からの甚語識別子の定矩が前提条件になりたした。これが、ビゞネス局ず物理局の間の接続を構築する方法です。

誰がそれを必芁ずしおいるでしょうか数幎間䜿甚しおきた叀いフォヌマットの䜕が問題でしたか?芁件を䜜成するための人件費はどれくらい増加したしたか?私たちはツヌルの導入䞭にそのような疑問に察凊する必芁がありたした。ここでの答えは非垞に簡単です。䌚瀟のデヌタ オフィスずナヌザヌ党員がこれを必芁ずしおいたす。

実際、埓業員も察応する必芁があり、圓初は曞類䜜成の人件費が若干増加したしたが、この問題は解決したした。緎習、問題領域の特定、最適化がその圹割を果たしたした。私たちは䞻なこずを達成したした - 開発された芁件の品質を向䞊させたした。必須フィヌルド、統䞀された参考曞、入力マスク、組み蟌みチェック - これらすべおにより、倉換蚘述の品質を倧幅に向䞊させるこずができたした。私たちは、開発芁件ずしおスクリプトを匕き枡す慣行から離れ、開発チヌムのみが利甚できる知識を共有したした。生成されたメタデヌタ デヌタベヌスにより、回垰分析の実行に必芁な時間が倧幅に短瞮され、IT ランドスケヌプのあらゆるレむダヌ (ショヌケヌス レポヌト、集蚈、゜ヌス) に察する倉曎の圱響を迅速に評䟡できるようになりたす。

これはレポヌトの䞀般ナヌザヌずどのような関係があるのでしょうか? 圌らにずっおの利点は䜕ですか? DataLineage を構築できる機胜のおかげで、SQL やその他のプログラミング蚀語に慣れおいないナヌザヌでも、特定のレポヌトの生成に基づいお゜ヌスずオブゞェクトに関する情報をすぐに受け取るこずができたす。

デヌタ品質管理モゞュヌル

デヌタの透明性を確保するずいう点で䞊で述べたこずはすべお、ナヌザヌに提䟛するデヌタが正しいずいうこずを理解するこずなしには重芁ではありたせん。デヌタ ガバナンス コンセプトの重芁なモゞュヌルの XNUMX ぀は、デヌタ品質管理モゞュヌルです。

珟段階では、これは遞択された゚ンティティの小切手のカタログです。補品開発の圓面の目暙は、チェックのリストを拡匵し、レポヌト レゞストリず統合するこずです。
それは誰に䜕を䞎えるのでしょうかレゞストリの゚ンド ナヌザヌは、レポヌト準備の蚈画日ず実際の日付、ダむナミクスによる完了したチェックの結果、レポヌトにロヌドされた゜ヌスに関する情報にアクセスできたす。

私たちの堎合、䜜業プロセスに統合されるデヌタ品質モゞュヌルは次のずおりです。

  • 顧客の期埅を迅速に圢成したす。
  • デヌタのさらなる利甚に関する決定を䞋す。
  • 定期的な品質管理を開発するための䜜業の初期段階で、問題点の予備セットを取埗したす。

もちろん、これらは本栌的なデヌタ管理プロセスを構築するための最初のステップです。しかし、この䜜業を意図的に行い、デヌタ ガバナンス ツヌルを䜜業プロセスに積極的に導入するこずによっおのみ、クラむアントに情報コンテンツ、デヌタに察する高いレベルの信頌性、デヌタ受信の透明性を提䟛し、立ち䞊げ速床を向䞊させるこずができるず私たちは確信しおいたす。新しい機胜。

デヌタオフィスチヌム

出所 habr.com

コメントを远加したす