Когда Ρƒ вас сбСровскиС ΠΌΠ°ΡΡˆΡ‚Π°Π±Ρ‹. ИспользованиС Ab Initio ΠΏΡ€ΠΈ Ρ€Π°Π±ΠΎΡ‚Π΅ с Hive ΠΈ GreenPlum

НСкотороС врСмя Π½Π°Π·Π°Π΄ ΠΏΠ΅Ρ€Π΅Π΄ Π½Π°ΠΌΠΈ встал вопрос Π²Ρ‹Π±ΠΎΡ€Π° ETL-срСдства для Ρ€Π°Π±ΠΎΡ‚Ρ‹ с BigData. Π Π°Π½Π΅Π΅ использовавшССся Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ Informatica BDM Π½Π΅ устраивало нас ΠΈΠ·-Π·Π° ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Π½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ. Π•Ρ‘ использованиС свСлось ΠΊ Ρ„Ρ€Π΅ΠΉΠΌΠ²ΠΎΡ€ΠΊΡƒ ΠΏΠΎ запуску ΠΊΠΎΠΌΠ°Π½Π΄ spark-submit. На Ρ€Ρ‹Π½ΠΊΠ΅ имСлось Π½Π΅ Ρ‚Π°ΠΊ ΠΌΠ½ΠΎΠ³ΠΎ Π°Π½Π°Π»ΠΎΠ³ΠΎΠ², Π² ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏΠ΅ способных Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ с Ρ‚Π΅ΠΌ ΠΎΠ±ΡŠΡ‘ΠΌΠΎΠΌ Π΄Π°Π½Π½Ρ‹Ρ…, с ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌ ΠΌΡ‹ ΠΈΠΌΠ΅Π΅ΠΌ Π΄Π΅Π»ΠΎ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ дСнь. Π’ ΠΈΡ‚ΠΎΠ³Π΅ ΠΌΡ‹ Π²Ρ‹Π±Ρ€Π°Π»ΠΈ Ab Initio. Π’ Ρ…ΠΎΠ΄Π΅ ΠΏΠΈΠ»ΠΎΡ‚Π½Ρ‹Ρ… дСмонстраций ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚ ΠΏΠΎΠΊΠ°Π·Π°Π» ΠΎΡ‡Π΅Π½ΡŒ Π²Ρ‹ΡΠΎΠΊΡƒΡŽ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π΄Π°Π½Π½Ρ‹Ρ…. Π˜Π½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΎΠ± Ab Initio Π½Π° русском языкС ΠΏΠΎΡ‡Ρ‚ΠΈ Π½Π΅Ρ‚, поэтому ΠΌΡ‹ Ρ€Π΅ΡˆΠΈΠ»ΠΈ Ρ€Π°ΡΡΠΊΠ°Π·Π°Ρ‚ΡŒ ΠΎ своём ΠΎΠΏΡ‹Ρ‚Π΅ Π½Π° Π₯Π°Π±Ρ€Π΅.

Ab Initio ΠΎΠ±Π»Π°Π΄Π°Π΅Ρ‚ мноТСством классичСских ΠΈ Π½Π΅ΠΎΠ±Ρ‹Ρ‡Π½Ρ‹Ρ… трансформаций, ΠΊΠΎΠ΄ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Ρ€Π°ΡΡˆΠΈΡ€Π΅Π½ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ собствСнного языка PDL. Для ΠΌΠ΅Π»ΠΊΠΎΠ³ΠΎ бизнСса Ρ‚Π°ΠΊΠΎΠΉ ΠΌΠΎΡ‰Π½Ρ‹ΠΉ инструмСнт, вСроятно, Π±ΡƒΠ΄Π΅Ρ‚ ΠΈΠ·Π±Ρ‹Ρ‚ΠΎΡ‡Π½Ρ‹ΠΌ, ΠΈ Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²ΠΎ Π΅Π³ΠΎ возмоТностСй ΠΌΠΎΠ³ΡƒΡ‚ ΠΎΠΊΠ°Π·Π°Ρ‚ΡŒΡΡ Π΄ΠΎΡ€ΠΎΠ³ΠΈΠΌΠΈ ΠΈ нСвострСбованными. Но Ссли ваши ΠΌΠ°ΡΡˆΡ‚Π°Π±Ρ‹ ΠΏΡ€ΠΈΠ±Π»ΠΈΠΆΠ°ΡŽΡ‚ΡΡ ΠΊ сбСровским, Ρ‚ΠΎ Π²Π°ΠΌ Ab Initio ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ интСрСсСн.

Он ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ бизнСсу глобально ΠΊΠΎΠΏΠΈΡ‚ΡŒ знания ΠΈ Ρ€Π°Π·Π²ΠΈΠ²Π°Ρ‚ΡŒ экосистСму, Π° Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΡƒ β€” ΠΏΡ€ΠΎΠΊΠ°Ρ‡ΠΈΠ²Π°Ρ‚ΡŒ свои Π½Π°Π²Ρ‹ΠΊΠΈ Π² ETL, ΠΏΠΎΠ΄Ρ‚ΡΠ³ΠΈΠ²Π°Ρ‚ΡŒ знания Π² shell, прСдоставляСт Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ освоСния языка PDL, Π΄Π°Ρ‘Ρ‚ Π²ΠΈΠ·ΡƒΠ°Π»ΡŒΠ½ΡƒΡŽ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½Ρƒ процСссов Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠΈ, ΡƒΠΏΡ€ΠΎΡ‰Π°Π΅Ρ‚ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΡƒ благодаря обилию Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Ρ… ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ΠΎΠ².

Π’ постС я расскаТу ΠΎ возмоТностях Ab Initio ΠΈ ΠΏΡ€ΠΈΠ²Π΅Π΄Ρƒ ΡΡ€Π°Π²Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ характСристики ΠΏΠΎ Π΅Π³ΠΎ Ρ€Π°Π±ΠΎΡ‚Π΅ с Hive ΠΈ GreenPlum.

  • ОписаниС Ρ„Ρ€Π΅ΠΉΠΌΠ²ΠΎΡ€ΠΊΠ° MDW ΠΈ Ρ€Π°Π±ΠΎΡ‚ ΠΏΠΎ Π΅Π³ΠΎ донастройкС ΠΏΠΎΠ΄ GreenPlum
  • Π‘Ρ€Π°Π²Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ характСристики ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Ab Initio ΠΏΠΎ Ρ€Π°Π±ΠΎΡ‚Π΅ с Hive ΠΈ GreenPlum
  • Π Π°Π±ΠΎΡ‚Π° Ab Initio с GreenPlum Π² Ρ€Π΅ΠΆΠΈΠΌΠ΅ Near Real Time


Π€ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π» этого ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚Π° ΠΎΡ‡Π΅Π½ΡŒ ΡˆΠΈΡ€ΠΎΠΊ ΠΈ Ρ‚Ρ€Π΅Π±ΡƒΠ΅Ρ‚ Π½Π΅ΠΌΠ°Π»ΠΎ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ Π½Π° своё ΠΈΠ·ΡƒΡ‡Π΅Π½ΠΈΠ΅. Однако, ΠΏΡ€ΠΈ Π΄ΠΎΠ»ΠΆΠ½Ρ‹Ρ… Π½Π°Π²Ρ‹ΠΊΠ°Ρ… Ρ€Π°Π±ΠΎΡ‚Ρ‹ ΠΈ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Ρ… настройках ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΠΎΠ»ΡƒΡ‡Π°ΡŽΡ‚ΡΡ вСсьма Π²ΠΏΠ΅Ρ‡Π°Ρ‚Π»ΡΡŽΡ‰ΠΈΠ΅. ИспользованиС Ab Initio для Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠ° ΠΌΠΎΠΆΠ΅Ρ‚ Π΄Π°Ρ‚ΡŒ Π΅ΠΌΡƒ интСрСсный ΠΎΠΏΡ‹Ρ‚. Π­Ρ‚ΠΎ Π½ΠΎΠ²Ρ‹ΠΉ взгляд Π½Π° ETL-Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΡƒ, Π³ΠΈΠ±Ρ€ΠΈΠ΄ ΠΌΠ΅ΠΆΠ΄Ρƒ Π²ΠΈΠ·ΡƒΠ°Π»ΡŒΠ½ΠΎΠΉ срСдой ΠΈ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠΎΠΉ Π·Π°Π³Ρ€ΡƒΠ·ΠΎΠΊ Π½Π° скрипто-ΠΏΠΎΠ΄ΠΎΠ±Π½ΠΎΠΌ языкС.

БизнСс Ρ€Π°Π·Π²ΠΈΠ²Π°Π΅Ρ‚ свои экосистСмы ΠΈ этот инструмСнт оказываСтся Π΅ΠΌΡƒ ΠΊΠ°ΠΊ Π½ΠΈΠΊΠΎΠ³Π΄Π° кстати. Π‘ ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Ab Initio ΠΌΠΎΠΆΠ½ΠΎ ΠΊΠΎΠΏΠΈΡ‚ΡŒ знания ΠΎ Ρ‚Π΅ΠΊΡƒΡ‰Π΅ΠΌ бизнСсС ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ эти знания для Ρ€Π°ΡΡˆΠΈΡ€Π΅Π½ΠΈΡ старых ΠΈ открытия Π½ΠΎΠ²Ρ‹Ρ… бизнСсов. ΠΠ»ΡŒΡ‚Π΅Ρ€Π½Π°Ρ‚ΠΈΠ²Π°ΠΌΠΈ Ab Initio ΠΌΠΎΠΆΠ½ΠΎ Π½Π°Π·Π²Π°Ρ‚ΡŒ ΠΈΠ· Π²ΠΈΠ·ΡƒΠ°Π»ΡŒΠ½Ρ‹Ρ… срСд Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Informatica BDM ΠΈ ΠΈΠ· Π½Π΅Π²ΠΈΠ·ΡƒΠ°Π»ΡŒΠ½Ρ‹Ρ… срСд – Apache Spark.

ОписаниС Ab Initio

Ab Initio, ΠΊΠ°ΠΊ ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ ETL-срСдства, прСдставляСт собой Π½Π°Π±ΠΎΡ€ ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚ΠΎΠ².

Когда Ρƒ вас сбСровскиС ΠΌΠ°ΡΡˆΡ‚Π°Π±Ρ‹. ИспользованиС Ab Initio ΠΏΡ€ΠΈ Ρ€Π°Π±ΠΎΡ‚Π΅ с Hive ΠΈ GreenPlum

Ab Initio GDE (Graphical Development Environment) – это срСда для Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠ°, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ ΠΎΠ½ настраиваСт трансформации Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ соСдиняСт ΠΈΡ… ΠΏΠΎΡ‚ΠΎΠΊΠ°ΠΌΠΈ Π΄Π°Π½Π½Ρ‹Ρ… Π² Π²ΠΈΠ΄Π΅ стрСлочСк. ΠŸΡ€ΠΈ этом Ρ‚Π°ΠΊΠΎΠΉ Π½Π°Π±ΠΎΡ€ трансформаций называСтся Π³Ρ€Π°Ρ„ΠΎΠΌ:

Когда Ρƒ вас сбСровскиС ΠΌΠ°ΡΡˆΡ‚Π°Π±Ρ‹. ИспользованиС Ab Initio ΠΏΡ€ΠΈ Ρ€Π°Π±ΠΎΡ‚Π΅ с Hive ΠΈ GreenPlum

Π’Ρ…ΠΎΠ΄Π½Ρ‹Π΅ ΠΈ Π²Ρ‹Ρ…ΠΎΠ΄Π½Ρ‹Π΅ соСдинСния Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Ρ… ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ΠΎΠ² ΡΠ²Π»ΡΡŽΡ‚ΡΡ ΠΏΠΎΡ€Ρ‚Π°ΠΌΠΈ ΠΈ содСрТат поля, вычислСнныС Π²Π½ΡƒΡ‚Ρ€ΠΈ ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΠΉ. НСсколько Π³Ρ€Π°Ρ„ΠΎΠ², соСдинённых ΠΏΠΎΡ‚ΠΎΠΊΠ°ΠΌΠΈ Π² Π²ΠΈΠ΄Π΅ стрСлочСк Π² порядкС ΠΈΡ… выполнСния Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ΡΡ ΠΏΠ»Π°Π½ΠΎΠΌ.

Π˜ΠΌΠ΅Π΅Ρ‚ΡΡ нСсколько сотСн Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Ρ… ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ΠΎΠ², Ρ‡Ρ‚ΠΎ ΠΎΡ‡Π΅Π½ΡŒ ΠΌΠ½ΠΎΠ³ΠΎ. МногиС ΠΈΠ· Π½ΠΈΡ… узкоспСциализированныС. ВозмоТности классичСских трансформаций Π² Ab Initio ΡˆΠΈΡ€Π΅, Ρ‡Π΅ΠΌ Π² Π΄Ρ€ΡƒΠ³ΠΈΡ… ETL-срСдствах. НапримСр, Join ΠΈΠΌΠ΅Π΅Ρ‚ нСсколько Π²Ρ‹Ρ…ΠΎΠ΄ΠΎΠ². Помимо Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π° соСдинСния датасСтов ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ Π½Π° Π²Ρ‹Ρ…ΠΎΠ΄Π΅ записи Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… датасСтов, ΠΏΠΎ ΠΊΠ»ΡŽΡ‡Π°ΠΌ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π½Π΅ ΡƒΠ΄Π°Π»ΠΎΡΡŒ ΡΠΎΠ΅Π΄ΠΈΠ½ΠΈΡ‚ΡŒΡΡ. Π’Π°ΠΊΠΆΠ΅ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ rejects, errors ΠΈ Π»ΠΎΠ³ Ρ€Π°Π±ΠΎΡ‚Ρ‹ трансформации, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΌΠΎΠΆΠ½ΠΎ Π² этом ΠΆΠ΅ Π³Ρ€Π°Ρ„Π΅ ΠΏΡ€ΠΎΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ ΠΊΠ°ΠΊ тСкстовый Ρ„Π°ΠΉΠ» ΠΈ ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ Π΄Ρ€ΡƒΠ³ΠΈΠΌΠΈ трансформациями:

Когда Ρƒ вас сбСровскиС ΠΌΠ°ΡΡˆΡ‚Π°Π±Ρ‹. ИспользованиС Ab Initio ΠΏΡ€ΠΈ Ρ€Π°Π±ΠΎΡ‚Π΅ с Hive ΠΈ GreenPlum

Или, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΌΠΎΠΆΠ½ΠΎ ΠΌΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π»ΠΈΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΏΡ€ΠΈΡ‘ΠΌΠ½ΠΈΠΊ Π΄Π°Π½Π½Ρ‹Ρ… Π² Π²ΠΈΠ΄Π΅ Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ ΠΈ Π² этом ΠΆΠ΅ Π³Ρ€Π°Ρ„Π΅ ΡΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ ΠΈΠ· Π½Π΅Π³ΠΎ Π΄Π°Π½Π½Ρ‹Π΅.

Π•ΡΡ‚ΡŒ ΠΎΡ€ΠΈΠ³ΠΈΠ½Π°Π»ΡŒΠ½Ρ‹Π΅ трансформации. НапримСр, трансформация Scan ΠΈΠΌΠ΅Π΅Ρ‚ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π», ΠΊΠ°ΠΊ Ρƒ аналитичСских Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΉ. Π•ΡΡ‚ΡŒ трансформации с говорящими названиями: Create Data, Read Excel, Normalize, Sort within Groups, Run Program, Run SQL, Join with DB ΠΈ Π΄Ρ€. Π“Ρ€Π°Ρ„Ρ‹ ΠΌΠΎΠ³ΡƒΡ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ выполнСния, Π² Ρ‚ΠΎΠΌ числС Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Π° ΠΏΠ΅Ρ€Π΅Π΄Π°Ρ‡Π° ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² ΠΈΠ· ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ систСмы ΠΈΠ»ΠΈ Π² ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΎΠ½Π½ΡƒΡŽ систСму. Π€Π°ΠΉΠ»Ρ‹ с Π³ΠΎΡ‚ΠΎΠ²Ρ‹ΠΌ Π½Π°Π±ΠΎΡ€ΠΎΠΌ ΠΏΠ΅Ρ€Π΅Π΄Π°Π²Π°Π΅ΠΌΡ‹Ρ… Π³Ρ€Π°Ρ„Ρƒ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ΡΡ parameter sets (psets).

Как ΠΈ полагаСтся, Ab Initio GDE ΠΈΠΌΠ΅Π΅Ρ‚ свой Ρ€Π΅ΠΏΠΎΠ·ΠΈΡ‚ΠΎΡ€ΠΈΠΉ, ΠΈΠΌΠ΅Π½ΡƒΠ΅ΠΌΡ‹ΠΉ EME (Enterprise Meta Environment). Π Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠΈ ΠΈΠΌΠ΅ΡŽΡ‚ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ с Π»ΠΎΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΌΠΈ вСрсиями ΠΊΠΎΠ΄Π° ΠΈ Π΄Π΅Π»Π°Ρ‚ΡŒ check in своих Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΎΠΊ Π² Ρ†Π΅Π½Ρ‚Ρ€Π°Π»ΡŒΠ½Ρ‹ΠΉ Ρ€Π΅ΠΏΠΎΠ·ΠΈΡ‚ΠΎΡ€ΠΈΠΉ.

Π˜ΠΌΠ΅Π΅Ρ‚ΡΡ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ Π²ΠΎ врСмя выполнСния ΠΈΠ»ΠΈ послС выполнСния Π³Ρ€Π°Ρ„Π° ΠΊΠ»ΠΈΠΊΠ½ΡƒΡ‚ΡŒ ΠΏΠΎ Π»ΡŽΠ±ΠΎΠΌΡƒ ΡΠΎΠ΅Π΄ΠΈΠ½ΡΡŽΡ‰Π΅ΠΌΡƒ трансформации ΠΏΠΎΡ‚ΠΎΠΊΡƒ ΠΈ ΠΏΠΎΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Π½Π° Π΄Π°Π½Π½Ρ‹Π΅, ΠΏΡ€ΠΎΡˆΠ΅Π΄ΡˆΠΈΠ΅ ΠΌΠ΅ΠΆΠ΄Ρƒ этими трансформациями:

Когда Ρƒ вас сбСровскиС ΠΌΠ°ΡΡˆΡ‚Π°Π±Ρ‹. ИспользованиС Ab Initio ΠΏΡ€ΠΈ Ρ€Π°Π±ΠΎΡ‚Π΅ с Hive ΠΈ GreenPlum

Π’Π°ΠΊΠΆΠ΅ Π΅ΡΡ‚ΡŒ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ ΠΊΠ»ΠΈΠΊΠ½ΡƒΡ‚ΡŒ ΠΏΠΎ Π»ΡŽΠ±ΠΎΠΌΡƒ ΠΏΠΎΡ‚ΠΎΠΊΡƒ ΠΈ ΠΏΠΎΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ tracking details – Π² сколько ΠΏΠ°Ρ€Π°Π»Π»Π΅Π»Π΅ΠΉ Ρ€Π°Π±ΠΎΡ‚Π°Π»Π° трансформация, сколько строк ΠΈ Π±Π°ΠΉΡ‚ Π² ΠΊΠ°ΠΊΠΎΠΉ ΠΈΠ· ΠΏΠ°Ρ€Π°Π»Π»Π΅Π»Π΅ΠΉ Π·Π°Π³Ρ€ΡƒΠ·ΠΈΠ»ΠΎΡΡŒ:

Когда Ρƒ вас сбСровскиС ΠΌΠ°ΡΡˆΡ‚Π°Π±Ρ‹. ИспользованиС Ab Initio ΠΏΡ€ΠΈ Ρ€Π°Π±ΠΎΡ‚Π΅ с Hive ΠΈ GreenPlum

Π•ΡΡ‚ΡŒ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ Ρ€Π°Π·Π±ΠΈΡ‚ΡŒ Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½ΠΈΠ΅ Π³Ρ€Π°Ρ„Π° Π½Π° Ρ„Π°Π·Ρ‹ ΠΈ ΠΏΠΎΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ ΠΎΠ΄Π½ΠΈ трансформации Π½ΡƒΠΆΠ½ΠΎ Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡ‚ΡŒ ΠΏΠ΅Ρ€Π²Ρ‹ΠΌ Π΄Π΅Π»ΠΎΠΌ (Π² Π½ΡƒΠ»Π΅Π²ΠΎΠΉ Ρ„Π°Π·Π΅), ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ Π² ΠΏΠ΅Ρ€Π²ΠΎΠΉ Ρ„Π°Π·Π΅, ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠ΅ Π²ΠΎ Π²Ρ‚ΠΎΡ€ΠΎΠΉ Ρ„Π°Π·Π΅ ΠΈ Ρ‚.Π΄.

Π£ ΠΊΠ°ΠΆΠ΄ΠΎΠΉ трансформации ΠΌΠΎΠΆΠ½ΠΎ Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ Ρ‚Π°ΠΊ Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡ‹ΠΉ layout (Π³Π΄Π΅ ΠΎΠ½Π° Π±ΡƒΠ΄Π΅Ρ‚ Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡ‚ΡŒΡΡ): Π±Π΅Π· ΠΏΠ°Ρ€Π°Π»Π»Π΅Π»Π΅ΠΉ ΠΈΠ»ΠΈ Π² ΠΏΠ°Ρ€Π°Π»Π»Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΏΠΎΡ‚ΠΎΠΊΠ°Ρ…, число ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΌΠΎΠΆΠ½ΠΎ Π·Π°Π΄Π°Ρ‚ΡŒ. ΠŸΡ€ΠΈ этом Π²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Π΅ Ρ„Π°ΠΉΠ»Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ создаёт Ab Initio ΠΏΡ€ΠΈ Ρ€Π°Π±ΠΎΡ‚Π΅ трансформаций, ΠΌΠΎΠΆΠ½ΠΎ Ρ€Π°Π·ΠΌΠ΅Ρ‰Π°Ρ‚ΡŒ ΠΊΠ°ΠΊ Π² Ρ„Π°ΠΉΠ»ΠΎΠ²ΠΎΠΉ систСмС сСрвСра, Ρ‚Π°ΠΊ ΠΈ Π² HDFS.

Π’ ΠΊΠ°ΠΆΠ΄ΠΎΠΉ трансформации Π½Π° Π±Π°Π·Π΅ шаблона ΠΏΠΎ ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ ΠΌΠΎΠΆΠ½ΠΎ ΡΠΎΠ·Π΄Π°Ρ‚ΡŒ свой скрипт Π½Π° языкС PDL, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π½Π΅ΠΌΠ½ΠΎΠ³ΠΎ Π½Π°ΠΏΠΎΠΌΠΈΠ½Π°Π΅Ρ‚ shell.

Π‘ ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ языка PDL Π²Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Ρ€Π°ΡΡˆΠΈΡ€ΡΡ‚ΡŒ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π» трансформаций ΠΈ, Π² частности, Π²Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ динамичСски (Π²ΠΎ врСмя выполнСния) Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ»ΡŒΠ½Ρ‹Π΅ Ρ„Ρ€Π°Π³ΠΌΠ΅Π½Ρ‚Ρ‹ ΠΊΠΎΠ΄Π° Π² зависимости ΠΎΡ‚ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ выполнСния.

Π’Π°ΠΊΠΆΠ΅ Π² Ab Initio Ρ…ΠΎΡ€ΠΎΡˆΠΎ Ρ€Π°Π·Π²ΠΈΡ‚Π° интСграция с ОБ Ρ‡Π΅Ρ€Π΅Π· shell. ΠšΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½ΠΎ Π² Π‘Π±Π΅Ρ€Π±Π°Π½ΠΊΠ΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ linux ksh. МоТно ΠΎΠ±ΠΌΠ΅Π½ΠΈΠ²Π°Ρ‚ΡŒΡΡ с shell ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹ΠΌΠΈ ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΈΡ… Π² качСствС ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² Π³Ρ€Π°Ρ„ΠΎΠ². МоТно ΠΈΠ· shell Π²Ρ‹Π·Ρ‹Π²Π°Ρ‚ΡŒ Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½ΠΈΠ΅ Π³Ρ€Π°Ρ„ΠΎΠ² Ab Initio ΠΈ Π°Π΄ΠΌΠΈΠ½ΠΈΡΡ‚Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Ab Initio.

Помимо Ab Initio GDE Π² поставку Π²Ρ…ΠΎΠ΄ΠΈΡ‚ ΠΌΠ½ΠΎΠ³ΠΎ Π΄Ρ€ΡƒΠ³ΠΈΡ… ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚ΠΎΠ². Π•ΡΡ‚ΡŒ своя Co>Operation System с ΠΏΡ€Π΅Ρ‚Π΅Π½Π·ΠΈΠ΅ΠΉ Π½Π°Π·Ρ‹Π²Π°Ρ‚ΡŒΡΡ ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ систСмой. Π•ΡΡ‚ΡŒ Control>Center, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ ΠΌΠΎΠΆΠ½ΠΎ ΡΡ‚Π°Π²ΠΈΡ‚ΡŒ Π½Π° расписаниС ΠΈ ΠΌΠΎΠ½ΠΈΡ‚ΠΎΡ€ΠΈΡ‚ΡŒ ΠΏΠΎΡ‚ΠΎΠΊΠΈ Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠΈ. Π•ΡΡ‚ΡŒ ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚Ρ‹ для осущСствлСния Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ Π½Π° Π±ΠΎΠ»Π΅Π΅ ΠΏΡ€ΠΈΠΌΠΈΡ‚ΠΈΠ²Π½ΠΎΠΌ ΡƒΡ€ΠΎΠ²Π½Π΅, Ρ‡Π΅ΠΌ позволяСт Ab Initio GDE.

ОписаниС Ρ„Ρ€Π΅ΠΉΠΌΠ²ΠΎΡ€ΠΊΠ° MDW ΠΈ Ρ€Π°Π±ΠΎΡ‚ ΠΏΠΎ Π΅Π³ΠΎ донастройкС ΠΏΠΎΠ΄ GreenPlum

ВмСстС со своими ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚Π°ΠΌΠΈ Π²Π΅Π½Π΄ΠΎΡ€ поставляСт ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚ MDW (Metadata Driven Warehouse), ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ прСдставляСт собой ΠΊΠΎΠ½Ρ„ΠΈΠ³ΡƒΡ€Π°Ρ‚ΠΎΡ€ Π³Ρ€Π°Ρ„ΠΎΠ², ΠΏΡ€Π΅Π΄Π½Π°Π·Π½Π°Ρ‡Π΅Π½Π½Ρ‹ΠΉ для ΠΏΠΎΠΌΠΎΡ‰ΠΈ Π² Ρ‚ΠΈΠΏΠΈΡ‡Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡Π°Ρ… ΠΏΠΎ наполнСнию Ρ…Ρ€Π°Π½ΠΈΠ»ΠΈΡ‰ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΠ»ΠΈ data vaults.

Он содСрТит ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΡΠΊΠΈΠ΅ (спСцифичныС для ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π°) парсСры ΠΌΠ΅Ρ‚Π°Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ Π³ΠΎΡ‚ΠΎΠ²Ρ‹Π΅ Π³Π΅Π½Π΅Ρ€Π°Ρ‚ΠΎΡ€Ρ‹ ΠΊΠΎΠ΄Π° β€œΠΈΠ· коробки”.

Когда Ρƒ вас сбСровскиС ΠΌΠ°ΡΡˆΡ‚Π°Π±Ρ‹. ИспользованиС Ab Initio ΠΏΡ€ΠΈ Ρ€Π°Π±ΠΎΡ‚Π΅ с Hive ΠΈ GreenPlum
На Π²Ρ…ΠΎΠ΄Π΅ MDW ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅Ρ‚ модСль Π΄Π°Π½Π½Ρ‹Ρ…, ΠΊΠΎΠ½Ρ„ΠΈΠ³ΡƒΡ€Π°Ρ†ΠΈΠΎΠ½Π½Ρ‹ΠΉ Ρ„Π°ΠΉΠ» ΠΏΠΎ настройкС соСдинСния с Π±Π°Π·ΠΎΠΉ Π΄Π°Π½Π½Ρ‹Ρ… (Oracle, Teradata ΠΈΠ»ΠΈ Hive) ΠΈ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ настройки. БпСцифичСская для ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° Ρ‡Π°ΡΡ‚ΡŒ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Ρ€Π°Π·Π²ΠΎΡ€Π°Ρ‡ΠΈΠ²Π°Π΅Ρ‚ модСль Π² Π±Π°Π·Π΅ Π΄Π°Π½Π½Ρ‹Ρ…. ΠšΠΎΡ€ΠΎΠ±ΠΎΡ‡Π½Π°Ρ Ρ‡Π°ΡΡ‚ΡŒ ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚Π° Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΠ΅Ρ‚ Π³Ρ€Π°Ρ„Ρ‹ ΠΈ настроСчныС Ρ„Π°ΠΉΠ»Ρ‹ ΠΊ Π½ΠΈΠΌ ΠΏΠΎ Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠ΅ Π΄Π°Π½Π½Ρ‹Ρ… Π² Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ. ΠŸΡ€ΠΈ этом ΡΠΎΠ·Π΄Π°ΡŽΡ‚ΡΡ Π³Ρ€Π°Ρ„Ρ‹ (ΠΈ psets) для Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… Ρ€Π΅ΠΆΠΈΠΌΠΎΠ² ΠΈΠ½ΠΈΡ†ΠΈΠ°Π»ΠΈΠ·ΠΈΡ€ΡƒΡŽΡ‰Π΅ΠΉ ΠΈ ΠΈΠ½ΠΊΡ€Π΅ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎΠΉ Ρ€Π°Π±ΠΎΡ‚Ρ‹ ΠΏΠΎ обновлСнию сущностСй.

Π’ случаях Hive ΠΈ RDBMS Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΡŽΡ‚ΡΡ Ρ€Π°Π·Π»ΠΈΡ‡Π°ΡŽΡ‰ΠΈΠ΅ΡΡ Π³Ρ€Π°Ρ„Ρ‹ ΠΏΠΎ ΠΈΠ½ΠΈΡ†ΠΈΠ°Π»ΠΈΠ·ΠΈΡ€ΡƒΡŽΡ‰Π΅ΠΌΡƒ ΠΈ ΠΈΠ½ΠΊΡ€Π΅ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎΠΌΡƒ обновлСнию Π΄Π°Π½Π½Ρ‹Ρ….

Π’ случаС Hive ΠΏΠΎΡΡ‚ΡƒΠΏΠΈΠ²ΡˆΠΈΠ΅ Π΄Π°Π½Π½Ρ‹Π΅ Π΄Π΅Π»ΡŒΡ‚Ρ‹ соСдиняСтся посрСдством Ab Initio Join с Π΄Π°Π½Π½Ρ‹ΠΌΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π±Ρ‹Π»ΠΈ Π² Ρ‚Π°Π±Π»ΠΈΡ†Π΅ Π΄ΠΎ обновлСния. Π—Π°Π³Ρ€ΡƒΠ·Ρ‡ΠΈΠΊΠΈ Π΄Π°Π½Π½Ρ‹Ρ… Π² MDW (ΠΊΠ°ΠΊ Π² Hive, Ρ‚Π°ΠΊ ΠΈ Π² RDBMS) Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π²ΡΡ‚Π°Π²Π»ΡΡŽΡ‚ Π½ΠΎΠ²Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅ ΠΈΠ· Π΄Π΅Π»ΡŒΡ‚Ρ‹, Π½ΠΎ ΠΈ Π·Π°ΠΊΡ€Ρ‹Π²Π°ΡŽΡ‚ ΠΏΠ΅Ρ€ΠΈΠΎΠ΄Ρ‹ Π°ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π΄Π°Π½Π½Ρ‹Ρ…, ΠΏΠΎ ΠΏΠ΅Ρ€Π²ΠΈΡ‡Π½Ρ‹ΠΌ ΠΊΠ»ΡŽΡ‡Π°ΠΌ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… поступила Π΄Π΅Π»ΡŒΡ‚Π°. ΠšΡ€ΠΎΠΌΠ΅ Ρ‚ΠΎΠ³ΠΎ, приходится ΠΏΠ΅Ρ€Π΅ΠΏΠΈΡΠ°Ρ‚ΡŒ Π·Π°Π½ΠΎΠ²ΠΎ Π½Π΅ΠΈΠ·ΠΌΠ΅Π½ΠΈΠ²ΡˆΡƒΡŽΡΡ Ρ‡Π°ΡΡ‚ΡŒ Π΄Π°Π½Π½Ρ‹Ρ…. Но Ρ‚Π°ΠΊ приходится Π΄Π΅Π»Π°Ρ‚ΡŒ, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ Π² Hive Π½Π΅Ρ‚ ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΉ delete ΠΈΠ»ΠΈ update.

Когда Ρƒ вас сбСровскиС ΠΌΠ°ΡΡˆΡ‚Π°Π±Ρ‹. ИспользованиС Ab Initio ΠΏΡ€ΠΈ Ρ€Π°Π±ΠΎΡ‚Π΅ с Hive ΠΈ GreenPlum

Π’ случаС ΠΆΠ΅ RDBMS Π³Ρ€Π°Ρ„Ρ‹ ΠΏΠΎ ΠΈΠ½ΠΊΡ€Π΅ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎΠΌΡƒ обновлСнию Π΄Π°Π½Π½Ρ‹Ρ… выглядят Π±ΠΎΠ»Π΅Π΅ ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½ΠΎ, ΠΏΠΎΡ‚ΠΎΠΌΡƒ Ρ‡Ρ‚ΠΎ RDBMS ΠΈΠΌΠ΅ΡŽΡ‚ Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹Π΅ возмоТности обновлСния.

Когда Ρƒ вас сбСровскиС ΠΌΠ°ΡΡˆΡ‚Π°Π±Ρ‹. ИспользованиС Ab Initio ΠΏΡ€ΠΈ Ρ€Π°Π±ΠΎΡ‚Π΅ с Hive ΠΈ GreenPlum

ΠŸΠΎΡΡ‚ΡƒΠΏΠΈΠ²ΡˆΠ°Ρ Π΄Π΅Π»ΡŒΡ‚Π° загруТаСтся Π² ΠΏΡ€ΠΎΠΌΠ΅ΠΆΡƒΡ‚ΠΎΡ‡Π½ΡƒΡŽ Ρ‚Π°Π±Π»ΠΈΡ†Ρƒ Π² Π±Π°Π·Ρƒ Π΄Π°Π½Π½Ρ‹Ρ…. ПослС этого происходит соСдинСниС Π΄Π΅Π»ΡŒΡ‚Ρ‹ с Π΄Π°Π½Π½Ρ‹ΠΌΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π±Ρ‹Π»ΠΈ Π² Ρ‚Π°Π±Π»ΠΈΡ†Π΅ Π΄ΠΎ обновлСния. И дСлаСтся это силами SQL посрСдством сгСнСрированного SQL-запроса. Π”Π°Π»Π΅Π΅ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ SQL-ΠΊΠΎΠΌΠ°Π½Π΄ delete+insert Π² Ρ†Π΅Π»Π΅Π²ΡƒΡŽ Ρ‚Π°Π±Π»ΠΈΡ†Ρƒ происходит вставка Π½ΠΎΠ²Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΠ· Π΄Π΅Π»ΡŒΡ‚Ρ‹ ΠΈ Π·Π°ΠΊΡ€Ρ‹Ρ‚ΠΈΠ΅ ΠΏΠ΅Ρ€ΠΈΠΎΠ΄ΠΎΠ² Π°ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Π΄Π°Π½Π½Ρ‹Ρ…, ΠΏΠΎ ΠΏΠ΅Ρ€Π²ΠΈΡ‡Π½Ρ‹ΠΌ ΠΊΠ»ΡŽΡ‡Π°ΠΌ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… поступила Π΄Π΅Π»ΡŒΡ‚Π°.
НСизмСнившиСся Π΄Π°Π½Π½Ρ‹Π΅ ΠΏΠ΅Ρ€Π΅ΠΏΠΈΡΡ‹Π²Π°Ρ‚ΡŒ Π½Π΅Ρ‚ Π½ΡƒΠΆΠ΄Ρ‹.

Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, ΠΌΡ‹ ΠΏΡ€ΠΈΡˆΠ»ΠΈ ΠΊ Π²Ρ‹Π²ΠΎΠ΄Ρƒ, Ρ‡Ρ‚ΠΎ Π² случаС Hive MDW Π΄ΠΎΠ»ΠΆΠ΅Π½ ΠΏΠΎΠΉΡ‚ΠΈ Π½Π° пСрСписываниС всСй Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹, ΠΏΠΎΡ‚ΠΎΠΌΡƒ Ρ‡Ρ‚ΠΎ Hive Π½Π΅ ΠΈΠΌΠ΅Π΅Ρ‚ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ обновлСния. И Π½ΠΈΡ‡Π΅Π³ΠΎ Π»ΡƒΡ‡ΡˆΠ΅ ΠΏΠΎΠ»Π½ΠΎΠ³ΠΎ пСрСписывания Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΡ€ΠΈ ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠΈ Π½Π΅ ΠΏΡ€ΠΈΠ΄ΡƒΠΌΠ°Π½ΠΎ. Π’ случаС ΠΆΠ΅ RDBMS, Π½Π°ΠΎΠ±ΠΎΡ€ΠΎΡ‚, создатСли ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚Π° сочли Π½ΡƒΠΆΠ½Ρ‹ΠΌ Π΄ΠΎΠ²Π΅Ρ€ΠΈΡ‚ΡŒ соСдинСниС ΠΈ ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠ΅ Ρ‚Π°Π±Π»ΠΈΡ† использованию SQL.

Для ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° Π² Π‘Π±Π΅Ρ€Π±Π°Π½ΠΊΠ΅ ΠΌΡ‹ создали Π½ΠΎΠ²ΡƒΡŽ ΠΌΠ½ΠΎΠ³ΠΎΠΊΡ€Π°Ρ‚Π½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡƒΡŽ Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ Π·Π°Π³Ρ€ΡƒΠ·Ρ‡ΠΈΠΊΠ° Π±Π°Π·Ρ‹ Π΄Π°Π½Π½Ρ‹Ρ… для GreenPlum. Π‘Π΄Π΅Π»Π°Π½ΠΎ это Π±Ρ‹Π»ΠΎ Π½Π° основС вСрсии, ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ MDW Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΠ΅Ρ‚ для Teradata. ИмСнно Teradata, Π° Π½Π΅ Oracle подошла для этого Π»ΡƒΡ‡ΡˆΠ΅ ΠΈ Π±Π»ΠΈΠΆΠ΅ всСго, Ρ‚.ΠΊ. Ρ‚ΠΎΠΆΠ΅ являСтся MPP-систСмой. Бпособы Ρ€Π°Π±ΠΎΡ‚Ρ‹, Π° Ρ‚Π°ΠΊΠΆΠ΅ синтаксис Teradata ΠΈ GreenPlum оказались Π±Π»ΠΈΠ·ΠΊΠΈ.

ΠŸΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ ΠΊΡ€ΠΈΡ‚ΠΈΡ‡Π½Ρ‹Ρ… для MDW Ρ€Π°Π·Π»ΠΈΡ‡ΠΈΠΉ ΠΌΠ΅ΠΆΠ΄Ρƒ Ρ€Π°Π·Π½Ρ‹ΠΌΠΈ RDBMS Ρ‚Π°ΠΊΠΎΠ²Ρ‹. Π’ GreenPlum Π² ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠΈ ΠΎΡ‚ Teradata ΠΏΡ€ΠΈ создании Ρ‚Π°Π±Π»ΠΈΡ† Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΈΡΠ°Ρ‚ΡŒ ΠΊΠ»Π°ΡƒΠ·Ρƒ

distributed by

Π’ Teradata ΠΏΠΈΡˆΡƒΡ‚

delete <table> all

, Π° Π² GreΠ΅nPlum ΠΏΠΈΡˆΡƒΡ‚

delete from <table>

Π’ Oracle Π² цСлях ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ ΠΏΠΈΡˆΡƒΡ‚

delete from t where rowid in (<соСдинСниС t с Π΄Π΅Π»ΡŒΡ‚ΠΎΠΉ>)

, Π° Π² Teradata ΠΈ GreenPlum ΠΏΠΈΡˆΡƒΡ‚

delete from t where exists (select * from delta where delta.pk=t.pk)

Π•Ρ‰Ρ‘ ΠΎΡ‚ΠΌΠ΅Ρ‚ΠΈΠΌ, Ρ‡Ρ‚ΠΎ для Ρ€Π°Π±ΠΎΡ‚Ρ‹ Ab Initio с GreenPlum ΠΏΠΎΡ‚Ρ€Π΅Π±ΠΎΠ²Π°Π»ΠΎΡΡŒ ΡƒΡΡ‚Π°Π½ΠΎΠ²ΠΈΡ‚ΡŒ ΠΊΠ»ΠΈΠ΅Π½Ρ‚ GreenPlum Π½Π° всС Π½ΠΎΠ΄Ρ‹ кластСра Ab Initio. Π­Ρ‚ΠΎ ΠΏΠΎΡ‚ΠΎΠΌΡƒ, Ρ‡Ρ‚ΠΎ ΠΌΡ‹ ΠΏΠΎΠ΄ΠΊΠ»ΡŽΡ‡ΠΈΠ»ΠΈΡΡŒ ΠΊ GreenPlum ΠΎΠ΄Π½ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎ со всСх ΡƒΠ·Π»ΠΎΠ² нашСго кластСра. А для Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Ρ‡Ρ‚Π΅Π½ΠΈΠ΅ ΠΈΠ· GreenPlum Π±Ρ‹Π»ΠΎ ΠΏΠ°Ρ€Π°Π»Π»Π΅Π»ΡŒΠ½Ρ‹ΠΌ ΠΈ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ ΠΏΠ°Ρ€Π°Π»Π»Π΅Π»ΡŒΠ½Ρ‹ΠΉ ΠΏΠΎΡ‚ΠΎΠΊ Ab Initio Ρ‡ΠΈΡ‚Π°Π» свою ΠΏΠΎΡ€Ρ†ΠΈΡŽ Π΄Π°Π½Π½Ρ‹Ρ… ΠΈΠ· GreenPlum, ΠΏΡ€ΠΈΡˆΠ»ΠΎΡΡŒ Π² ΡΠ΅ΠΊΡ†ΠΈΡŽ Β«whereΒ» SQL-запросов ΠΏΠΎΠΌΠ΅ΡΡ‚ΠΈΡ‚ΡŒ ΠΏΠΎΠ½ΠΈΠΌΠ°Π΅ΠΌΡƒΡŽ Ab Initio ΠΊΠΎΠ½ΡΡ‚Ρ€ΡƒΠΊΡ†ΠΈΡŽ

where ABLOCAL()

ΠΈ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ этой конструкции, ΡƒΠΊΠ°Π·Π°Π² Ρ‡ΠΈΡ‚Π°ΡŽΡ‰Π΅ΠΉ ΠΈΠ· Π‘Π” трансформации ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€

ablocal_expr=Β«string_concat("mod(t.", string_filter_out("{$TABLE_KEY}","{}"), ",", (decimal(3))(number_of_partitions()),")=", (decimal(3))(this_partition()))Β»

, которая компилируСтся Π² Ρ‡Ρ‚ΠΎ-Ρ‚ΠΎ Ρ‚ΠΈΠΏΠ°

mod(sk,10)=3

, Ρ‚.Π΅. приходится ΠΏΠΎΠ΄ΡΠΊΠ°Π·Ρ‹Π²Π°Ρ‚ΡŒ GreenPlum явный Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ для ΠΊΠ°ΠΆΠ΄ΠΎΠΉ ΠΏΠ°Ρ€Ρ‚ΠΈΡ†ΠΈΠΈ. Для Π΄Ρ€ΡƒΠ³ΠΈΡ… Π±Π°Π· Π΄Π°Π½Π½Ρ‹Ρ… (Teradata, Oracle) Ab Initio ΠΌΠΎΠΆΠ΅Ρ‚ Π²Ρ‹ΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ это распараллСливаниС автоматичСски.

Π‘Ρ€Π°Π²Π½ΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ характСристики ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ Ab Initio ΠΏΠΎ Ρ€Π°Π±ΠΎΡ‚Π΅ с Hive ΠΈ GreenPlum

Π’ Π‘Π±Π΅Ρ€Π±Π°Π½ΠΊΠ΅ Π±Ρ‹Π» ΠΏΡ€ΠΎΠ²Π΅Π΄Ρ‘Π½ экспСримСнт ΠΏΠΎ ΡΡ€Π°Π²Π½Π΅Π½ΠΈΡŽ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ сгСнСрированных MDW Π³Ρ€Π°Ρ„ΠΎΠ² ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΊ Hive ΠΈ ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΊ GreenPlum. Π’ Ρ€Π°ΠΌΠΊΠ°Ρ… экспСримСнта Π² случаС Hive имСлось 5 Π½ΠΎΠ΄ Π½Π° Ρ‚ΠΎΠΌ ΠΆΠ΅ кластСрС, Ρ‡Ρ‚ΠΎ ΠΈ Ab Initio, Π° Π² случаС GreenPlum имСлось 4 Π½ΠΎΠ΄Ρ‹ Π½Π° ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½ΠΎΠΌ кластСрС. Π’.Π΅. Hive ΠΈΠΌΠ΅Π» Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ прСимущСство Π½Π°Π΄ GreenPlum Β«ΠΏΠΎ ΠΆΠ΅Π»Π΅Π·ΡƒΒ».

Π‘Ρ‹Π»ΠΎ рассмотрСно Π΄Π²Π΅ ΠΏΠ°Ρ€Ρ‹ Π³Ρ€Π°Ρ„ΠΎΠ², Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡŽΡ‰ΠΈΡ… ΠΎΠ΄Π½Ρƒ ΠΈ Ρ‚Ρƒ ΠΆΠ΅ Π·Π°Π΄Π°Ρ‡Ρƒ обновлСния Π΄Π°Π½Π½Ρ‹Ρ… Π² Hive ΠΈ Π² GreenPlum. ΠŸΡ€ΠΈ этом запускали Π³Ρ€Π°Ρ„Ρ‹, сгСнСрированныС ΠΊΠΎΠ½Ρ„ΠΈΠ³ΡƒΡ€Π°Ρ‚ΠΎΡ€ΠΎΠΌ MDW:

  • ΠΈΠ½ΠΈΡ†ΠΈΠ°Π»ΠΈΠ·ΠΈΡ€ΡƒΡŽΡ‰Π°Ρ Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠ° + ΠΈΠ½ΠΊΡ€Π΅ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½Π°Ρ Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠ° случайно сгСнСрированных Π΄Π°Π½Π½Ρ‹Ρ… Π² Ρ‚Π°Π±Π»ΠΈΡ†Ρƒ Hive
  • ΠΈΠ½ΠΈΡ†ΠΈΠ°Π»ΠΈΠ·ΠΈΡ€ΡƒΡŽΡ‰Π°Ρ Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠ° + ΠΈΠ½ΠΊΡ€Π΅ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½Π°Ρ Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠ° случайно сгСнСрированных Π΄Π°Π½Π½Ρ‹Ρ… Π² Ρ‚Π°ΠΊΡƒΡŽ ΠΆΠ΅ Ρ‚Π°Π±Π»ΠΈΡ†Ρƒ GreenPlum

Π’ ΠΎΠ±ΠΎΠΈΡ… случаях (Hive ΠΈ GreenPlum) запускали Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠΈ Π² 10 ΠΏΠ°Ρ€Π°Π»Π»Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΏΠΎΡ‚ΠΎΠΊΠΎΠ² Π½Π° ΠΎΠ΄Π½ΠΎΠΌ ΠΈ Ρ‚ΠΎΠΌ ΠΆΠ΅ кластСрС Ab Initio. ΠŸΡ€ΠΎΠΌΠ΅ΠΆΡƒΡ‚ΠΎΡ‡Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅ для расчётов Ab Initio сохранял Π² HDFS (Π² Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π°Ρ… Ab Initio Π±Ρ‹Π» использован MFS layout using HDFS). Одна строка случайно сгСнСрированных Π΄Π°Π½Π½Ρ‹Ρ… Π·Π°Π½ΠΈΠΌΠ°Π»Π° Π² ΠΎΠ±ΠΎΠΈΡ… случаях ΠΏΠΎ 200 Π±Π°ΠΉΡ‚.

Π Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ получился Ρ‚Π°ΠΊΠΎΠΉ:

Hive:

Π˜Π½ΠΈΡ†ΠΈΠ°Π»ΠΈΠ·ΠΈΡ€ΡƒΡŽΡ‰Π°Ρ Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠ° Π² Hive

ВставлСно строк
6 000 000
60 000 000
600 000 000

ΠŸΡ€ΠΎΠ΄ΠΎΠ»ΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΈΠ½ΠΈΡ†ΠΈΠ°Π»ΠΈΠ·ΠΈΡ€ΡƒΡŽΡ‰Π΅ΠΉ
Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠΈ Π² сСкундах
41
203
1 601

Π˜Π½ΠΊΡ€Π΅ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½Π°Ρ Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠ° Π² Hive

ΠšΠΎΠ»ΠΈΡ‡Π΅ΡΡ‚Π²ΠΎ строк, ΠΈΠΌΠ΅Π²ΡˆΠΈΡ…ΡΡ Π²
Ρ†Π΅Π»Π΅Π²ΠΎΠΉ Ρ‚Π°Π±Π»ΠΈΡ†Π΅ Π½Π° Π½Π°Ρ‡Π°Π»ΠΎ экспСримСнта
6 000 000
60 000 000
600 000 000

ΠšΠΎΠ»ΠΈΡ‡Π΅ΡΡ‚Π²ΠΎ строк Π΄Π΅Π»ΡŒΡ‚Ρ‹, ΠΏΡ€ΠΈΠΌΠ΅Π½Ρ‘Π½Π½Ρ‹Ρ… ΠΊ
Ρ†Π΅Π»Π΅Π²ΠΎΠΉ Ρ‚Π°Π±Π»ΠΈΡ†Π΅ Π² Ρ…ΠΎΠ΄Π΅ экспСримСнта
6 000 000
6 000 000
6 000 000

ΠŸΡ€ΠΎΠ΄ΠΎΠ»ΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΈΠ½ΠΊΡ€Π΅ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎΠΉ
Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠΈ Π² сСкундах
88
299
2 541

GreenPlum:

Π˜Π½ΠΈΡ†ΠΈΠ°Π»ΠΈΠ·ΠΈΡ€ΡƒΡŽΡ‰Π°Ρ Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠ° Π² GreenPlum

ВставлСно строк
6 000 000
60 000 000
600 000 000

ΠŸΡ€ΠΎΠ΄ΠΎΠ»ΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΈΠ½ΠΈΡ†ΠΈΠ°Π»ΠΈΠ·ΠΈΡ€ΡƒΡŽΡ‰Π΅ΠΉ
Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠΈ Π² сСкундах
72
360
3 631

Π˜Π½ΠΊΡ€Π΅ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½Π°Ρ Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠ° Π² GreenPlum

ΠšΠΎΠ»ΠΈΡ‡Π΅ΡΡ‚Π²ΠΎ строк, ΠΈΠΌΠ΅Π²ΡˆΠΈΡ…ΡΡ Π²
Ρ†Π΅Π»Π΅Π²ΠΎΠΉ Ρ‚Π°Π±Π»ΠΈΡ†Π΅ Π½Π° Π½Π°Ρ‡Π°Π»ΠΎ экспСримСнта
6 000 000
60 000 000
600 000 000

ΠšΠΎΠ»ΠΈΡ‡Π΅ΡΡ‚Π²ΠΎ строк Π΄Π΅Π»ΡŒΡ‚Ρ‹, ΠΏΡ€ΠΈΠΌΠ΅Π½Ρ‘Π½Π½Ρ‹Ρ… ΠΊ
Ρ†Π΅Π»Π΅Π²ΠΎΠΉ Ρ‚Π°Π±Π»ΠΈΡ†Π΅ Π² Ρ…ΠΎΠ΄Π΅ экспСримСнта
6 000 000
6 000 000
6 000 000

ΠŸΡ€ΠΎΠ΄ΠΎΠ»ΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΈΠ½ΠΊΡ€Π΅ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎΠΉ
Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠΈ Π² сСкундах
159
199
321

Π’ΠΈΠ΄ΠΈΠΌ, Ρ‡Ρ‚ΠΎ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ ΠΈΠ½ΠΈΡ†ΠΈΠ°Π»ΠΈΠ·ΠΈΡ€ΡƒΡŽΡ‰Π΅ΠΉ Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠΈ ΠΊΠ°ΠΊ Π² Hive, Ρ‚Π°ΠΊ ΠΈ Π² GreenPlum Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎ зависит ΠΎΡ‚ ΠΎΠ±ΡŠΡ‘ΠΌΠ° Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΏΠΎ ΠΏΡ€ΠΈΡ‡ΠΈΠ½Π°ΠΌ Π»ΡƒΡ‡ΡˆΠ΅Π³ΠΎ ΠΆΠ΅Π»Π΅Π·Π° ΠΎΠ½Π° нСсколько быстрСС для Hive, Ρ‡Π΅ΠΌ для GreenPlum.

Π˜Π½ΠΊΡ€Π΅ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½Π°Ρ Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠ° Π² Hive Ρ‚Π°ΠΊΠΆΠ΅ Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎ зависит ΠΎΡ‚ ΠΎΠ±ΡŠΡ‘ΠΌΠ° ΠΈΠΌΠ΅ΡŽΡ‰ΠΈΡ…ΡΡ Π² Ρ†Π΅Π»Π΅Π²ΠΎΠΉ Ρ‚Π°Π±Π»ΠΈΡ†Π΅ Ρ€Π°Π½Π΅Π΅ Π·Π°Π³Ρ€ΡƒΠΆΠ΅Π½Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΏΡ€ΠΎΡ…ΠΎΠ΄ΠΈΡ‚ достаточно ΠΌΠ΅Π΄Π»Π΅Π½Π½ΠΎ с ростом ΠΎΠ±ΡŠΡ‘ΠΌΠ°. Π’Ρ‹Π·Π²Π°Π½ΠΎ это Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎΡΡ‚ΡŒΡŽ ΠΏΠ΅Ρ€Π΅Π·Π°ΠΏΠΈΡΡ‹Π²Π°Ρ‚ΡŒ Ρ†Π΅Π»Π΅Π²ΡƒΡŽ Ρ‚Π°Π±Π»ΠΈΡ†Ρƒ ΠΏΠΎΠ»Π½ΠΎΡΡ‚ΡŒΡŽ. Π­Ρ‚ΠΎ ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ ΠΌΠ°Π»Π΅Π½ΡŒΠΊΠΈΡ… ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠΉ ΠΊ ΠΎΠ³Ρ€ΠΎΠΌΠ½Ρ‹ΠΌ Ρ‚Π°Π±Π»ΠΈΡ†Π°ΠΌ – Π½Π΅ ΠΎΡ‡Π΅Π½ΡŒ Ρ…ΠΎΡ€ΠΎΡˆΠΈΠΉ Π²Π°Ρ€ΠΈΠ°Π½Ρ‚ использования для Hive.

Π˜Π½ΠΊΡ€Π΅ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½Π°Ρ ΠΆΠ΅ Π·Π°Π³Ρ€ΡƒΠ·ΠΊΠ° Π² GreenPlum слабо зависит ΠΎΡ‚ ΠΎΠ±ΡŠΡ‘ΠΌΠ° ΠΈΠΌΠ΅ΡŽΡ‰ΠΈΡ…ΡΡ Π² Ρ†Π΅Π»Π΅Π²ΠΎΠΉ Ρ‚Π°Π±Π»ΠΈΡ†Π΅ Ρ€Π°Π½Π΅Π΅ Π·Π°Π³Ρ€ΡƒΠΆΠ΅Π½Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΏΡ€ΠΎΡ…ΠΎΠ΄ΠΈΡ‚ достаточно быстро. ΠŸΠΎΠ»ΡƒΡ‡ΠΈΠ»ΠΎΡΡŒ это благодаря SQL Joins ΠΈ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π΅ GreenPlum, Π΄ΠΎΠΏΡƒΡΠΊΠ°ΡŽΡ‰Π΅ΠΉ ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΡŽ delete.

Π˜Ρ‚Π°ΠΊ, GreenPlum Π²Π»ΠΈΠ²Π°Π΅Ρ‚ Π΄Π΅Π»ΡŒΡ‚Ρƒ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠΌ delete+insert, Π° Π² Hive Π½Π΅Ρ‚Ρƒ ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΉ delete Π»ΠΈΠ±ΠΎ update, поэтому вСсь массив Π΄Π°Π½Π½Ρ‹Ρ… ΠΏΡ€ΠΈ ΠΈΠ½ΠΊΡ€Π΅ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎΠΌ ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠΈ Π±Ρ‹Π»ΠΈ Π²Ρ‹Π½ΡƒΠΆΠ΄Π΅Π½Ρ‹ ΠΏΠ΅Ρ€Π΅ΠΏΠΈΡΡ‹Π²Π°Ρ‚ΡŒ Ρ†Π΅Π»ΠΈΠΊΠΎΠΌ. НаиболСС ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ сравнСниС Π²Ρ‹Π΄Π΅Π»Π΅Π½Π½Ρ‹Ρ… ΠΆΠΈΡ€Π½Ρ‹ΠΌ ячССк, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ ΠΎΠ½ΠΎ соотвСтствуСт Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ частому Π²Π°Ρ€ΠΈΠ°Π½Ρ‚Ρƒ эксплуатации рСсурсоёмких Π·Π°Π³Ρ€ΡƒΠ·ΠΎΠΊ. Π’ΠΈΠ΄ΠΈΠΌ, Ρ‡Ρ‚ΠΎ GreenPlum Π²Ρ‹ΠΈΠ³Ρ€Π°Π» Ρƒ Hive Π² этом тСстС Π² 8 Ρ€Π°Π·.

Π Π°Π±ΠΎΡ‚Π° Ab Initio с GreenPlum Π² Ρ€Π΅ΠΆΠΈΠΌΠ΅ Near Real Time

Π’ этом экспСримСнтС ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΈΠΌ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ Ab Initio ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚ΡŒ ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠ΅ Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ GreenPlum случайно Ρ„ΠΎΡ€ΠΌΠΈΡ€ΡƒΠ΅ΠΌΡ‹ΠΌΠΈ порциями Π΄Π°Π½Π½Ρ‹Ρ… Π² Ρ€Π΅ΠΆΠΈΠΌΠ΅, Π±Π»ΠΈΠ·ΠΊΠΎΠΌ ΠΊ Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΌΡƒ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ. Рассмотрим Ρ‚Π°Π±Π»ΠΈΡ†Ρƒ GreenPlum dev42_1_db_usl.TESTING_SUBJ_org_finval, с ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ Π±ΡƒΠ΄Π΅Ρ‚ Π²Π΅ΡΡ‚ΠΈΡΡŒ Ρ€Π°Π±ΠΎΡ‚Π°.

Π‘ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Ρ‚Ρ€ΠΈ Π³Ρ€Π°Ρ„Π° Ab Initio ΠΏΠΎ Ρ€Π°Π±ΠΎΡ‚Π΅ с Π½Π΅ΠΉ:

1) Π“Ρ€Π°Ρ„ Create_test_data.mp – создаёт Π² 10 ΠΏΠ°Ρ€Π°Π»Π»Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΏΠΎΡ‚ΠΎΠΊΠΎΠ² Ρ„Π°ΠΉΠ»Ρ‹ с Π΄Π°Π½Π½Ρ‹ΠΌΠΈ Π² HDFS Π½Π° 6 000 000 строк. Π”Π°Π½Π½Ρ‹Π΅ случайныС, структура ΠΈΡ… ΠΎΡ€Π³Π°Π½ΠΈΠ·ΠΎΠ²Π°Π½Π° для вставки Π² Π½Π°ΡˆΡƒ Ρ‚Π°Π±Π»ΠΈΡ†Ρƒ

Когда Ρƒ вас сбСровскиС ΠΌΠ°ΡΡˆΡ‚Π°Π±Ρ‹. ИспользованиС Ab Initio ΠΏΡ€ΠΈ Ρ€Π°Π±ΠΎΡ‚Π΅ с Hive ΠΈ GreenPlum

Когда Ρƒ вас сбСровскиС ΠΌΠ°ΡΡˆΡ‚Π°Π±Ρ‹. ИспользованиС Ab Initio ΠΏΡ€ΠΈ Ρ€Π°Π±ΠΎΡ‚Π΅ с Hive ΠΈ GreenPlum

2) Π“Ρ€Π°Ρ„ mdw_load.day_one.current.dev42_1_db_usl_testing_subj_org_finval.pset – сгСнСрированный MDW Π³Ρ€Π°Ρ„ ΠΏΠΎ ΠΈΠ½ΠΈΡ†ΠΈΠ°Π»ΠΈΠ·ΠΈΡ€ΡƒΡŽΡ‰Π΅ΠΉ вставкС Π΄Π°Π½Π½Ρ‹Ρ… Π² Π½Π°ΡˆΡƒ Ρ‚Π°Π±Π»ΠΈΡ†Ρƒ Π² 10 ΠΏΠ°Ρ€Π°Π»Π»Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΏΠΎΡ‚ΠΎΠΊΠΎΠ² (ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ тСстовыС Π΄Π°Π½Π½Ρ‹Π΅, сгСнСрированныС Π³Ρ€Π°Ρ„ΠΎΠΌ (1))

Когда Ρƒ вас сбСровскиС ΠΌΠ°ΡΡˆΡ‚Π°Π±Ρ‹. ИспользованиС Ab Initio ΠΏΡ€ΠΈ Ρ€Π°Π±ΠΎΡ‚Π΅ с Hive ΠΈ GreenPlum

3) Π“Ρ€Π°Ρ„ mdw_load.regular.current.dev42_1_db_usl_testing_subj_org_finval.pset – сгСнСрированный MDW Π³Ρ€Π°Ρ„ ΠΏΠΎ ΠΈΠ½ΠΊΡ€Π΅ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎΠΌΡƒ обновлСнию нашСй Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹ Π² 10 ΠΏΠ°Ρ€Π°Π»Π»Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΏΠΎΡ‚ΠΎΠΊΠΎΠ² с использованиСм ΠΏΠΎΡ€Ρ†ΠΈΠΈ свСТих ΠΏΠΎΡΡ‚ΡƒΠΏΠΈΠ²ΡˆΠΈΡ… Π΄Π°Π½Π½Ρ‹Ρ… (Π΄Π΅Π»ΡŒΡ‚Ρ‹), сгСнСрированных Π³Ρ€Π°Ρ„ΠΎΠΌ (1)

Когда Ρƒ вас сбСровскиС ΠΌΠ°ΡΡˆΡ‚Π°Π±Ρ‹. ИспользованиС Ab Initio ΠΏΡ€ΠΈ Ρ€Π°Π±ΠΎΡ‚Π΅ с Hive ΠΈ GreenPlum

Π’Ρ‹ΠΏΠΎΠ»Π½ΠΈΠΌ Π½ΠΈΠΆΠ΅ΠΏΡ€ΠΈΠ²Π΅Π΄Ρ‘Π½Π½Ρ‹ΠΉ сцСнарий Π² Ρ€Π΅ΠΆΠΈΠΌΠ΅ NRT:

  • ΡΠ³Π΅Π½Π΅Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ 6 000 000 тСстовых строк
  • произвСсти ΠΈΠ½ΠΈΡ†ΠΈΠ°Π»ΠΈΠ·ΠΈΡ€ΡƒΡŽΡ‰ΡƒΡŽ Π·Π°Π³Ρ€ΡƒΠ·ΠΊΡƒ Π²ΡΡ‚Π°Π²ΠΈΡ‚ΡŒ 6 000 000 тСстовых строк Π² ΠΏΡƒΡΡ‚ΡƒΡŽ Ρ‚Π°Π±Π»ΠΈΡ†Ρƒ
  • ΠΏΠΎΠ²Ρ‚ΠΎΡ€ΠΈΡ‚ΡŒ 5 Ρ€Π°Π· ΠΈΠ½ΠΊΡ€Π΅ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΡƒΡŽ Π·Π°Π³Ρ€ΡƒΠ·ΠΊΡƒ
    • ΡΠ³Π΅Π½Π΅Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ 6 000 000 тСстовых строк
    • произвСсти ΠΈΠ½ΠΊΡ€Π΅ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΡƒΡŽ вставку 6 000 000 тСстовых строк Π² Ρ‚Π°Π±Π»ΠΈΡ†Ρƒ (ΠΏΡ€ΠΈ этом старым Π΄Π°Π½Π½Ρ‹ΠΌ проставляСтся врСмя истСчСния Π°ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ valid_to_ts ΠΈ Π²ΡΡ‚Π°Π²Π»ΡΡŽΡ‚ΡΡ Π±ΠΎΠ»Π΅Π΅ свСТиС Π΄Π°Π½Π½Ρ‹Π΅ с Ρ‚Π΅ΠΌ ΠΆΠ΅ ΠΏΠ΅Ρ€Π²ΠΈΡ‡Π½Ρ‹ΠΌ ΠΊΠ»ΡŽΡ‡ΠΎΠΌ)

Π’Π°ΠΊΠΎΠΉ сцСнарий эмулируСт Ρ€Π΅ΠΆΠΈΠΌ Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΉ Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π½Π΅ΠΊΠΎΠΉ бизнСс-систСмы – Π² Ρ€Π΅ΠΆΠΈΠΌΠ΅ Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ появляСтся достаточно ΠΎΠ±ΡŠΡ‘ΠΌΠ½Π°Ρ порция Π½ΠΎΠ²Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ Ρ‚ΡƒΡ‚ ΠΆΠ΅ вливаСтся Π² GreenPlum.

Π’Π΅ΠΏΠ΅Ρ€ΡŒ посмотрим Π»ΠΎΠ³ Ρ€Π°Π±ΠΎΡ‚Ρ‹ сцСнария:

Start Create_test_data.input.pset at 2020-06-04 11:49:11
Finish Create_test_data.input.pset at 2020-06-04 11:49:37
Start mdw_load.day_one.current.dev42_1_db_usl_testing_subj_org_finval.pset at 2020-06-04 11:49:37
Finish mdw_load.day_one.current.dev42_1_db_usl_testing_subj_org_finval.pset at 2020-06-04 11:50:42
Start Create_test_data.input.pset at 2020-06-04 11:50:42
Finish Create_test_data.input.pset at 2020-06-04 11:51:06
Start mdw_load.regular.current.dev42_1_db_usl_testing_subj_org_finval.pset at 2020-06-04 11:51:06
Finish mdw_load.regular.current.dev42_1_db_usl_testing_subj_org_finval.pset at 2020-06-04 11:53:41
Start Create_test_data.input.pset at 2020-06-04 11:53:41
Finish Create_test_data.input.pset at 2020-06-04 11:54:04
Start mdw_load.regular.current.dev42_1_db_usl_testing_subj_org_finval.pset at 2020-06-04 11:54:04
Finish mdw_load.regular.current.dev42_1_db_usl_testing_subj_org_finval.pset at 2020-06-04 11:56:51
Start Create_test_data.input.pset at 2020-06-04 11:56:51
Finish Create_test_data.input.pset at 2020-06-04 11:57:14
Start mdw_load.regular.current.dev42_1_db_usl_testing_subj_org_finval.pset at 2020-06-04 11:57:14
Finish mdw_load.regular.current.dev42_1_db_usl_testing_subj_org_finval.pset at 2020-06-04 11:59:55
Start Create_test_data.input.pset at 2020-06-04 11:59:55
Finish Create_test_data.input.pset at 2020-06-04 12:00:23
Start mdw_load.regular.current.dev42_1_db_usl_testing_subj_org_finval.pset at 2020-06-04 12:00:23
Finish mdw_load.regular.current.dev42_1_db_usl_testing_subj_org_finval.pset at 2020-06-04 12:03:23
Start Create_test_data.input.pset at 2020-06-04 12:03:23
Finish Create_test_data.input.pset at 2020-06-04 12:03:49
Start mdw_load.regular.current.dev42_1_db_usl_testing_subj_org_finval.pset at 2020-06-04 12:03:49
Finish mdw_load.regular.current.dev42_1_db_usl_testing_subj_org_finval.pset at 2020-06-04 12:06:46

ΠŸΠΎΠ»ΡƒΡ‡Π°Π΅Ρ‚ΡΡ такая ΠΊΠ°Ρ€Ρ‚ΠΈΠ½Π°:

Graph
Start time
Finish time
Length

Create_test_data.input.pset
04.06.2020 11:49:11
04.06.2020 11:49:37
00:00:26

mdw_load.day_one.current.
dev42_1_db_usl_testing_subj_org_finval.pset
04.06.2020 11:49:37
04.06.2020 11:50:42
00:01:05

Create_test_data.input.pset
04.06.2020 11:50:42
04.06.2020 11:51:06
00:00:24

mdw_load.regular.current.
dev42_1_db_usl_testing_subj_org_finval.pset
04.06.2020 11:51:06
04.06.2020 11:53:41
00:02:35

Create_test_data.input.pset
04.06.2020 11:53:41
04.06.2020 11:54:04
00:00:23

mdw_load.regular.current.
dev42_1_db_usl_testing_subj_org_finval.pset
04.06.2020 11:54:04
04.06.2020 11:56:51
00:02:47

Create_test_data.input.pset
04.06.2020 11:56:51
04.06.2020 11:57:14
00:00:23

mdw_load.regular.current.
dev42_1_db_usl_testing_subj_org_finval.pset
04.06.2020 11:57:14
04.06.2020 11:59:55
00:02:41

Create_test_data.input.pset
04.06.2020 11:59:55
04.06.2020 12:00:23
00:00:28

mdw_load.regular.current.
dev42_1_db_usl_testing_subj_org_finval.pset
04.06.2020 12:00:23
04.06.2020 12:03:23
00:03:00

Create_test_data.input.pset
04.06.2020 12:03:23
04.06.2020 12:03:49
00:00:26

mdw_load.regular.current.
dev42_1_db_usl_testing_subj_org_finval.pset
04.06.2020 12:03:49
04.06.2020 12:06:46
00:02:57

Π’ΠΈΠ΄ΠΈΠΌ, Ρ‡Ρ‚ΠΎ 6 000 000 строк ΠΈΠ½ΠΊΡ€Π΅ΠΌΠ΅Π½Ρ‚Π° ΠΎΠ±Ρ€Π°Π±Π°Ρ‚Ρ‹Π²Π°ΡŽΡ‚ΡΡ Π·Π° 3 ΠΌΠΈΠ½ΡƒΡ‚Ρ‹, Ρ‡Ρ‚ΠΎ достаточно быстро.
Π”Π°Π½Π½Ρ‹Π΅ Π² Ρ†Π΅Π»Π΅Π²ΠΎΠΉ Ρ‚Π°Π±Π»ΠΈΡ†Π΅ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ»ΠΈΡΡŒ распрСдСлёнными ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ:

select valid_from_ts, valid_to_ts, count(1), min(sk), max(sk) from dev42_1_db_usl.TESTING_SUBJ_org_finval group by valid_from_ts, valid_to_ts order by 1,2;

Когда Ρƒ вас сбСровскиС ΠΌΠ°ΡΡˆΡ‚Π°Π±Ρ‹. ИспользованиС Ab Initio ΠΏΡ€ΠΈ Ρ€Π°Π±ΠΎΡ‚Π΅ с Hive ΠΈ GreenPlum
МоТно Ρ€Π°Π·Π³Π»ΡΠ΄Π΅Ρ‚ΡŒ соотвСтствиС вставлСнных Π΄Π°Π½Π½Ρ‹Ρ… ΠΌΠΎΠΌΠ΅Π½Ρ‚Π°ΠΌ запуска Π³Ρ€Π°Ρ„ΠΎΠ².
Π—Π½Π°Ρ‡ΠΈΡ‚ ΠΌΠΎΠΆΠ½ΠΎ Π·Π°ΠΏΡƒΡΠΊΠ°Ρ‚ΡŒ Π² Ab Initio ΠΈΠ½ΠΊΡ€Π΅ΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΡƒΡŽ Π·Π°Π³Ρ€ΡƒΠ·ΠΊΡƒ Π΄Π°Π½Π½Ρ‹Ρ… Π² GreenPlum с ΠΎΡ‡Π΅Π½ΡŒ высокой частотой ΠΈ Π½Π°Π±Π»ΡŽΠ΄Π°Ρ‚ΡŒ Π²Ρ‹ΡΠΎΠΊΡƒΡŽ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ вставки этих Π΄Π°Π½Π½Ρ‹Ρ… Π² GreenPlum. ΠšΠΎΠ½Π΅Ρ‡Π½ΠΎ, Ρ€Π°Π· Π² сСкунду Π·Π°ΠΏΡƒΡΠΊΠ°Ρ‚ΡŒΡΡ Π½Π΅ получится, Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ Ab Initio, ΠΊΠ°ΠΊ ΠΈ любоС ETL-срСдство, ΠΏΡ€ΠΈ запускС Ρ‚Ρ€Π΅Π±ΡƒΠ΅Ρ‚ Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ Β«Π½Π° раскачку».

Π—Π°ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅

БСйчас Ab Initio ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ Π² Π‘Π±Π΅Ρ€Π±Π°Π½ΠΊΠ΅ для построСния Π•Π΄ΠΈΠ½ΠΎΠ³ΠΎ сСмантичСского слоя Π΄Π°Π½Π½Ρ‹Ρ… (Π•Π‘Π‘). Π­Ρ‚ΠΎΡ‚ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ ΠΏΠΎΠ΄Ρ€Π°Π·ΡƒΠΌΠ΅Π²Π°Π΅Ρ‚ построСниС Π΅Π΄ΠΈΠ½ΠΎΠΉ вСрсии состояния Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… банковских бизнСс-сущностСй. Π˜Π½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡ ΠΏΡ€ΠΈΡ…ΠΎΠ΄ΠΈΡ‚ ΠΈΠ· Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… источников, Ρ€Π΅ΠΏΠ»ΠΈΠΊΠΈ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… готовятся Π½Π° Hadoop. Π˜ΡΡ…ΠΎΠ΄Ρ ΠΈΠ· потрСбностСй бизнСса, готовится модСль Π΄Π°Π½Π½Ρ‹Ρ… ΠΈ ΠΎΠΏΠΈΡΡ‹Π²Π°ΡŽΡ‚ΡΡ трансформации Π΄Π°Π½Π½Ρ‹Ρ…. Ab Initio Π·Π°Π³Ρ€ΡƒΠΆΠ°Π΅Ρ‚ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ Π² Π•Π‘Π‘ ΠΈ Π·Π°Π³Ρ€ΡƒΠΆΠ΅Π½Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅ Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡŽΡ‚ интСрСс для бизнСса сами ΠΏΠΎ сСбС, Π½ΠΎ ΠΈ слуТат источником для построСния Π²ΠΈΡ‚Ρ€ΠΈΠ½ Π΄Π°Π½Π½Ρ‹Ρ…. ΠŸΡ€ΠΈ этом Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π» ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚Π° позволяСт ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π² качСствС ΠΏΡ€ΠΈΡ‘ΠΌΠ½ΠΈΠΊΠ° Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ систСмы (Hive, Greenplum, Teradata, Oracle), Ρ‡Ρ‚ΠΎ Π΄Π°Ρ‘Ρ‚ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ Π±Π΅Π· особых усилий ΠΏΠΎΠ΄Π³ΠΎΡ‚Π°Π²Π»ΠΈΠ²Π°Ρ‚ΡŒ Π΄Π°Π½Π½Ρ‹Π΅ для бизнСса Π² Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Ρ‚Ρ€Π΅Π±ΡƒΠ΅ΠΌΡ‹Ρ… Π΅ΠΌΡƒ Ρ„ΠΎΡ€ΠΌΠ°Ρ‚Π°Ρ….

ВозмоТности Ab Initio ΡˆΠΈΡ€ΠΎΠΊΠΈ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΏΡ€ΠΈΠ»Π°Π³Π°ΡŽΡ‰ΠΈΠΉΡΡ Ρ„Ρ€Π΅ΠΉΠΌΠ²ΠΎΡ€ΠΊ MDW Π΄Π°Ρ‘Ρ‚ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ ΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ Ρ‚Π΅Ρ…Π½ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ ΠΈ бизнСс-ΠΈΡΡ‚ΠΎΡ€ΠΈΡ‡Π½ΠΎΡΡ‚ΡŒ Π΄Π°Π½Π½Ρ‹Ρ… β€œΠΈΠ· коробки”. Для Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠΎΠ² Ab Initio Π΄Π°Ρ‘Ρ‚ Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ β€œΠ½Π΅ ΠΈΠ·ΠΎΠ±Ρ€Π΅Ρ‚Π°Ρ‚ΡŒ вСлосипСд”, Π° ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ мноТСством ΠΈΠΌΠ΅ΡŽΡ‰ΠΈΡ…ΡΡ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹Ρ… ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ΠΎΠ², ΠΏΠΎ сути ΡΠ²Π»ΡΡŽΡ‰ΠΈΡ…ΡΡ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ°ΠΌΠΈ, Π½ΡƒΠΆΠ½Ρ‹ΠΌΠΈ ΠΏΡ€ΠΈ Ρ€Π°Π±ΠΎΡ‚Π΅ с Π΄Π°Π½Π½Ρ‹ΠΌΠΈ.

Автор β€” экспСрт ΠΏΡ€ΠΎΡ„Π΅ΡΡΠΈΠΎΠ½Π°Π»ΡŒΠ½ΠΎΠ³ΠΎ сообщСства Π‘Π±Π΅Ρ€Π±Π°Π½ΠΊΠ° SberProfi DWH/BigData. ΠŸΡ€ΠΎΡ„Π΅ΡΡΠΈΠΎΠ½Π°Π»ΡŒΠ½ΠΎΠ΅ сообщСство SberProfi DWH/BigData ΠΎΡ‚Π²Π΅Ρ‡Π°Π΅Ρ‚ Π·Π° Ρ€Π°Π·Π²ΠΈΡ‚ΠΈΠ΅ ΠΊΠΎΠΌΠΏΠ΅Ρ‚Π΅Π½Ρ†ΠΈΠΉ Π² Ρ‚Π°ΠΊΠΈΡ… направлСниях, ΠΊΠ°ΠΊ экосистСма Hadoop, Teradata, Oracle DB, GreenPlum, Π° Ρ‚Π°ΠΊΠΆΠ΅ BI инструмСнтах Qlik, SAP BO, Tableau ΠΈ Π΄Ρ€.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ: habr.com