ááœááºáá²á·áá±á¬á¡áá»áááºá¡áááºážáááºáá Big Data ááŸáá·áºá¡áá¯ááºáá¯ááºáááºá¡ááœáẠETL áááááá¬ááá¯ááœá±ážáá»ááºáááºáá±ážááœááºážááŸáá·áºáááºááá¯ááºáá±ááááºá ááááºá á¡áá¯á¶ážááŒá¯áá²á·ááá·áº Informatica BDM ááŒá±ááŸááºážáá»ááºááẠá¡ááá·áºá¡áááºááŸááá±á¬ áá¯ááºáá±á¬ááºááá¯ááºá áœááºážááŒá±á¬áá·áº áá»áœááºá¯ááºááá¯á·ááŸáá·áº áááá¯ááºáá®áá«á áááºážáá¡áá¯á¶ážááŒá¯ááŸá¯ááᯠspark-submit commands áá»á¬ážááœáá·áºáááºá¡ááœáẠáá°áá±á¬ááºáá áºáá¯ááá¯á· áá»áŸá±á¬á·áá»áá¬ážáááºá á¡ááŒá±áá¶á¡á¬ážááŒáá·áº áá»áœááºá¯ááºááá¯á·áá±á·á á¥áºáááºáá¶áá±ááá±á¬ áá±áá¬ááá¬áááŸáá·áº á¡áá¯ááºáá¯ááºááá¯ááºáá±á¬ á á»á±ážááœááºááœáẠanalogue á¡áá»á¬ážá¡ááŒá¬ážáááŸááá«á á¡áá¯á¶ážááŸá¬áá±á¬á· Ab Initio ááᯠááœá±ážáá»ááºáá²á·áá«áááºá á ááºážáááºááá¯ááºááŒááŸá¯áá»á¬ážá¡ááœááºáž áá¯ááºáá¯ááºááẠá¡ááœááºááŒáá·áºáá¬ážáá±á¬ áá±áá¬áá¯ááºáá±á¬ááºááŸá¯ááŒááºááŸá¯ááºážááᯠááŒááá²á·áááºá áá¯ááŸá¬ážáá¬áá¬ááŒáá·áº Ab Initio á¡ááŒá±á¬ááºáž á¡áá»ááºá¡áááºáá»á¬áž áá®ážáá«ážáááŸááá±á¬ááŒá±á¬áá·áº Habré ááœáẠáá»áœááºá¯ááºááá¯á·á á¡ááœá±á·á¡ááŒá¯á¶ááᯠááœá±ážááœá±ážááẠáá¯á¶ážááŒááºáá²á·áááºá
Ab Initio ááẠáááºážáááá¯ááºááá¯áẠPDL áá¬áá¬á áá¬ážááᯠá¡áá¯á¶ážááŒá¯á ááá¯ážáá»á²á·ááá¯ááºáá±á¬ ááá¹ááááºááŸáá·áº áá¯á¶ááŸááºááá¯ááºáá±á¬ á¡ááœááºááŒá±á¬ááºážááŸá¯áá»á¬áž áá»á¬ážá áœá¬ááŸááááºá áá¯ááºáááºážáááºáá áºáá¯á¡ááœááºá ááá¯áá²á·ááá¯á·áá±á¬ á¡á áœááºážáááºááá·áºáááááá¬ááẠá¡ááœááºá¡áá»áœá¶ááŒá áºááá¯ááºááœááºááŸáááŒá®áž áááºážáá áœááºážáá±á¬ááºáááºá¡áá»á¬ážá á¯ááẠá á»á±ážááŒá®ážááŒá®áž á¡áá¯á¶ážáááŒá¯áá±á¬á·áá±á áá«áá±ááá·áº áááºážáá²á·á áá±ážá Sberov áá²á· áá®ážáá±áááºááá¯ááẠAb Initio á áááºážá¡ááœáẠá áááºáááºá á¬ážá áá¬ááŒá áºááá¯ááºáá«áááºá
áááºážááẠáá¯ááºáááºážáá áºáá¯á¡á¬áž ááá¹áá¬áá áºááŸááºážááœáẠá¡ááááá¬á á¯áá±á¬ááºážáááºááŸáá·áº áá±áá áá áºáá áºáá¯ááᯠááœá¶á·ááŒáá¯ážááá¯ážáááºá á±ááẠáá°áá®áá±ážááá·áºá¡ááŒáẠdeveloper áá áºáŠážááẠETL ááœáẠáááºážááá»áœááºážáá»ááºááŸá¯áá»á¬ážááᯠááŒáŸáá·áºáááºáááºá Shell ááœáẠáá°áá¡ááááá¬ááᯠááŒáŸáá·áºáááºáááºá PDL áá¬áá¬á áá¬ážááᯠáá»áœááºážáá»ááºááá¯ááºááá¯ááºá á±ááẠá¡ááœáá·áºá¡áááºážááᯠáá¶á·ááá¯ážáá±ážáá¬á loading áá¯ááºáááºážá ááºáá»á¬ážá á¡ááŒááºá¡á¬áá¯á¶ááᯠáá±ážáá±á¬ááºáᬠááœá¶á·ááŒáá¯ážááá¯ážáááºááŸá¯ááᯠááá¯ážááŸááºážá á±áááºá functional components áá»á¬áž áá»á¬ážááŒá¬ážááŒááºážááŒá±á¬áá·áºá
á€ááá¯á·á áºááœáẠAb Initio áá áœááºážáááºáá»á¬ážá¡ááŒá±á¬ááºážááŒá±á¬ááŒá®áž Hive ááŸáá·áº GreenPlum ááŸáá·áº áááºážáá¡áá¯ááºá ááŸáá¯ááºážááŸá¥áºááœááºááŒááºááá¹ááá¬áá»á¬ážááᯠáá±á¬áºááŒáá±ážáá«áááºá
- MDW áá°áá±á¬ááºá áá±á¬áºááŒáá»ááºááŸáá·áº GreenPlum á¡ááœáẠáááºážá á áááºááŒáá¯ááºááŒááºáááºááŸá¯á¡áá±á«áº áá¯ááºáá±á¬ááºáá«á
- Hive ááŸáá·áº GreenPlum á¡ááŒá¬áž Ab Initio á áœááºážáá±á¬ááºááẠááŸáá¯ááºážááŸááºááŒááºážá
- á¡áá®ážááŸáá¡áá»áááºááŸáá·áºáááŒá±ážáá®áá¯ááºááœáẠGreenPlum ááŸáá·áº Ab Initio á¡áá¯ááºáá¯ááºááŒááºážá
á€áá¯ááºáá¯ááºá áá¯ááºáá±á¬ááºááá¯ááºá
áœááºážááẠá¡ááœááºáá»ááºááŒáá·áºááŒá®áž áá±á·áá¬ááẠá¡áá»áááºáá»á¬ážá
áœá¬ ááá¯á¡ááºáááºá ááá¯á·áá±á¬áºá ááá·áºáá»á±á¬áºáá±á¬á¡áá¯ááºáá»áœááºážáá»ááºááŸá¯ááŸáá·áº ááŸááºáááºáá±á¬á
áœááºážáá±á¬ááºáááºáááºáááºáá»á¬ážááŒáá·áº áá±áá¬áá¯ááºáá±á¬ááºááŒááºážáááááºáá»á¬ážááẠá¡ááœááºá¡áááºááŒá®ážá
áá¬áá±á¬ááºážáááºá áá±á¬á·ááºáá²áá±ážáá¬ážáá°á¡ááœáẠAb Initio ááá¯á¡áá¯á¶ážááŒá¯ááŒááºážááẠá
áááºáááºá
á¬ážá
áá¬áá±á¬ááºážááá·áºá¡ááœá±á·á¡ááŒá¯á¶ááᯠáá±ážá
áœááºážááá¯ááºáááºá áááºážááẠá¡ááŒááºá¡á¬áá¯á¶áááºáááºážáá»ááºááŸáá·áº áá¬ááºááœáŸááºážáá²á·ááá¯á·áá±á¬ áá¬áá¬á
áá¬ážááŒáá·áº áá±á«ááºážáá¯ááºááœá²ááŒááºážááŒá¬ážááœáẠáá±á«ááºážá
ááºáá¬ážáá±á¬ ETL ááœá¶á·ááŒáá¯ážááá¯ážáááºááŸá¯á¡ááœáẠáá¯ááºáá±á¬ááºááŸá¯á¡áá
áºááŒá
áºáááºá
á á®ážááœá¬ážáá±ážáá¯ááºáááºážáá»á¬ážááẠáááºážááá¯á·á áá±áá áá áºáá»á¬ážááᯠáá±á¬áºáá±á¬ááºáá±ááŒá®áž á€áááááá¬ááẠááááºáááẠááá¯ááá¯á¡áááºááŒá±áá¬áá«áááºá Ab Initio ááŒáá·áºá áááºááẠáááºááááºááŸááá¯ááºáááºážááŸáá·áºáááºáááºááá·áº ááá¯áá¯ááá»á¬ážááᯠá á¯áá±á¬ááºážááá¯ááºááŒá®áž áá¯ááºáááºážáá±á¬ááºážáá»á¬ážááŸáá·áº áá¯ááºáááºážáá áºáá»á¬ážááᯠáá»á²á·ááœááºááẠá€á¡ááááá¬ááᯠá¡áá¯á¶ážááŒá¯ááá¯ááºáá«áááºá Ab Initio á¡ááœáẠá¡ááŒá¬ážááœá±ážáá»ááºá áá¬áá»á¬ážááœáẠá¡ááŒááºá¡á¬áá¯á¶ááá¯ááºáᬠááœá¶á·ááŒáá¯ážááá¯ážáááºááŸá¯áááºáááºážáá»áẠInformatica BDM ááŸáá·áº Apache Spark ááá¯á·á á¡ááŒááºá¡á¬áá¯á¶ááá¯ááºáá±á¬ ááœá¶á·ááŒáá¯ážááá¯ážáááºááŸá¯áááºáááºážáá»ááºáá»á¬áž áá«áááºáááºá
Ab Initio á ááŸááºážáááºážáá»ááº
Ab Initio ááẠá¡ááŒá¬ážáá±á¬ ETL áááááá¬áá»á¬ážáá²á·ááá¯á·áááºá áá¯ááºáá¯ááºáá»á¬ážá á¡á á¯á¡áá±ážáá áºáá¯ááŒá áºáááºá
Ab Initio GDE (ááááºáá
áºááœá¶á·ááŒáá¯ážááá¯ážáááºááŸá¯áááºáááºážáá»ááº) ááẠáá±áá¬á¡ááœááºááŒá±á¬ááºážááŸá¯áá»á¬ážááᯠá
á®á
ááºááŒá®áž ááŒáŸá¬ážáá¯á¶á
á¶ááŒáá·áº áá±áá¬á
á®ážáááºážááŸá¯áá»á¬ážááŸáá·áº áá»áááºáááºáá±ážááá·áº áá±á¬á·ááºáá²á¡ááºáá»ááºáá®áá¬á¡ááœáẠáááºáááºážáá»ááºáá
áºáá¯ááŒá
áºáááºá á€ááá
á¹á
ááœááºá ááá¯ááá¯á·áá±á¬ á¡ááœááºáá°ážááŒá±á¬ááºážááŸá¯á¡á
á¯ááᯠááááºáᯠáá±á«áºáááº-
áá¯ááºáá±á¬ááºááá¯ááºáá±á¬ á¡á
áááºá¡ááá¯ááºážáá»á¬ážá á¡áááºááŸáá·áº á¡ááœááºáá»áááºáááºááŸá¯áá»á¬ážááẠááááºáááºážáá»á¬ážááŒá
áºááŒá®áž á¡ááœááºááŒá±á¬ááºážááŸá¯áá»á¬ážá¡ááœááºáž ááœááºáá»ááºáá¬ážáá±á¬ á¡ááœááºáá»á¬ážáá«ááŸááááºá áááºážááá¯á·ááá¯ááºáá±á¬ááºááŸá¯á¡á
á®á¡á
á¥áºá¡ááá¯ááºáž ááŒáŸá¬ážáá¯á¶á
á¶ááŒáá·áº á
á®ážáááºážááŸá¯áá»á¬ážááŒáá·áºáá»áááºáááºáá¬ážáá±á¬ ááááºá¡áá»á¬ážá¡ááŒá¬ážááᯠá¡á
á®á¡á
ááºáá
áºáá¯áá¯áá±á«áºáááºá
áá¬ááŸáá·áºáá»á®áá±á¬ functional components áá»á¬ážáá«ááŸáááŒá®ážá á¡ááœááºáá»á¬ážáá«áááºá áááºážááá¯á·áá²á០á¡áá»á¬ážá á¯ááŸá¬ á¡áá°ážáá»áœááºážáá»ááºááŒáááºá Ab Initio ááœáẠááá¹ááááºá¡ááœááºááŒá±á¬ááºážááŒááºážá á áœááºážáá±á¬ááºáááºáá»á¬ážááẠá¡ááŒá¬ážáá±á¬ ETL áááááá¬áá»á¬ážááẠááá¯ááá¯áá»ááºááŒáá·áºáá«áááºá á¥ááá¬á¡á¬ážááŒáá·áºá Join ááœáẠá¡ááœááºáá»á¬ážá áœá¬ááŸááááºá áá±áá¬á¡ááœá²áá»á¬ážááᯠáá»áááºáááºááŒááºážá ááááºá¡ááŒááºá áá±á¬á·áá»á¬ážááᯠáá»áááºáááºááááá±á¬ input dataset áá»á¬ážá á¡ááœááºááŸááºáááºážáá»á¬ážááᯠáááºáááá¯ááºáááºá ááŒááºážáááºááŸá¯áá»á¬ážá á¡ááŸá¬ážá¡ááœááºážáá»á¬ážááŸáá·áº á á¬áá¬ážááá¯ááºáá áºáá¯áá²á·ááá¯á· áá°áá®áá±á¬áá±á¬áºáá¶ááœáẠáááºááá¯ááºááŒá®áž á¡ááŒá¬ážá¡ááœááºááŒá±á¬ááºážááŸá¯áá»á¬ážááŒáá·áº áá¯ááºáá±á¬ááºááá¯ááºááá·áº á¡ááœááºááŒá±á¬ááºážááŒááºážááá¯ááºáᬠááŸááºáááºážááá¯áááºáž áááºáááá¯ááºáááº-
ááá¯á·ááá¯áẠá¥ááá¬á¡á¬ážááŒáá·áºá áááºááẠááá¬ážáá
áºáá¯ááá¯á¶á
á¶ááŒáá·áº áá±áá¬áááºáá¶áá°á¡á¬áž áá¯ááºáá¯á¶ážáá±á«áºáá¬á
á±ááŒá®áž áááºážááŸáá±áá¬ááᯠáá°áá®áá±á¬áá±á¬áºáá¶ááœáẠáááºááá¯ááºáááºá
áá°áá¡ááœááºááŒá±á¬ááºážáá¬ááœá±ááŸááááºá á¥ááá¬á¡á¬ážááŒáá·áºá Scan á¡ááœááºááŒá±á¬ááºážááŒááºážááœáẠááœá²ááŒááºážá áááºááŒá¬ááá·áºáá¯ááºáá±á¬ááºáá»ááºáá»á¬ážááŸáá·áº áááºáá°ááá·áº áá¯ááºáá±á¬ááºááá¯ááºá áœááºážááŸááááºá ááá¯ááºááá¯ááºááŸááºážááŒáá±á¬á¡áááºáá»á¬ážááŒáá·áº á¡ááœááºááŒá±á¬ááºážááŸá¯áá»á¬ážááŸááááº- áá±áá¬áááºáá®ážáá«á Excel ááá¯áááºáá«á áá¯á¶ááŸááºááŒá¯áá¯ááºáá«á á¡á¯ááºá á¯áá»á¬ážá¡ááœááºáž á á®áááºá áááá¯ááááºááá¯ááœáá·áºáá«á SQL ááá¯ááœáá·áºáá«á DB ááŸáá·áº áá»áááºáááºáá« á áááºááŒáá·áº á¡ááŒá±á¬ááºážá¡áá²áá»á¬ážááŸááá«áááºá ááááºááºáá»á¬ážááẠááá·áºáááºáá±á¬ááºáá»á¬ážá០ááá¯á·ááá¯áẠááŒááºááœá¬ážááá¯ááºááá·áº ááŒá áºááá¯ááºááŒá±á¡áá«á¡áááºá áááºáááºááŸá¯á áá áºá ááááºááá¯á· ááŒááºááœá¬ážááá·áº á¡áááºááá·áºáá¯ááºáá¬ážáá±á¬ ááá·áºáááºáá±á¬ááºáá«ááŸáááá·áº ááá¯ááºáá»á¬ážááᯠáá«áá¬áá®áá¬á¡á á¯á¶áá»á¬áž (psets) áá¯áá±á«áºáááºá
áá»áŸá±á¬áºááá·áºáá¬ážááá·áºá¡ááá¯ááºážá Ab Initio GDE ááœáẠEME (Enterprise Meta Environment) áá¯áá±á«áºáá±á¬ áááºážáááá¯ááºááá¯ááºááá¯ááŸá±á¬ááºááŸá¯ááŸááááºá áá±á¬á·ááºáá²áá±ážáá¬ážáá°áá»á¬ážááẠáá±ááá¹áááá¯ááºáá¬ážááŸááºážáá»á¬ážááŸáá·áº á¡áá¯ááºáá¯ááºááá¯ááºááŒá®áž áááºážááá¯á·áááá¯ážáááºááŸá¯áá»á¬ážááᯠáááá¯ááá¯ááŸá±á¬ááºáááºážááá¯á· á á áºáá±ážááẠá¡ááœáá·áºá¡áá±ážááŸááááºá
ááœááºáá»ááºá ááºá¡ááœááºáž ááá¯á·ááá¯áẠááááºááᯠá¡áá±á¬ááºá¡áááºáá±á¬áºááŒá®ážáá±á¬ááºá á¡ááœááºááŒá±á¬ááºážááŒááºážááᯠáá»áááºáááºááá·áº áááºááá·áºá¡á á®ážááŒá±á¬ááºážááá¯áááᯠááá áºááŸáááºááŒá®áž á€á¡ááœááºááŒá±á¬ááºážááŸá¯áá»á¬ážááŒá¬ážááŸááŒááºáááºážááœá¬ážáá±á¬áá±áá¬ááᯠááŒáá·áºááŸá¯ááẠááŒá áºááá¯ááºáááº-
áááºááá·áº stream ááá¯áááᯠááá
áºááŸáááºá ááŒá±áá¬áá¶á¡áá±ážá
áááºá¡áá»ááºá¡áááºáá»á¬ážááᯠááŒáá·áºááŸá¯ááá¯ááºááẠ- á¡ááœááºááŒá±á¬ááºážááŒááºážááœáẠá¡ááŒáá¯ááºáááºáá»áŸáá¯ááºáá±á¬ááºáá²á·áááºá áááºááá·áºáá»ááºážáá»á¬ážááŸáá·áº ááá¯ááºáá»á¬ážááᯠáá»ááºážááŒáá¯ááºáá»á¬ážááœáẠáááºáá¬ážáááº-
ááááºááá¯ááºáá±á¬ááºááŸá¯ááᯠá¡ááá·áºáá»á¬ážá¡ááŒá
Ạááá¯ááºážááŒá¬ážááŒá®áž á¡áá»áá¯á·áá±á¬ á¡ááœááºáá°ážááŒá±á¬ááºážááŸá¯áá»á¬ážááᯠáááá¡ááá·áº (áá¯áá¡ááá·áºááœááº)á áááá¡ááá·áºááŸá áá±á¬ááºáá
áºáá¯á áá¯áááá¡ááá·áºááœáẠáá±á¬ááºáá
áºáᯠá
áááºááá¯á·ááᯠáá¯ááºáá±á¬ááºááẠááá¯á¡ááºááŒá±á¬ááºáž á¡ááŸááºá¡áá¬ážááŒá¯ááá¯ááºáááºá
á¡ááœááºááŒá±á¬ááºážááŸá¯áá áºáá¯á á®á¡ááœááºá layout áá¯áá±á«áºáá±á¬ (áááºážááá¯áá¯ááºáá±á¬ááºááá·áºáá±áá¬ááœááº) ááá¯ááœá±ážáá»ááºááá¯ááºáááº- áá»ááºážááŒáá¯ááºáá»á¬áž ááá¯á·ááá¯áẠá¡ááŒáá¯ááºá¡áááºáá»á¬ážááá«áá²á áááºááŸááºááá¯ááºááá·áºá¡áá±á¡ááœááºááᯠáááºááŸááºááá¯ááºáááºá áá áºáá»áááºáááºážááŸá¬áááºá á¡ááœááºááŒá±á¬ááºážááŸá¯áá»á¬áž áá¯ááºáá±á¬ááºáá±áá»áááºááœáẠAb Initio áááºáá®ážááá·áº áá¬áá®ááá¯ááºáá»á¬ážááᯠáá¬áá¬ááá¯ááºá áá áºááœááºáááºážáá±á¬ááºážá HDFS ááœááºáááºážáá±á¬ááºáž áá¬ážááŸáááá¯ááºáá«áááºá
á¡ááœááºááŒá±á¬ááºážááŸá¯áá áºáá¯á á®ááœááºá áá¯á¶áá±áá¯á¶á á¶áááááºááá¯á¡ááŒá±áá¶á á¡ááœá¶áá²á·ááá¯á·á¡áááºážáááºáá±á¬ PDL ááœáẠááá·áºááá¯ááºááá¯áẠscript ááá¯áááºáá®ážááá¯ááºáááºá
PDL ááŒáá·áº áááºááẠá¡ááœááºááŒá±á¬ááºážááŒááºážá áá¯ááºáá±á¬ááºááá¯ááºá áœááºážááᯠááá¯ážáá»á²á·ááá¯ááºááŒá®áž á¡áá°ážáááŒáá·áºá áááºááẠruntime parameters áá»á¬ážáá±á«áºáá°áááºá ááááºáááᯠáá¯ááºá¡ááá¯ááºážá¡á áá»á¬áž áá¯ááºáá±ážááá¯ááºáááºá
Ab Initio ááẠshell ááŸáááá·áº OS ááŸáá·áº áá±á¬ááºážááœááºá áœá¬ áá±á«ááºážá ááºááœá²á·á ááºážáá¬ážáá«áááºá á¡áá°ážáááŒáá·áºá Sberbank ááẠlinux ksh ááá¯á¡áá¯á¶ážááŒá¯áááºá áááºááẠááááºážááŸááºáá»á¬ážááᯠshell ááŸáá·áº áá²ááŸááºááá¯ááºááŒá®áž áááºážááá¯á·á¡á¬áž ááááºáá±á¬ááºáá»á¬ážá¡ááŒá Ạá¡áá¯á¶ážááŒá¯ááá¯ááºáááºá Shell á០Ab Initio ááááºáá»á¬ážááᯠá¡áá±á¬ááºá¡áááºáá±á¬áºááŒááºážá¡á¬áž áááºáá±á«áºááá¯ááá¯ááºááŒá®áž Ab Initio ááᯠá á®áá¶ááœááºáá²ááá¯ááºáááºá
Ab Initio GDE á¡ááŒááºá á¡ááŒá¬ážáá¯ááºáá¯ááºáá»á¬ážá áœá¬ááᯠááá¯á·áá±á¬ááºááŸá¯ááœáẠááá·áºááœááºážáá¬ážáááºá áááºáááºááŸá¯á áá áºáᯠáá±á«áºááá¯ááá·áº áá±á¬ááºážááá¯áá»ááºááŒáá·áº áááºážáááá¯ááºááá¯áẠCo>Operation System ááŸááááºá áááºááẠáá±á«ááºážáá¯ááºá á®ážáááºážááŸá¯áá»á¬ážááᯠá¡áá»áááºááá¬ážááœá²áᬠá á±á¬áá·áºááŒáá·áºááá¯ááºáá±á¬ ááááºážáá»á¯ááºááŸá¯>á ááºáá¬áá áºáᯠááŸááá«áááºá Ab Initio GDE ááœáá·áºááŒá¯áááºááẠááá¯ááá¯á¡ááŒá±áá¶á¡ááá·áºááœáẠááœá¶á·ááŒáá¯ážááá¯ážáááºááŸá¯áá¯ááºáá±á¬ááºááẠáá¯ááºáá¯ááºáá»á¬ážááŸááá«áááºá
MDW áá°áá±á¬ááºá áá±á¬áºááŒáá»ááºááŸáá·áº GreenPlum á¡ááœáẠáááºážá á áááºááŒáá¯ááºááŒááºáááºááŸá¯á¡áá±á«áº áá¯ááºáá±á¬ááºáá«á
áááºážááá¯ááºáá¯ááºáá»á¬ážááŸáá·áºá¡áá°á áá±á¬ááºážáá»áá°ááẠáá±áá¬ááá¯ááŸá±á¬ááºáá¯á¶áá»á¬áž ááá¯á·ááá¯áẠáá±áá¬ááá¯ááŸá±á¬ááºáááºážáá»á¬ážááᯠáá°áá±áá°áááºá á±ááá·áº áá¯á¶ááŸááºá¡áá¯ááºáá»á¬ážááá¯áá°áá®ááẠáá®ááá¯ááºážáá¯ááºáá¬ážáá±á¬ ááááºáá¯á¶á á¶ááœá²á·á ááºážááŸá¯áá áºáá¯ááŒá áºááá·áº MDW (Metadata Driven Warehouse) áá¯ááºáá¯ááºááᯠáá¶á·ááá¯ážáá±ážáá«áááºá
áááºážááœáẠá áááºááŒáá¯áẠ(ááá±á¬áá»ááºá¡ááá¯ááº) áááºáá¬áá±áᬠááœá²ááŒááºážá áááºááŒá¬áá°áá»á¬ážááŸáá·áº á¡áááºááá·áºáá¯ááºáá¬ážáá±á¬ áá¯ááºáá¯ááºáá±ážááá·áº á ááºáá»á¬áž áá«ááŸááááºá
ááá·áºááœááºážááŸá¯á¡áá±ááŒáá·áº MDW ááẠáá±áá¬áá±á¬áºáááºáá
áºáá¯á áá±áá¬áá±á·á
Ạ(Oracleá Teradata ááá¯á·ááá¯áẠHive) ááŸáá·áº á¡ááŒá¬ážáááºáááºá¡áá»áá¯á·ááá¯á· áá»áááºáááºááŸá¯áá
áºáá¯á¡á¬áž á
áá
áºááá·áºááœááºážáááºá¡ááœáẠááœá²á·á
ááºážááŸá¯áá¯á¶á
á¶ááá¯ááºááᯠáááºáá¶áááŸááá«áááºá á¥ááá¬á¡á¬ážááŒáá·áº ááá±á¬áá»ááºááá¯ááºáᬠá¡ááá¯ááºážááẠáá±á¬áºáááºááᯠáá±áá¬áá±á·á
áºáá
áºáá¯ááá¯á· ááŒáá·áºáá»ááºáá¬ážáááºá áá¯ááºáá¯ááºá ááœááºáááºááá¯ááºáá±á¬ á¡á
áááºá¡ááá¯ááºážááẠáá±á¬áºáááºááá¬ážáá»á¬ážááœáẠá¡áá»ááºá¡áááºáá»á¬ážááᯠáááºááŒááºážááŒáá·áº áááºážááá¯á·á¡ááœáẠááááºáá
áºáá»á¬ážááŸáá·áº ááœá²á·á
ááºážááŸá¯ááá¯ááºáá»á¬ážááᯠáá¯ááºáá±ážáá«áááºá á€ááá
á¹á
ááœááºá ááááºáá
áºáá»á¬áž (ááŸáá·áº psets) áá»á¬ážááẠá¡áá¬ááá¹áá¯áá»á¬ážááᯠá¡ááºááááºáá¯ááºááŒááºážááœáẠáááŠážá
áááºááŒááºážááŸáá·áº ááá¯ážááŒáá·áºáá¯ááºáá±á¬ááºááŸá¯áá¯á¶á
á¶áá»á¬ážá
áœá¬á¡ááœáẠáááºáá®ážáá¬ážáááºá
Hive ááŸáá·áº RDBMS ááá á¹á áá»á¬ážááœáẠáááŠážá áááºááŒááºážááŸáá·áº áá±áá¬ááœááºážáá¶ááŸá¯áá»á¬ážá¡ááœáẠááá°áá®áá±á¬ááááºáá»á¬ážááᯠáá¯ááºáá±ážáá«áááºá
Hive ááœááºá á¡áááºááŒá áºááá»áœááºážáá±á«áºáá±áá¬ááᯠAb Initio Join ááŸáá áºááá·áº á¡ááºááááºááá¯ááºáá® ááá¬ážááŸááá±áá¬ááŸáá·áº áá»áááºáááºáá¬ážáááºá MDW ááŸá áá±áá¬áááºáá°áá»á¬áž (Hive ááŸáá·áº RDBMS ááŸá áºáá¯áá¯á¶áž) ááẠááŒá áºááá»áœááºážáá±á«áºáá±áá០áá±áá¬á¡áá áºáá»á¬ážááᯠááá·áºááœááºážáá¯á¶áá¬ááá á¡ááááá±á¬á·áá»á¬ážááᯠááŒá áºááá»áœááºážáá±á«áºáá±áá០áááºáá¶áááŸáááá·áº áá±áá¬á áááºá ááºááŸá¯á¡áá»áááºáá»á¬ážááá¯áá« ááááºáá«áááºá ááá¯á·á¡ááŒááºá áááºááẠdata ááááŒá±á¬ááºážáá²áá±á¬á¡á áááºá¡ááá¯ááºážááá¯ááŒááºáááºáá±ážáá¬ážáááºááŸááááºá ááá¯á·áá±á¬áº Hive ááœáẠáá»ááºááẠááá¯á·ááá¯áẠá¡ááºááááºáá¯ááºáá±á¬ááºááŸá¯áá»á¬áž áááŸááá±á¬ááŒá±á¬áá·áº áááºážááᯠáá¯ááºáá±á¬ááºááááºááŒá áºáááºá
RDBMS ááœááºá ááá¯ážááŒáá·áºáá±áá¬ááœááºážáá¶ááŒááºážá¡ááœáẠááááºáá
áºáá»á¬ážááẠRDBMS ááœáẠá¡ááŸááºáááẠááœááºážáá¶ááá¯ááºá
áœááºážááŸááá±á¬ááŒá±á¬áá·áºááŒá
áºáááºá
áááºáá¶áááŸááá±á¬ ááŒá
áºááá»áœááºážáá±á«áºáá±áááᯠáá±áá¬áá±á·á
áºááŸá á¡áááºá¡áááºááá¬ážáá
áºáá¯ááá¯á· áááºáá¬ážáááºá áááºážáá±á¬ááºá á¡ááºááááºááá¯ááºáá® ááá¬ážááŸá áá±áá¬ááŸáá·áº ááŒá
áºááá»áœááºážáá±á«áºááᯠáá»áááºáááºáá¬ážáááºá áááºážááá¯áá¯ááºáá¯ááºáá¬ážáá±á¬ SQL query ááá¯á¡áá¯á¶ážááŒá¯á SQL ááá¯á¡áá¯á¶ážááŒá¯ááŒá®ážááŒá¯áá¯ááºáááºá ááá¯á·áá±á¬ááºá SQL commands áá»á¬ážááᯠdelete+insert áá¯á¶ážááŒá®ážá ááŒá
áºááá»áœááºážáá±á«áºááŸáá±áá¬á¡áá
áºáá»á¬ážááᯠáá
áºááŸááºááá¬ážáá²ááá¯á· ááá·áºááœááºážááŒá®áž á¡ááááá±á¬á·áá»á¬ážááᯠdelta ááŸáááºáá¶áááŸááá±á¬ áá±áá¬ááááºá
ááºááŸá¯á¡áá»áááºáá¬ááá»á¬ážá
áááŒá±á¬ááºážáá²áá±á¬áá±áá¬ááᯠááŒááºáááºáá±ážáá¬ážááẠáááá¯á¡ááºáá«á
ááá¯á·ááŒá±á¬áá·áº Hive ááá á¹á ááœáẠHive ááœáẠá¡ááºááááºáá¯ááºáá±á¬ááºáá»ááºáááŸááá±á¬ááŒá±á¬áá·áº MDW ááẠááá¬ážáá áºáá¯áá¯á¶ážááᯠááŒááºáááºáá±ážáá¬ážááááºáᯠáá»áœááºá¯ááºááá¯á· áááá¯á¶ážáá»á¯ááºáá¬áá«áááºá ááœááºážáá¶ááŒááºáááºááŒá®ážáá±á¬á¡áá« áá±áá¬ááᯠáá¯á¶ážáá¯á¶ážáá»á¬ážáá»á¬áž ááŒááºáá±ážááŒááºážááẠááá¯áá±á¬ááºážáá±á¬á¡áá¬áááŸááá«á RDBMS áááŒá áºáááºááœááºá ááá·áºáá»ááºáááºá¡áá±ááŸáá·áºá áá¯ááºáá¯ááºáááºáá®ážáá°áá»á¬ážááẠSQL ááá¯á¡áá¯á¶ážááŒá¯áááºá¡ááœáẠáá»áááºáááºááŸá¯ááŸáá·áº ááá¬ážáá»á¬ážááᯠá¡ááá·áºááŒáŸáá·áºáááºááŒááºážá¡á¬áž á¡ááºááŸááºážááẠááá¯á¡ááºááŒá±á¬ááºáž ááœá±á·ááŸááá²á·áááºá
Sberbank ááŸá ááá±á¬áá»ááºáá áºáá¯á¡ááœááºá GreenPlum á¡ááœáẠáá±áá¬áá±á·á áºáááºááá·áºáááááá¬ááᯠááŒááºáááºá¡áá¯á¶ážááŒá¯ááá¯ááºááá·áº á¡áá±á¬ááºá¡áááºáá±á¬áºááŸá¯á¡áá áºáá áºáá¯ááᯠáááºáá®ážáá²á·áááºá áááºážááẠTeradata á¡ááœáẠMDW áá¯ááºáá±ážááá·áº áá¬ážááŸááºážá¡áá±á«áºá¡ááŒá±áá¶á áá¯ááºáá±á¬ááºáá²á·ááŒááºážááŒá áºáááºá á¡á²áá«á Teradata ááá¯ááºáá² Oracle ááá¯ááºáá²á á¡á²áá«á¡ááœáẠá¡áá®ážá ááºáá¯á¶ážáá²á· á¡áá±á¬ááºážáá¯á¶ážááŒá áºáá¬áá¬ááá¯á·... MPP á áá áºáááºáž ááŒá áºáá«áááºá Teradata ááŸáá·áº GreenPlum ááá¯á·á áá¯ááºáá±á¬ááºááŸá¯áááºážáááºážáá»á¬ážá¡ááŒáẠsyntax áááºáááºáž á¡áá¬ážáá°ááŒá áºáá²á·áááºá
ááá°áá®áá±á¬ RDBMS áá»á¬ážááŒá¬ážááœáẠMDW-á¡áá±ážáá«áá±á¬ ááœá¬ááŒá¬ážáá»ááºáá»á¬áž á¥ááá¬áá»á¬ážááŸá¬ á¡á±á¬ááºáá«á¡ááá¯ááºážááŒá áºáááºá GreenPlum ááœáẠTeradata ááŸáá·áºááá°áá²á ááá¬ážáá»á¬ážáááºáá®ážáá±á¬á¡áá«ááœááºáááºá á¬ááá¯ááºáá áºáá¯áá±ážáááºááá¯á¡ááºáááºá
distributed by
Teradata ááá±ážáá¬ážáá²á·áááº
delete <table> all
ááŒá®ážáá±á¬á· GreenPlum ááŸá¬ áá°ááá¯á·áá±ážáááºá
delete from <table>
Oracle ááœáẠááá¯ááá¯áá±á¬ááºážááœááºá¡á±á¬ááºááŒá¯áá¯ááºááẠáááºááœááºáá»ááºáá»á¬ážááŒáá·áº áá±ážáá¬ážááŒáááºá
delete from t where rowid in (<ÑПеЎОМеМОе t Ñ ÐŽÐµÐ»ÑÑПй>)
ááŸáá·áº Teradata ááŸáá·áº GreenPlum ááá¯á·ááᯠáá±ážáá¬ážáá«á
delete from t where exists (select * from delta where delta.pk=t.pk)
Ab Initio ááẠGreenPlum ááŸáá·áº á¡áá¯ááºáá¯ááºáááºá¡ááœááºá Ab Initio á¡á á¯á¡áá±ážá node á¡á¬ážáá¯á¶ážááœáẠGreenPlum client ááᯠááá·áºááœááºážááẠááá¯á¡ááºááŒá±á¬ááºážááá¯áááºáž áá»áœááºá¯ááºááá¯á· áááááŒá¯áá«á á¡áááºááŒá±á¬áá·áºááá¯áá±á¬áº áá»áœááºá¯ááºááá¯á·ááẠáá»áœááºá¯ááºááá¯á·á á¡á á¯á¡áá±ážááŸá node á¡á¬ážáá¯á¶ážá០GreenPlum ááŸáá·áº áááŒáá¯ááºááẠáá»áááºáááºáá¬ážáá±á¬ááŒá±á¬áá·áº ááŒá áºáá«áááºá GreenPlum á០á á¬áááºááŒááºážááᯠá¡ááŒáá¯ááºááŒá áºá á±áááºááŸáá·áº á¡ááŒáá¯áẠAb Initio thread áá áºáá¯á á®ááẠGreenPlum á០áááºážáááá¯ááºááá¯ááºá¡ááá¯ááºážááá¯áááºáááºá¡ááœááºá SQL queries á "where" á¡ááá¯ááºážááœáẠAb Initio áá¬ážáááºáá±á¬ áááºáá±á¬ááºááŸá¯áá áºáá¯ááᯠáá¬ážááŸáááááºááŒá áºáá«áááºá
where ABLOCAL()
á¡ááœááºááŒá±á¬ááºážáá±áá¬áá±á·á áºá០áá«áá¬áá®áá¬áááºááŸá¯ááŒááºážá¡á¬áž áááºááŸááºááŒááºážááŒáá·áº á€áááºáá±á¬ááºááŸá¯áááºááá¯ážááᯠáá¯á¶ážááŒááºáá«á
ablocal_expr=«string_concat("mod(t.", string_filter_out("{$TABLE_KEY}","{}"), ",", (decimal(3))(number_of_partitions()),")=", (decimal(3))(this_partition()))»
ááŒáá¯ááºáá²á·á¡áá¬áá áºáá¯áá¯ááᯠá á¯á ááºážáá¬ážáá²á·á
mod(sk,10)=3
, i.e. partition áá áºáá¯á á®á¡ááœáẠáááá»áá±áá»á¬áá±á¬ filter áá áºáá¯ááŒáá·áº GreenPlum ááᯠáááºáá±á¬ááºážááá¯ááá«áááºá á¡ááŒá¬ážáá±áá¬áá±á·á áºáá»á¬áž (Teradataá Oracle) á¡ááœáẠAb Initio ááẠá€áá»ááºážááŒáá¯ááºááᯠá¡ááá¯á¡áá»á±á¬ááºáá¯ááºáá±á¬ááºááá¯ááºáááºá
Hive ááŸáá·áº GreenPlum á¡ááŒá¬áž Ab Initio á áœááºážáá±á¬ááºááẠááŸáá¯ááºážááŸááºááŒááºážá
Sberbank ááẠHive ááŸáá·áº GreenPlum ááŸáá·áºáááºá ááºáá±á¬ MDW ááŸáá¯ááºáá¯ááºáá¬ážáá±á¬ááááºáá»á¬ážáá áœááºážáá±á¬ááºáááºááá¯ááŸáá¯ááºážááŸááºáááºá ááºážáááºááŸá¯áá áºáá¯ááŒá¯áá¯ááºáá²á·áááºá á ááºážáááºááŸá¯ááá áºá áááºáá áºááá¯ááºážá¡áá±ááŒáá·áº Hive áááŒá áºáááºááœáẠAb Initio áá²á·ááá¯á·áá°áá®áá±á¬á¡á á¯á¡áá±ážááœáẠnode 5 áá¯ááŸáááŒá®áž GreenPlum ááœáẠáá®ážááŒá¬ážá¡á á¯á¡áá±ážáá áºáá¯ááœáẠnode 4 áá¯ááŸááááºá á¡á²áá«ááœá±á Hive ááẠGreenPlum ááẠhardware á¡á¬ážáá¬áá»ááºá¡áá»áá¯á·ááŸááááºá
Hive ááŸáá·áº GreenPlum ááá¯á·ááœáẠáá±áá¬ááœááºážáá¶ááŒááºážá¡ááœáẠáá°áá®áá±á¬áá¬áááºááᯠáá¯ááºáá±á¬ááºáá±ááá·áº ááááºá¡ááœá²ááŸá áºáá¯ááᯠáá»áœááºá¯ááºááá¯á· áá¯á¶ážáááºáá¬ážáá«áááºá áá áºáá»áááºáááºážááœáẠMDW configuration ááŸáá¯ááºáá±ážáá±á¬ááááºáá»á¬ážááᯠá áááºáá²á·áááº-
- Hive ááá¬ážááá¯á· áá»áááºážáá¯ááºáá±ážáá±á¬ áá±áá¬á áááŠážááẠ+ ááá¯ážááŒáá·áºáááº
- áá°áá®áá±á¬ GreenPlum ááá¬ážááá¯á· áá»áááºážáá¯ááºáá±ážáá±á¬áá±áá¬á áááŠážááẠ+ ááá¯ážááŒáŸááºáááº
ááŒá áºáááºááŸá áºáá¯á áá¯á¶ážááœáẠ(Hive ááŸáá·áº GreenPlum) ááẠáá°áá®áá±á¬ Ab Initio á¡á á¯á¡áá±ážááœáẠá¡ááºáá¯ááºáá»á¬ážááᯠá¡ááŒáá¯áẠ10 áá¯á¡áá áá¯ááºáá±á¬ááºáá±ážáááºá Ab Initio ááẠHDFS ááœáẠááœááºáá»ááºááŸá¯áá»á¬ážá¡ááœáẠá¡áááºá¡áááºáá±áá¬ááᯠááááºážáááºážáá²á·ááẠ(Ab Initio áááºááŸááºáá»ááºá¡áá HDFS ááᯠá¡áá¯á¶ážááŒá¯áá¬ážáá±á¬ MFS á¡ááŒááºá¡áááºááᯠá¡áá¯á¶ážááŒá¯áá¬ážáááº)á áá»áááºážáá¯ááºáá±ážáá±á¬áá±áá¬ááá¯ááºážáá áºáá¯ááẠá¡ááŸá¯ááŸá áºáá¯áá¯á¶ážááœáẠ200 bytes ááááºážááá¯ááºáá¬ážáááºá
ááááºááŸá¬ á€áá²á·ááá¯á·ááŒá áºáááº-
á¡á¯á¶
Hive ááœáẠáááŠážááœáá·áºááŒááºážá
á¡áááºážáá»á¬áž ááá·áºááœááºážáá¬ážáááºá
6 000 000
60 000 000
600 000 000
á
áááºááŒááºáž ááŒá¬áá»áááº
á
áá¹ááá·áºááá¯ááºážá¡ááœááºáž áá±á«ááºážáá¯ááºáá¯ááºáá«á
41
203
1 601
Hive ááœáẠááá¯ážááŒáá·áºáááºáá±ážáááºá
áááá¯ááºáá±á¬á¡áááºážá¡áá±á¡ááœááº
á
ááºážáááºááŸá¯á¡á
ááœáẠáá
áºááŸááºááá¬áž
6 000 000
60 000 000
600 000 000
áá¯á¶ážáá¬ážáá±á¬ ááŒá
áºááá»áœááºážáá±á«áºááá¯ááºáž á¡áá±á¡ááœááº
á
ááºážáááºááŸá¯á¡ááœááºáž áá
áºááŸááºááá¬áž
6 000 000
6 000 000
6 000 000
ááá¯ážááŸá¯ááºážáááŒá¬áá»áááº
á
áá¹ááá·áºááá¯ááºážá¡ááœááºáž áá±á«ááºážáá¯ááºáá¯ááºáá«á
88
299
2 541
GreenPlum
GreenPlum ááœáẠáááŠážá áááºááŒááºáž
á¡áááºážáá»á¬áž ááá·áºááœááºážáá¬ážáááºá
6 000 000
60 000 000
600 000 000
á
áááºááŒááºáž ááŒá¬áá»áááº
á
áá¹ááá·áºááá¯ááºážá¡ááœááºáž áá±á«ááºážáá¯ááºáá¯ááºáá«á
72
360
3 631
GreenPlum ááœáẠááá¯ážááŒáŸáá·áºáááºááŒááºážá
áááá¯ááºáá±á¬á¡áááºážá¡áá±á¡ááœááº
á
ááºážáááºááŸá¯á¡á
ááœáẠáá
áºááŸááºááá¬áž
6 000 000
60 000 000
600 000 000
áá¯á¶ážáá¬ážáá±á¬ ááŒá
áºááá»áœááºážáá±á«áºááá¯ááºáž á¡áá±á¡ááœááº
á
ááºážáááºááŸá¯á¡ááœááºáž áá
áºááŸááºááá¬áž
6 000 000
6 000 000
6 000 000
ááá¯ážááŸá¯ááºážáááŒá¬áá»áááº
á
áá¹ááá·áºááá¯ááºážá¡ááœááºáž áá±á«ááºážáá¯ááºáá¯ááºáá«á
159
199
321
Hive ááŸáá·áº GreenPlum ááŸá áºáá¯áá¯á¶ážááœáẠáááŠáž loading áá¡ááŒááºááŸá¯ááºážááẠdata ááá¬ááá±á«áºáá°áááºááŒá®áž ááá¯ááá¯áá±á¬ááºážááœááºáá±á¬ hardware ááŒá±á¬áá·áº GreenPlum ááẠá¡áááºážáááºááá¯áááŒááºááŒá±á¬ááºáž áá»áœááºá¯ááºááá¯á·ááŒááºááá«áááºá
Hive ááœáẠááá¯ážááŒáŸááºáááºááŒááºážááẠáá áºááŸááºááá¬ážááŸá ááááºáááºáá¬ážáá±á¬áá±áá¬á ááá¬áá¡áá±á«áºááœáẠáá°áááºááŒá®áž ááá¬áááá¯ážáá¬áááºááŸáá·áºá¡áá»áŸ ááŸá±ážááœá±ážá áœá¬ áááºáááºáá¯ááºáá±á¬ááºáá«áááºá áááºážááẠáá áºááŸááºááá¬ážááᯠáá¯á¶ážáá¯á¶ážáá»á¬ážáá»á¬áž ááŒááºáá±ážááẠááá¯á¡ááºááŒááºážááŒá±á¬áá·áº ááŒá áºáá±á«áºáá¬ááŒááºážááŒá áºáááºá ááá¯ááá¯áááºááŸá¬ ááŒá®ážáá¬ážáá±á¬ ááá¬ážáá»á¬ážáá®ááá¯á· áá±ážáááºáá±á¬ á¡ááŒá±á¬ááºážá¡áá²áá»á¬ážááᯠá¡áá¯á¶ážáá»ááŒááºážááẠHive á¡ááœáẠáá±á¬ááºážááœááºáá±á¬ á¡áá¯á¶ážááŒá¯ááŸá¯ááá á¹á ááá¯ááºááŒá±á¬ááºáž ááá¯ááá¯áááºá
GreenPlum ááœáẠááá¯ážááŒáŸááºáááºááŒááºážááẠáá áºááŸááºááá¬ážááŸá ááááºáááºáá¬ážáá±á¬áá±áá¬ááá¬ááá±á«áºááœááºáá°áááºááŒá®áž áá»áŸááºááŒááºá áœá¬áááºáááºáá¯ááºáá±á¬ááºáá«áááºá áá»ááºáá áºááŒááºážááᯠááœáá·áºááŒá¯áá±ážáá±á¬ SQL Joins ááŸáá·áº GreenPlum áááá¯áá¬ááá¯á·ááŒá±á¬áá·áº á€áááºááŸá¬ ááŒá áºáá»ááºáá²á·áá«áááºá
ááá¯á·ááŒá±á¬áá·áºá GreenPlum ááẠdelete+insert áááºážáááºážááᯠá¡áá¯á¶ážááŒá¯á ááŒá áºááá»áœááºážáá±á«áºáá±áááᯠáá±á«ááºážááá·áºáá±á¬áºáááºáž Hive ááœáẠáá»ááºáá áºááŒááºáž ááá¯á·ááá¯áẠá¡ááºááááºáá¯ááºáá±á¬ááºááŸá¯áá»á¬áž ááá«ááŸááá±á¬ááŒá±á¬áá·áº áá±áᬠarray áá áºáá¯áá¯á¶ážááᯠááá¯ážááŒáá·áºááœááºážáá¶ááŸá¯áá áºáá¯á¡ááœááºáž áá¯á¶ážáá¯á¶ážáá»á¬ážáá»á¬áž ááŒááºáááºáá±ážáá¬ážááá¯ááºážá á±áá²á·áááºá á¡áááºážá¡ááŒá áº-á¡áá±ážáá±ážáá±á¬ áá±á«ááºážáá¯ááºáá»á¬ážááᯠá¡áá¯á¶ážááŒá¯ááŒááºážá¡ááœáẠá¡áá¯á¶ážá¡áá»á¬ážáá¯á¶áž ááœá±ážáá»ááºááŸá¯ááŸáá·áº ááá¯ááºáá®áá±á¬ááŒá±á¬áá·áº á á¬áá¯á¶ážááŒá®ážááŒáá·áº áá®ážáá±á¬ááºážááá¯ážááŒáá¬ážááá·áº áá²ááºáá»á¬ážá ááŸáá¯ááºážááŸááºááŸá¯ááẠá¡áááºááŸá¬ážáá¯á¶ážááŒá áºáááºá á€á ááºážáááºááŸá¯ááœáẠGreenPlum ááẠHive ááᯠ8 ááŒáááºá¡ááá¯ááºááááºááá¯áá»áœááºá¯ááºááá¯á·ááŒááºáááºá
á¡áá®ážááŸáá¡áá»áááºááŸáá·áºáááŒá±ážáá®áá¯ááºááœáẠGreenPlum ááŸáá·áº Ab Initio á¡áá¯ááºáá¯ááºááŒááºážá
á€á ááºážáááºááŸá¯ááœááºá áá»áœááºá¯ááºááá¯á·ááẠá¡áá»áááºááŸáá·áºáááŒá±ážáá® á¡áá»áááºááŸáá·áºáááŒá±ážáá® áá»áááºážáá¯ááºáá¬ážáá±á¬ áá±áá¬á¡ááá¯ááºážáá»á¬ážááŒáá·áº GreenPlum ááá¬ážááᯠá¡ááºááááºáá¯ááºááẠAb Initio áá áœááºážáááºááᯠá ááºážáááºáá«áááºá áá»áœááºá¯ááºááá¯á· áá¯ááºáá±á¬ááºááá·áº GreenPlum ááá¬áž dev42_1_db_usl.TESTING_SUBJ_org_finval ááᯠá ááºážá á¬ážááŒáá·áºááŒáá«á áá¯á·á
áááºážááŸáá·áºáá¯ááºáá±á¬ááºááẠAb Initio ááááºáá¯á¶ážáá¯ááᯠá¡áá¯á¶ážááŒá¯áá«áááºá
1) Graph Create_test_data.mp â áá»ááºážááŒáá¯áẠáá áá¯ááœáẠá¡áááºáž á,ááá,ááá ááŒáá·áº HDFS ááœáẠáá±áá¬ááá¯ááºáá»á¬ážááᯠáááºáá®ážáááºá áá±áá¬ááẠáá»áááºážááŒá áºááŒá®ážá áááºážáááœá²á·á ááºážáá¯á¶ááẠáá»áœááºá¯ááºááá¯á·áááá¬ážááœáẠááá·áºááœááºážáááºá¡ááœáẠááœá²á·á ááºážáá¬ážáááºá
2) ááááºáá
Ạmdw_load.day_one.current.dev42_1_db_usl_testing_subj_org_finval.pset â MDW ááẠáá»áœááºá¯ááºááá¯á·áááá¬ážáá²ááá¯á· áá±áá¬ááá·áºááœááºážááŒááºážááᯠá¡á
ááŒá¯ááŒááºážááŒáá·áº á¡ááŒáá¯áẠáá ááœá²ááœáẠá
áááºááá·áºááœááºážááŒááºážááŒáá·áº (áááẠ(á) ááŸáá¯ááºáá±ážáá±á¬ á
ááºážáááºáá±áá¬ááᯠá¡áá¯á¶ážááŒá¯áááº)
3) ááááºáá
Ạmdw_load.regular.current.dev42_1_db_usl_testing_subj_org_finval.pset â áááẠ(á) ááŸáá¯ááºáá±ážáá±á¬ áááºáááºáááºáááºáááŸááá¬ážáá±á¬áá±áᬠ(ááŒá
áºááá»áœááºážáá±á«áºáá±á) ááŸáá¯ááºáá±ážáá±á¬ ááááº(á)áá¯ááá¯á¡áá¯á¶ážááŒá¯á áá»áœááºá¯ááºááá¯á·áááá¬ážááᯠááá¯ážááŒáŸáá·áºááœááºážáá¶áááºá¡ááœáẠMDW ááŸáá¯ááºáá±ážáá±á¬ ááááºáá
áºáá¯
NRT áá¯ááºááœáẠá¡á±á¬ááºáá« script ááá¯áá¯á¶ážááŒáá«á
áá¯á·á
- á ááºážáááºááá¯ááºážáá±á«ááºáž 6 ááá¯áá¯ááºáá¯ááºáá«á
- áááŠážáááºá¡á¬áž 6 á ááºážáááºá¡áááºážáá»á¬ážááᯠá á¬ážááœá²á¡ááœááºáá áºáá¯áá²ááá¯á· ááá·áºááœááºážáá«á
- ááá¯ážááŒáŸáá·áºáá±á«ááºážáá¯ááºááᯠ5 ááŒáááºááŒááºáá¯ááºáá«á
- á ááºážáááºááá¯ááºážáá±á«ááºáž 6 ááá¯áá¯ááºáá¯ááºáá«á
- ááá¬ážáá²ááá¯á· 6 á ááºážáááºá¡áááºážáá»á¬áž ááá¯ážááŒáá·áºááá·áºááœááºážáá« (á€ááá á¹á ááœááºá áááºáááºážáá¯ááºáá¯á¶ážáá»áááºááᯠáá±áá¬áá±á¬ááºážááá¯á· áááºááŸááºáá¬ážááŒá®áž áá°áá®áá±á¬á¡ááááá±á¬á·ááŒáá·áº áá±á¬ááºááẠáááºááá±á¬áá±áá¬ááᯠááá·áºááœááºážáá¬ážáááº)
á€á¡ááŒá±á¡áá±ááẠá¡áá»áá¯á·áá±á¬á á®ážááœá¬ážáá±ážá áá áºá áááá·áºáááºáááºááŸá¯áá¯á¶á á¶ááᯠá¡áá¯áá°ááẠ- áá±áá¬á¡áá áºáá¡áá±á¬áºáá±ážááŒá®ážáá¬ážáá±á¬á¡á áááºá¡ááá¯ááºážááẠá¡áá»áááºááŸáá·áºáááŒá±ážáá®áá±á«áºáá¬ááŒá®áž GreenPlum ááá¯á·áá»ááºáá»ááºážááœááºážáá±á¬ááºážáááºá
á¡áᯠáá¬ááºááœáŸááºážáá²á· ááŸááºáááºážááᯠááŒáá·áºáá¡á±á¬ááºá
2020-06-04 11:49:11 ááœáẠCreate_test_data.input.pset ááᯠá
áááºáá«
2020-06-04 11:49:37 ááœáẠCreate_test_data.input.pset ááᯠá¡ááŒá®ážáááºáá«
mdw_load.day_one.current.dev42_1_db_usl_testing_subj_org_finval.pset ááᯠ2020-06-04 11:49:37 ááœáẠá
áááºáá«
mdw_load.day_one.current.dev42_1_db_usl_testing_subj_org_finval.pset 2020-06-04 11:50:42 ááœáẠá¡ááŒá®ážáááºáá«
2020-06-04 11:50:42 ááœáẠCreate_test_data.input.pset ááᯠá
áááºáá«
2020-06-04 11:51:06 ááœáẠCreate_test_data.input.pset ááᯠá¡ááŒá®ážáááºáá«
mdw_load.regular.current.dev42_1_db_usl_testing_subj_org_finval.pset ááᯠ2020-06-04 11:51:06 ááœáẠá
áááºáá«
mdw_load.regular.current.dev42_1_db_usl_testing_subj_org_finval.pset 2020-06-04 11:53:41 ááœáẠá¡ááŒá®ážáááºáá«
2020-06-04 11:53:41 ááœáẠCreate_test_data.input.pset ááᯠá
áááºáá«
2020-06-04 11:54:04 ááœáẠCreate_test_data.input.pset ááᯠá¡ááŒá®ážáááºáá«
mdw_load.regular.current.dev42_1_db_usl_testing_subj_org_finval.pset ááᯠ2020-06-04 11:54:04 ááœáẠá
áááºáá«
mdw_load.regular.current.dev42_1_db_usl_testing_subj_org_finval.pset 2020-06-04 11:56:51 ááœáẠá¡ááŒá®ážáááºáá«
2020-06-04 11:56:51 ááœáẠCreate_test_data.input.pset ááᯠá
áááºáá«
2020-06-04 11:57:14 ááœáẠCreate_test_data.input.pset ááᯠá¡ááŒá®ážáááºáá«
mdw_load.regular.current.dev42_1_db_usl_testing_subj_org_finval.pset ááᯠ2020-06-04 11:57:14 ááœáẠá
áááºáá«
mdw_load.regular.current.dev42_1_db_usl_testing_subj_org_finval.pset 2020-06-04 11:59:55 ááœáẠá¡ááŒá®ážáááºáá«
2020-06-04 11:59:55 ááœáẠCreate_test_data.input.pset ááᯠá
áááºáá«
2020-06-04 12:00:23 ááœáẠCreate_test_data.input.pset ááᯠá¡ááŒá®ážáááºáá«
mdw_load.regular.current.dev42_1_db_usl_testing_subj_org_finval.pset ááᯠ2020-06-04 12:00:23 ááœáẠá
áááºáá«
mdw_load.regular.current.dev42_1_db_usl_testing_subj_org_finval.pset 2020-06-04 12:03:23 ááœáẠá¡ááŒá®ážáááºáá«
2020-06-04 12:03:23 ááœáẠCreate_test_data.input.pset ááᯠá
áááºáá«
2020-06-04 12:03:49 ááœáẠCreate_test_data.input.pset ááᯠá¡ááŒá®ážáááºáá«
mdw_load.regular.current.dev42_1_db_usl_testing_subj_org_finval.pset ááᯠ2020-06-04 12:03:49 ááœáẠá
áááºáá«
mdw_load.regular.current.dev42_1_db_usl_testing_subj_org_finval.pset 2020-06-04 12:06:46 ááœáẠá¡ááŒá®ážáááºáá«
áá®áá¯á¶ááœááºáá¬áááº-
ááá¯ááºááŒááá¬áž
á¡áá»ááẠStart
ááŒá®ážáá»áááº
á¡ááŸááº
Create_test_data.input.pset
04.06.2020 11: 49: 11
04.06.2020 11: 49: 37
00:00:26
mdw_load.day_one.current
dev42_1_db_usl_testing_subj_org_finval.pset
04.06.2020 11: 49: 37
04.06.2020 11: 50: 42
00:01:05
Create_test_data.input.pset
04.06.2020 11: 50: 42
04.06.2020 11: 51: 06
00:00:24
mdw_load.regular.currentá
dev42_1_db_usl_testing_subj_org_finval.pset
04.06.2020 11: 51: 06
04.06.2020 11: 53: 41
00:02:35
Create_test_data.input.pset
04.06.2020 11: 53: 41
04.06.2020 11: 54: 04
00:00:23
mdw_load.regular.currentá
dev42_1_db_usl_testing_subj_org_finval.pset
04.06.2020 11: 54: 04
04.06.2020 11: 56: 51
00:02:47
Create_test_data.input.pset
04.06.2020 11: 56: 51
04.06.2020 11: 57: 14
00:00:23
mdw_load.regular.currentá
dev42_1_db_usl_testing_subj_org_finval.pset
04.06.2020 11: 57: 14
04.06.2020 11: 59: 55
00:02:41
Create_test_data.input.pset
04.06.2020 11: 59: 55
04.06.2020 12: 00: 23
00:00:28
mdw_load.regular.currentá
dev42_1_db_usl_testing_subj_org_finval.pset
04.06.2020 12: 00: 23
04.06.2020 12: 03: 23
00:03:00
Create_test_data.input.pset
04.06.2020 12: 03: 23
04.06.2020 12: 03: 49
00:00:26
mdw_load.regular.currentá
dev42_1_db_usl_testing_subj_org_finval.pset
04.06.2020 12: 03: 49
04.06.2020 12: 06: 46
00:02:57
á¡ááá¯ážááá¯ááºáž 6 ááᯠ000 áááá
áºá¡ááœááºáž áá¯ááºáá±á¬ááºáááºááᯠáá»áœááºá¯ááºááá¯á·ááŒááºáááŒá®ážá áááºážááẠá¡ááœááºááŒááºáááºáá«áááºá
áá
áºááŸááºááá¬ážááŸá áá±áá¬áá»á¬ážááᯠá¡á±á¬ááºáá«á¡ááá¯ááºáž ááŒáá·áºáá±áá²á·áááº-
select valid_from_ts, valid_to_ts, count(1), min(sk), max(sk) from dev42_1_db_usl.TESTING_SUBJ_org_finval group by valid_from_ts, valid_to_ts order by 1,2;
ááááºáá»á¬ážááᯠá
áááºááá·áºá¡áá»áááºááŸáá·áº ááá·áºááœááºážáá¬ážáá±á¬ á¡áá»ááºá¡áááºáá»á¬ážá á
á¬áá±ážá
á¬áá°ááᯠáááºááŒááºááá¯ááºáááºá
ááá¯ááá¯áááºááŸá¬ áááºááẠá¡ááœááºááŒáá·áºáá¬ážáá±á¬ ááŒáááºááŸá¯ááºážááŒáá·áº Ab Initio ááŸá GreenPlum ááœáẠáá±áá¬áá»á¬áž ááá¯ážááŒáá·áºáááºááŒááºážááᯠáá¯ááºáá±á¬ááºááá¯ááºááŒá®áž á€áá±áá¬ááᯠGreenPlum ááœáẠááá·áºááœááºážááŒááºážá á¡ááŸáááºá¡áá¯ááºááŒáá·áºáá¬ážááŸá¯ááᯠáááááŒá¯ááá¯ááºáááºááŒá
áºáááºá ETL áááááá¬áá²á·ááá¯á· Ab Initio ááẠá
áááºáá±á¬á¡áá« âá
áááºáááºâ á¡áá»áááºááá¯á¡ááºáá±á¬ááŒá±á¬áá·áº áá
áºá
áá¹ááá·áºáá»áŸáẠáá
áºááŒááẠá
áááºááẠáááŒá
áºááá¯ááºáá±á¬á·áá«á
áá±á¬ááºáá»ááº
Ab Initio ááᯠUnified Semantic Data Layer (ESS) áááºáá±á¬ááºáááºá¡ááœáẠSberbank ááœáẠáááºááŸáá¡áá¯á¶ážááŒá¯áá±áááºá á€ááá±á¬áá»ááºááœáẠáááºáá¯ááºáááºážááá¯ááºáᬠáá¯ááºáááºážá¡áá»áá¯ážáá»áá¯ážá á¡ááŒá±á¡áá±áá»á¬ážááᯠáá áºá á¯áá áºá ááºážáááºáž áááºáá±á¬ááºááŒááºáž áá«áááºáááºá ááááºážá¡áá»ááºá¡áááºáá»á¬ážááẠHadoop ááœááºááŒááºáááºáá¬ážááá·áºáá¯á¶áá°áá»á¬ážááá¯á¡áá»áá¯ážáá»áá¯ážáá±á¬áááºážááŒá áºáá»á¬ážááŸáá¬áááºá áá¯ááºáááºážááá¯á¡ááºáá»ááºáá»á¬ážá¡áá±á«áº á¡ááŒá±áá¶á áá±áá¬áá¯á¶á á¶áá áºáá¯ááᯠááŒááºáááºááŒá®áž áá±áá¬á¡ááœááºááŒá±á¬ááºážááŸá¯áá»á¬ážááᯠáá±á¬áºááŒáá«áááºá Ab Initio ááẠá¡áá»ááºá¡áááºáá»á¬ážááᯠESN áá²ááá¯á· áááºáá±ážááŒá®áž áá±á«ááºážáá¯ááºáá¯ááºáá¬ážáá±á¬áá±áá¬ááẠáá¯ááºáááºážá¡ááœáẠá áááºáááºá á¬ážáá¯á¶áá¬áááá² data marts áá»á¬ážáááºáá±á¬ááºáááºá¡ááœáẠá¡áááºážá¡ááŒá áºáá áºáá¯áááºážááŒá áºáááºá áá áºáá»áááºáááºážááŸá¬áááºá áá¯ááºáá¯ááºááá¯ááºáá±á¬ááºááá¯ááºá áœááºážááẠááá·áºá¡á¬áž áááºáá¶ááá·áºá áá Ạ(Hiveá Greenplumá Teradataá Oracle) á¡ááŒá Ạá¡áá»áá¯ážáá»áá¯ážáá±á¬á áá áºáá»á¬ážááᯠá¡áá¯á¶ážááŒá¯ááá¯ááºááŒá®áž áááºážááẠáá¯ááºáááºážáá áºáá¯á¡ááœáẠááá¯á¡ááºááá·áºáá¯á¶á á¶á¡áá»áá¯ážáá»áá¯ážááŒáá·áº áá±áá¬ááᯠá¡ááœááºááá°ááŒááºáááºááá¯ááºá á±áááºá
Ab Initio á á áœááºážáá±á¬ááºáááºáá»á¬ážááẠáá»ááºááŒáá·áºáááºá á¥ááá¬á¡á¬ážááŒáá·áºá áá«áááºáá±á¬ MDW áá°áá±á¬ááºááẠáááºážááá¬ááŸáá·áº á á®ážááœá¬ážáá±ážááá¯ááºáᬠáááá¯ááºážááá¯ááºáᬠá¡áá»ááºá¡áááºáá»á¬ážááᯠáá±á¬ááºá¡ááœááºážá០áááºáá±á¬ááºááá¯ááºá á±áááºá developer áá»á¬ážá¡ááœáẠAb Initio ááẠáá®ážááᯠááŒááºáááºááœááºážáá¶ááẠáááŒá áºááá¯ááºáá±á¬áºáááºáž áá±áá¬ááŸáá·áº á¡áá¯ááºáá¯ááºáá±á¬á¡áá«ááœáẠáááŸááááŒá áºááá¯á¡ááºáá±á¬ áá áºáá»á áºááá¯ááºáá»á¬ážááŒá áºááá·áº ááŸáááŒá®ážáá¬áž functional á¡á áááºá¡ááá¯ááºážáá»á¬ážá áœá¬ááᯠá¡áá¯á¶ážááŒá¯ááẠááŒá¯áá¯ááºáá±ážáá«áááºá
á á¬áá±ážáá°ááẠSberbank SberProfi DWH/BigData á ááá±á¬áºáááºááŸááºáááºá¡ááá¯ááºážá¡ááá¯ááºážááœáẠáá»áœááºážáá»ááºáá°ááŒá áºáááºá SberProfi DWH/BigData ááá±á¬áºáááºááŸááºáááºá¡ááá¯ááºá¡áááºážááẠHadoop áá±áá áá áºá Teradataá Oracle DBá GreenPlum ááŸáá·áº BI áááááá¬áá»á¬áž Qliká SAP BOá Tableau á¡á ááŸáááá·áº áááºáááºáá»á¬ážááœáẠá¡áááºá¡áá»ááºážáá»á¬áž ááœá¶á·ááŒáá¯ážááá¯ážáááºá á±ááẠáá¬áááºááŸááá«áááºá
source: www.habr.com