рд╡рд┐рддрд░рд┐рдд рдбреЗрдЯрд╛ рдкреНрд░реЛрд╕реЗрд╕рд┐рдВрдЧ Apache Hadoop 3.3 рд╕рд╛рдареА рдкреНрд▓реЕрдЯрдлреЙрд░реНрдордЪреЗ рдкреНрд░рдХрд╛рд╢рди

рджреАрдб рд╡рд░реНрд╖рд╛рдЪреНрдпрд╛ рд╡рд┐рдХрд╛рд╕рд╛рдирдВрддрд░, Apache Software Foundation рдкреНрд░рдХрд╛рд╢рд┐рдд рд░реАрд▓рд┐рдЭ Apache Hadoop 3.3.0, рдкреНрд░рддрд┐рдорд╛рди рд╡рд╛рдкрд░реВрди рдореЛрдареНрдпрд╛ рдкреНрд░рдорд╛рдгрд╛рдд рдбреЗрдЯрд╛рдЪреА рд╡рд┐рддрд░рд┐рдд рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдЖрдпреЛрдЬрд┐рдд рдХрд░рдгреНрдпрд╛рд╕рд╛рдареА рдПрдХ рд╡рд┐рдирд╛рдореВрд▓реНрдп рд╡реНрдпрд╛рд╕рдкреАрда рдирдХрд╛рд╢рд╛/рдХрдореА, рдЬреНрдпрд╛рдордзреНрдпреЗ рдХрд╛рд░реНрдп рдЕрдиреЗрдХ рд▓рд╣рд╛рди рд╕реНрд╡рддрдВрддреНрд░ рддреБрдХрдбреНрдпрд╛рдВрдордзреНрдпреЗ рд╡рд┐рднрд╛рдЧрд▓реЗ рдЧреЗрд▓реЗ рдЖрд╣реЗ, рдЬреНрдпрд╛рдкреИрдХреА рдкреНрд░рддреНрдпреЗрдХ рд╡реЗрдЧрд│реНрдпрд╛ рдХреНрд▓рд╕реНрдЯрд░ рдиреЛрдбрд╡рд░ рд▓реЙрдиреНрдЪ рдХреЗрд▓рд╛ рдЬрд╛рдК рд╢рдХрддреЛ. рд╣рдбреВрдк-рдЖрдзрд╛рд░рд┐рдд рд╕реНрдЯреЛрд░реЗрдЬ рд╣рдЬрд╛рд░реЛ рдиреЛрдбреНрд╕ рдкрд╕рд░рд╡реВ рд╢рдХрддреЗ рдЖрдгрд┐ рддреНрдпрд╛рдд рдПрдХреНрд╕рд╛рдмрд╛рдЗрдЯ рдбреЗрдЯрд╛ рдЕрд╕реВ рд╢рдХрддреЛ.

Hadoop рдордзреНрдпреЗ Hadoop Distributed Filesystem (HDFS) рдЪреА рдЕрдВрдорд▓рдмрдЬрд╛рд╡рдгреА рд╕рдорд╛рд╡рд┐рд╖реНрдЯ рдЖрд╣реЗ, рдЬреА рд╕реНрд╡рдпрдВрдЪрд▓рд┐рддрдкрдгреЗ рдбреЗрдЯрд╛ рдмреЕрдХрдЕрдк рдкреНрд░рджрд╛рди рдХрд░рддреЗ рдЖрдгрд┐ MapReduce рдНрдкреНрд▓рд┐рдХреЗрд╢рдиреНрд╕рд╕рд╛рдареА рдСрдкреНрдЯрд┐рдорд╛рдЗрдЭ рдХреЗрд▓реА рдЬрд╛рддреЗ. Hadoop рд╕реНрдЯреЛрд░реЗрдЬрдордзреАрд▓ рдбреЗрдЯрд╛рдЪрд╛ рдкреНрд░рд╡реЗрд╢ рд╕реБрд▓рдн рдХрд░рдгреНрдпрд╛рд╕рд╛рдареА, HBase рдбреЗрдЯрд╛рдмреЗрд╕ рдЖрдгрд┐ SQL рд╕рд╛рд░рдЦреА рднрд╛рд╖рд╛ Pig рд╡рд┐рдХрд╕рд┐рдд рдХреЗрд▓реА рдЧреЗрд▓реА рдЖрд╣реЗ, рдЬреА MapReduce рд╕рд╛рдареА рдПрдХ рдкреНрд░рдХрд╛рд░рдЪреА SQL рдЖрд╣реЗ, рдЬреНрдпрд╛рдЪреНрдпрд╛ рдХреНрд╡реЗрд░реА рдЕрдиреЗрдХ Hadoop рдкреНрд▓реЕрдЯрдлреЙрд░реНрдорджреНрд╡рд╛рд░реЗ рд╕рдорд╛рдВрддрд░ рдЖрдгрд┐ рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдХреЗрд▓реНрдпрд╛ рдЬрд╛рдК рд╢рдХрддрд╛рдд. рдкреНрд░рдХрд▓реНрдкрд╛рдЪреЗ рдореВрд▓реНрдпрд╛рдВрдХрди рдкреВрд░реНрдгрдкрдгреЗ рд╕реНрдерд┐рд░ рдЖрдгрд┐ рдФрджреНрдпреЛрдЧрд┐рдХ рдХрд╛рд░реНрдпрд╛рд╕рд╛рдареА рддрдпрд╛рд░ рдЖрд╣реЗ. Google Bigtable/GFS/MapReduce рдкреНрд▓реЕрдЯрдлреЙрд░реНрдо рдкреНрд░рдорд╛рдгреЗрдЪ рдХреНрд╖рдорддрд╛ рдкреНрд░рджрд╛рди рдХрд░реВрди рдореЛрдареНрдпрд╛ рдФрджреНрдпреЛрдЧрд┐рдХ рдкреНрд░рдХрд▓реНрдкрд╛рдВрдордзреНрдпреЗ Hadoop рдЪрд╛ рд╕рдХреНрд░рд┐рдпрдкрдгреЗ рд╡рд╛рдкрд░ рдХреЗрд▓рд╛ рдЬрд╛рддреЛ, рддрд░ Google рдЕрдзрд┐рдХреГрддрдкрдгреЗ рдирд┐рдпреБрдХреНрдд рдХреЗрд▓реЗ Hadoop рдЖрдгрд┐ рдЗрддрд░ Apache рдкреНрд░рдХрд▓реНрдкрд╛рдВрдирд╛ MapReduce рдкрджреНрдзрддреАрд╢реА рд╕рдВрдмрдВрдзрд┐рдд рдкреЗрдЯрдВрдЯрджреНрд╡рд╛рд░реЗ рд╕рдВрд░рдХреНрд╖рд┐рдд рддрдВрддреНрд░рдЬреНрдЮрд╛рди рд╡рд╛рдкрд░рдгреНрдпрд╛рдЪрд╛ рдЕрдзрд┐рдХрд╛рд░ рдЖрд╣реЗ.

рдЕрдкрд╛рдЪреЗ рд░рд┐рдкреЙрдЭрд┐рдЯрд░реАрдЬрдордзреНрдпреЗ Hadoop рдмрджрд▓рд╛рдВрдЪреНрдпрд╛ рд╕рдВрдЦреНрдпреЗрдиреБрд╕рд╛рд░ рдкрд╣рд┐рд▓реНрдпрд╛ рдХреНрд░рдорд╛рдВрдХрд╛рд╡рд░ рдЖрд╣реЗ рдЖрдгрд┐ рдХреЛрдбрдмреЗрд╕ рдЖрдХрд╛рд░рд╛рдЪреНрдпрд╛ (рдХреЛрдбрдЪреНрдпрд╛ рд╕реБрдорд╛рд░реЗ 4 рджрд╢рд▓рдХреНрд╖ рдУрд│реА) рдкрд╛рдЪрд╡реНрдпрд╛ рдХреНрд░рдорд╛рдВрдХрд╛рд╡рд░ рдЖрд╣реЗ. рдкреНрд░рдореБрдЦ рд╣рдбреВрдк рдЕрдВрдорд▓рдмрдЬрд╛рд╡рдгреАрдордзреНрдпреЗ рдиреЗрдЯрдлреНрд▓рд┐рдХреНрд╕ (рджрд░рд░реЛрдЬ 500 рдЕрдмреНрдЬрд╛рд╣реВрди рдЕрдзрд┐рдХ рдЗрд╡реНрд╣реЗрдВрдЯ рд╕рдВрдЧреНрд░рд╣рд┐рдд рдХреЗрд▓реЗ рдЬрд╛рддрд╛рдд), рдЯреНрд╡рд┐рдЯрд░ (10 рд╣рдЬрд╛рд░ рдиреЛрдбреНрд╕рдЪрд╛ рдХреНрд▓рд╕реНрдЯрд░ рд░рд┐рдЕрд▓ рдЯрд╛рдЗрдордордзреНрдпреЗ рдПрдХ рдЭреЗрдЯрд╛рдмрд╛рдЗрдЯрдкреЗрдХреНрд╖рд╛ рдЬрд╛рд╕реНрдд рдбреЗрдЯрд╛ рд╕рдВрдЧреНрд░рд╣рд┐рдд рдХрд░рддреЛ рдЖрдгрд┐ рджрд░рд░реЛрдЬ 5 рдЕрдмреНрдЬ рдкреЗрдХреНрд╖рд╛ рдЬрд╛рд╕реНрдд рд╕рддреНрд░рд╛рдВрд╡рд░ рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдХрд░рддреЛ), рдлреЗрд╕рдмреБрдХ (рдПрдХ рдХреНрд▓рд╕реНрдЯрд░) рдпрд╛рдВрдЪрд╛ рд╕рдорд╛рд╡реЗрд╢ рд╣реЛрддреЛ. 4 рд╣рдЬрд╛рд░ рдиреЛрдбреНрд╕ 300 рдкреЗрдХреНрд╖рд╛ рдЬрд╛рд╕реНрдд рдкреЗрдЯрд╛рдмрд╛рдЗрдЯреНрд╕ рд╕рд╛рдард╡рддрд╛рдд рдЖрдгрд┐ рджрд░рд░реЛрдЬ 4 PB рдиреЗ рд╡рд╛рдврдд рдЖрд╣реЗрдд).

рдореБрдЦреНрдп рдмрджрд▓ рдХрд░рд╛ Apache Hadoop 3.3 рдордзреНрдпреЗ:

  • ARM рдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЪрд░рд╡рд░ рдЖрдзрд╛рд░рд┐рдд рдкреНрд▓реЕрдЯрдлреЙрд░реНрдорд╕рд╛рдареА рд╕рдорд░реНрдерди рдЬреЛрдбрд▓реЗ.
  • рд╕реНрд╡рд░реВрдкрд╛рдЪреА рдЕрдВрдорд▓рдмрдЬрд╛рд╡рдгреА рдкреНрд░реЛрдЯреЛрдмрдл (рдкреНрд░реЛрдЯреЛрдХреЙрд▓ рдмрдлрд░), рд╕реНрдЯреНрд░рдХреНрдЪрд░реНрдб рдбреЗрдЯрд╛рдЪреНрдпрд╛ рдХреНрд░рдорд╡рд╛рд░реАрд╕рд╛рдареА рд╡рд╛рдкрд░рд▓рд╛ рдЬрд╛рддреЛ, рдкреНрд░реЛрдЯреЛрдмрдл-3.7.1 рд╢рд╛рдЦреЗрдЪреНрдпрд╛ рдЬреАрд╡рди рдЪрдХреНрд░рд╛рдЪреНрдпрд╛ рд╕рдорд╛рдкреНрддреАрдореБрд│реЗ 2.5.0 рд░рд┐рд▓реАрдЬ рдХрд░рдгреНрдпрд╛рд╕рд╛рдареА рдЕрджреНрдпрддрдирд┐рдд рдХреЗрд▓реЗ рдЧреЗрд▓реЗ рдЖрд╣реЗ.
  • S3A рдХрдиреЗрдХреНрдЯрд░рдЪреНрдпрд╛ рдХреНрд╖рдорддрд╛рдВрдЪрд╛ рд╡рд┐рд╕реНрддрд╛рд░ рдХреЗрд▓рд╛ рдЧреЗрд▓рд╛ рдЖрд╣реЗ: рдЯреЛрдХрди рд╡рд╛рдкрд░реВрди рдкреНрд░рдорд╛рдгреАрдХрд░рдгрд╛рд╕рд╛рдареА рд╕рдорд░реНрдерди рдЬреЛрдбрд▓реЗ рдЧреЗрд▓реЗ рдЖрд╣реЗ (рдбреЗрд▓рд┐рдЧреЗрд╢рди рдЯреЛрдХрди), рдХреЛрдб 404 рд╕рд╣ рдкреНрд░рддрд┐рд╕рд╛рдж рдХреЕрд╢рд┐рдВрдЧрд╕рд╛рдареА рд╕реБрдзрд╛рд░рд┐рдд рд╕рдорд░реНрдерди, рд╡рд╛рдврд▓реЗрд▓реА S3guard рдХрд╛рд░реНрдпрдкреНрд░рджрд░реНрд╢рди рдЖрдгрд┐ рд╡рд╛рдврд▓реЗрд▓реА рдСрдкрд░реЗрд╢рдирд▓ рд╡рд┐рд╢реНрд╡рд╕рдиреАрдпрддрд╛.
  • ABFS рдлрд╛рдЗрд▓ рд╕рд┐рд╕реНрдЯрдордордзреНрдпреЗ рд╕реНрд╡рдпрдВрдЪрд▓рд┐рдд рдЯреНрдпреВрдирд┐рдВрдЧрд╕рд╣ рд╕рдорд╕реНрдпрд╛ рд╕реЛрдбрд╡рд▓реНрдпрд╛ рдЧреЗрд▓реНрдпрд╛ рдЖрд╣реЗрдд.
  • COS рдСрдмреНрдЬреЗрдХреНрдЯ рд╕реНрдЯреЛрд░реЗрдЬрдордзреНрдпреЗ рдкреНрд░рд╡реЗрд╢ рдХрд░рдгреНрдпрд╛рд╕рд╛рдареА Tencent Cloud COS рдлрд╛рдЗрд▓ рд╕рд┐рд╕реНрдЯрдорд╕рд╛рдареА рдореВрд│ рд╕рдорд░реНрдерди рдЬреЛрдбрд▓реЗ.
  • Java 11 рд╕рд╛рдареА рдкреВрд░реНрдг рд╕рдорд░реНрдерди рдЬреЛрдбрд▓реЗ.
  • HDFS RBF (рд░рд╛рдЙрдЯрд░-рдЖрдзрд╛рд░рд┐рдд рдлреЗрдбрд░реЗрд╢рди) рдЪреА рдЕрдВрдорд▓рдмрдЬрд╛рд╡рдгреА рд╕реНрдерд┐рд░ рдЭрд╛рд▓реА рдЖрд╣реЗ. HDFS рд░рд╛рдЙрдЯрд░рдордзреНрдпреЗ рд╕реБрд░рдХреНрд╖рд╛ рдирд┐рдпрдВрддреНрд░рдгреЗ рдЬреЛрдбрд▓реА рдЧреЗрд▓реА рдЖрд╣реЗрдд.
  • рд╣реЛрд╕реНрдЯ рдирд╛рд╡рд╛рдВрджреНрд╡рд╛рд░реЗ DNS рджреНрд╡рд╛рд░реЗ рд╕рд░реНрд╡реНрд╣рд░ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рдгреНрдпрд╛рд╕рд╛рдареА рдХреНрд▓рд╛рдпрдВрдЯрд╕рд╛рдареА DNS рд░рд┐рдЭреЛрд▓реНрдпреВрд╢рди рд╕реЗрд╡рд╛ рдЬреЛрдбрд▓реА, рддреБрдореНрд╣рд╛рд▓рд╛ рд╕реЗрдЯрд┐рдВрдЧреНрдЬрдордзреНрдпреЗ рд╕рд░реНрд╡ рд╣реЛрд╕реНрдЯ рд╕реВрдЪреАрдмрджреНрдз рдХреЗрд▓реНрдпрд╛рд╢рд┐рд╡рд╛рдп рдХрд░рдгреНрдпрд╛рдЪреА рдЕрдиреБрдорддреА рджреЗрддреЗ.
  • рд▓рд╛рдБрдЪ рд╢реЗрдбреНрдпреБрд▓рд┐рдВрдЧ рд╕рдорд░реНрдерди рдЬреЛрдбрд▓реЗ рд╕рдВрдзреАрд╕рд╛рдзреВ рдХрдВрдЯреЗрдирд░ рдкреНрд░рддреНрдпреЗрдХ рдиреЛрдбрдЪрд╛ рднрд╛рд░ рд▓рдХреНрд╖рд╛рдд рдШреЗрдКрди рдХрдВрдЯреЗрдирд░ рд╡рд┐рддрд░рд┐рдд рдХрд░рдгреНрдпрд╛рдЪреНрдпрд╛ рдХреНрд╖рдорддреЗрд╕рд╣ рдХреЗрдВрджреНрд░реАрдХреГрдд рд╕рдВрд╕рд╛рдзрди рд╡реНрдпрд╡рд╕реНрдерд╛рдкрдХ (рд░рд┐рд╕реЛрд░реНрд╕ рдореЕрдиреЗрдЬрд░) рджреНрд╡рд╛рд░реЗ.
  • рд╢реЛрдзрдгреНрдпрд╛рдпреЛрдЧреНрдп YARN (рдЕрджреНрдпрд╛рдк рдЖрдгрдЦреА рдПрдХ рд╕рдВрд╕рд╛рдзрди рдирд┐рдЧреЛрд╢рд┐рдПрдЯрд░) рдЕрдиреБрдкреНрд░рдпреЛрдЧ рдирд┐рд░реНрджреЗрд╢рд┐рдХрд╛ рдЬреЛрдбрд▓реА.

рд╕реНрддреНрд░реЛрдд: opennet.ru

рдПрдХ рдЯрд┐рдкреНрдкрдгреА рдЬреЛрдбрд╛