ααΈααααΆααααααΆαααα»αααααΌαααα
ααα
αΆα αα·ααα·αααααααα αααααΎαααααΆα
α ααα»α’αααΈααΆαααΆααΎαααααΌαααΆααα»αααααΌαααα
ααα
αΆααααα»αα’αΆααΈαααααααααααΆ? α’αααΈααααααααΆαααΊααΆαααααα·ααααα»αααααΆααααα»αααααααα½αα ααΆαααα - αααααΆααααααα»αααααΈααΆαα
αααΎαααΎαααααΎααΆαααααΆααΆααααααΆααααααααΆαααα»ααα½αα―αααΆααααααααΆαα αα·ααΆα - αααααΆαααααΆαααααααΆαααααααα
αααΎαα α
αααΎαααΆααα ααΆααααααααΆααααΌααα
α§ααΆα αααααααΈααα½αα ααΌααΌ ααΈα αααΆ
α§ααΆα ααααα½ααααα
ααΆαααααΎαααΎαα§ααααα
αααααααΆαα§ααααΆα αααααααααΆαααα»αααααΌααααααααααααααΊ Hadoop α α ααα»α’αααΈ? αααααΆααα Hadoop ααΊααΆαααααααααα―αααΆαααααα’αα½αααααα’ ( Habr ααΌα ααααΆαααααα±ααααΌαα’ααααααααα’α·αααΆα αααΎαααΎαααααΆαααααα) αααααααΌαααΆαα’αααααααα»αα§αααααααααΎααααΆαα αα·ααααααΆαααααΆααααΌαα α’αααα’αΆα αααααΌααααα»ααααααααα·ααααααααΆαααα ααΆαααααααα αα·ααα·αααΆααα ααΆααααααααααΆααΆααααα αΌα α αΎααααααααααααα½αα―αααΉαα ααα αΆααα½αααΆαααΆαααΆααααα»αααααΌαααα ααΆαααααα ααα αααααααΆαααΌα ααααΆααΆαααααα’αΆα ααααΌαααΆααααααΎα α¬αα·ααα αααααΆαα½α - ααΆαααααΎααΆαααααααΆααααααααΌα ααααΆαα αααα»ααααααααΆαα
αα
ααααΆα 2017 αααα»αα αα»αααααΉααααΆααααΆαα₯αααα·αα Gartner
Hadoop αααα·ααα ααΎαααααααααααΆα αααΎα ααααα½αα±ααααααααααΆαααααα»ααααααΊ αα αα αααα·ααααΆ MapReduce (αααααααααααααΆααα ααα αΆααα·αααααααααααΆααααΆαααααΆαααΆααααΆαααΈααα) αα·αααααααααα―αααΆα HDFS α ααααααααααααααΌαααΆααα ααΆα‘αΎαααΆαα·αααααΎααααΈαααααΆαα»αααααααΆααααα ααα αΆααααΆαααααΆααα αααααα αααα»αααΈαα½ααααααα ααααα’αΆα ααααΌαααΆαααΆαααα ααΎααααΆααααΆα αααΎα α αΎαα’ααα»αα ααααααΆαα αααα ααααααααααΆαααΆααααααΉαααΆααααΆαααααααααΆααααΈαα½ααα αααα½αα±ααααΆααΆαα―αααΆα αααΆαααΈααααα·αααα α ααΆ NameNode ααααΌαααΆαααααΎα
ααΌαααΆαααΆαααααααααα αΆαααΈααααααα MapReduce ααααΎαααΆαα αα ααααΆααααΆαααΈαα½α αα·ααααααααααΌαααΆααααα αααα ααΆαααααααααΆααααΆαααα½α αα ααααΆααααΆαααΈααΈα ααΆααααΌαααΆαα ααα αΆααααααΆααααα»αααααΌααα α αΎααα ααααΆααααΆαααΈααΈ ααΆαααααΆααΎαα‘αΎαα
MapReduce ααααΌαααΆααααααΎαααααΌαααα Google αααααΆαααααααΌαααΆαααααΆααααααααααααααΆα αααααΆαααα MapReduce ααΆαα
αΌααα
αααα»αααΌαα₯ααα·ααααα α αΎα Apache ααΆαααΆααααΆααααααααα ααΆααΆααααααΎαααΆαα, Google ααΆαααααΆααααααΌαααααα·α
αααα α αα
αααααααααΆαααααααααα ααΆααα½αα±ααα
αΆααα’αΆαααααααα½αα αα
αααααα Google ααΆααααααααα½ααααααΆααααααααΆ Google Cloud Dataflow αααααΆαααΈααΆααααΆααα αΆααααααΆαααααααΆααααΈ Hadoop ααΆααΆααααα½ααα ααααααααΆα
ααΆααααα‘ααααΎαααΆαααααα·ααααα αΆαααΆ Google Cloud Dataflow ααΊααα’ααααΎααΆααααααααα½ααα Apache Beam ααααααααα Apache Beam αα½ααααα αΌαααΌαααααααααα Apache Spark αααααΆαα ααααααααΆαααα’ αααα’αα»ααααΆαα±ααααΎααα·ααΆαα’αααΈααααΏαααααΆαααααα·ααααα·αααααααααΆαααααΎαααααΌα ααααΆα ααΆααΆααααααΎαααΆαα Apache Spark ααααΎαααΆαααΆαααα’αα ααΎααααααααα―αααΆα HDFS αααα’αα»ααααΆαα±ααα’αααααΆαααααααΆαααΆαα ααΎαααΆαααΈααα Hadoop α
αααααααα ααΈαααααΌαααα·ααΆαααα―αααΆα αα·ααααααααααΆααααααααααα½α ααΆααααα αααααΆαα Hadoop αα·α Spark αααααΆααααΉα Google Cloud Dataflow α αΎααααααΎαααα§αααααααΆααααα αααΆααα ααΎαααΈααααα ααα αα·αααααα’αΆα αααααα α α·αααααααααα½αα―αααΆααΎαααααΌααα½αααΆ - αα ααααα Hadoop α¬ Spark - αα½αααααΉαααααα·ααααα·ααααααααααΎααΆααα·α αα αααα·ααααα αα·ααα»ααα»αααα·α
Cloud α¬αααΆαααΈααααααα»ααααα»α
αα·ααααΆααΆαααααααα ααααΆαααααΆααααααΌαααΌαα αα ααΆαααααααΆααααααααΌαααΆαααΎαα‘αΎαααΌαααΆααααα½αα±ααα αΆααα’αΆααααααααΌα ααΆ Hadoop-as-a-service α αααα»αβααααΆαααΆαβαααβααα ααΆαβαααααααααβαααΆαααΈαβααβαααβααΆαβαααααΆααβααΆαβααααΆαβααΆβααΏαβααααΆααβααααΆααβααΆααα αααααΆααα, alas, αααααΈααΆααΆααΆααααααΆαααα·αααΆα, Hadoop αα»αααααΊααΆα§ααααααα·ααΆαααααααα ααΆαααααααα, α αΆααααΆααααΈα’αααααααΌαααααααΎα αααΎααααααα α§ααΆα ααα α’αααβα’αΆα βαααααβαα ααΆααααααααβαααΆαααΈαβααβααΆβααααααβαα»αααα ααΆαααΆαβααααΎαααΆαβααααβααΆ αα·αβαααααβαααΆαααΆααααααβααΆβα αααΎαα ααΆααΌαα ααααΎααΆαα±ααα’ααααααααααα α·ααα α αΎαααΆαα±ααΆααααααα»αααΆααααααααααααααααΆαα½α α¬ααααΆαα’αααΈαα½αα
ααΌα ααααααΆαα ααα αΆαααααααααΆαααααΆαααΆααΆαααααα·αααααΆαααααΆαα αααααααΌαα‘αΎαααααΌαααΆαααααΆαααααα§αααααααΆαααααααΆα αα·αααΆααααααααααααααΆααααα½αα ααΆαα ααα αΆαααααααα·αααα½ααααααΆαααα Spark αα·αααααΎα±ααα’αααΈαααΆαααΆαααΆααααα½αααΊ Cloudera α ααΆβααΆαβααΆααβααααβαααβααααΆαα αα·αβα₯αβαα·αβαααα - α αΎαβαα βαααβαααααβααα αα»αααΆαβααααΆααβααΆααβα’ααβααΆα α αΎαβαααβαα·αβαααααβα ααα½αβααααΆααα
ααα‘α»ααααααα‘αΎα Cloudera Manager ααΉαααααΆααααΆαααα SSH αα
ααΆαααααΆαααΈαααααααα’αααα α
ααα»α
αα½αα±ααα
αΆααα’αΆαααααααα½α: αα
αααααα‘αΎαααΆααα’αααααΎαααΆααα»αααΎααααΈαααααΆααααΆααΆααααΌαααΆαα’αα»αααααααα’αααΈαααααα α
ααΆ ααααΆαααΈα αααα
αααα·ααα αααααΈαα½ααααΆααααΆαααΆαα»α
αΆαααΆα
αααΆααα’αααααααΆαααααααα
ααΆααααααααααΎααααΈααααΎααΆαααΆαα½αααααΆα ααΆαααΆααα·α αααααΊααΆαααααααααΎαα‘αΎααααααααα·ααΈααααααααααααα
ααα
αααααΆααααΈααΆαααα‘αΎα ααΎαααα½αααΆααα»αααΌααααααααααα ααααα αααα’αααα’αΆα ααΎαααΎαααα‘ααααααααααααΆααα ααααα ααααΆαααααααααΆαααα‘αΎα ααΌαα’αααα’αΆα αααααα/αα»αααααΆα αα·αααααααα½αααΆαααααααα ααΆααααααααα αααααα
ααΆαααααα ααΆαααΆααααααΆααααα»ααααααααααα
α‘αΎααα
α
αααααα»αα’ααα αααααΉαααΆαα’ααααα
ααΆααα’ααΆααααααααΊααααΆααα BigData α ααα»αααααα»αααΉαααΎααα·ααΆαααΆ "ααααα
" α
αΌααααααΆαααα
αα»αααααααααααΆααα
αααααΌαααΆααααααααΉα
αα ααΎααα ααααααααααα½ααα Cloudera αα·ααΆαα’αααΈααΆαααααααααααααααα’αΆα ααΎαααΆαα αααααΆαααααΌαα ααααα½αααααααΌαααΆαααΆααααααααΌαααΆααααα αΆααα αααα»αααΌαααΆαα
MapReduce α’αΆα
ααααΎα²ααααΌαααΆααα»αα·αααα·αα·ααααααααα·αα αααα‘ααααΎαααααΆααααΆααα
αααα»αααααααα»αααααααα ααΆα
αααΆααααΆααααΆααααΎααααααααααααΈααΆααα’αα ααΆαααΆα MapReduce α’αΆα
αα½ααααα αΆαα
αααα’αΆααα·ααααααααΈααΆα α¬αααααΆαα αααααααΌαααΆαααααααααΆααααααααα
ααΎααααα Cloudera α ααΆαααααα αααααΆααααΆαααααΆαα ααααΆαα½α αα½αααΆααααΆαααα Spark αααααΆααΏααααααΌαααΆαααααΎαααααΆααααΆαααααΆααΆααααααααΆααΆααααααα ααααΏα I/O ααΊααΆαααΆααααααΆααααααΆααααΆααα ααΌα
ααααα αΎα αα
αααααααΎ Hadoop ααΆααΆαααΆααααααΆααααααΆααααΆααααααααΆαααΈααααααΆααα»αααααΆα αα·αααΏαα
αΌααα
αααα»αα
ααααα αααααΎααααΈααΆααααΆα±ααααααΆα ααΆαα·ααααααααααΌαααΆααααααα±αααα
αααα»αα αααααΆαα
ααΆααααααααααααααααα
αααα»ααααααα»αααΆαα ααα αΆαααααα»αααααΌαααΆααααααα ααΆααααααΆαααααΎααααΆαααα·αααα·α Openstack αα ααΎαααΆαααΈααααααααΆααααΈααΈααΌαα α»ααααΌαααααΆαα₯αααα·ααα ααααΆαααα·ααααααααααΌαααΆααααα ααααααΆααα½αααααΆααααααα½αααααααΆαα αα·αααΆαααΆααααΆααα αα αααα»ααααααααααΆαααααααΎαα αααΆαααΈα Atos Codex Data Lake ααΆαααααΎαα·αααα·αααΌααααΌααΆαααααΌαααΆααααααα ααααααααΆααΌαα ααα»αααααΎαααααααΆαααααααααααΆαα’αα»αααα (αααααααΆααααα αααααΆαα ααΆαααααααααααααΆαααααΌαααΆαααααα½αα’αααααααΆ) αα·α TCO (αααΆαααΈαααααααααααααΌαααΆααα»αα αα)α
αα
αααα»αααααΈααααΆαααααΎααααΆαααααΆαααΈααα BullSequana S200 ααΎαααα½αααΆαααΆααααα»αα―ααααααΆααααΆαααααΆαα αααααααΆααααα αΆαα½αα
ααα½αα ααΆαααααααα
ααΆααααααααα’αααααααΆαα½αααΆααααΆαααΈααα BullSequana S3 α
ααα½α 200 αααααΈαα½ααααΆα JBOD ααΈα ααΌα S200s αααααααααααΆαααααΆαααα·ααααααα
ααα½α XNUMX ααααΌαααΆαααααΆααααΆαααααΎαα αααααΊααΆααΆααααα»αα§ααΆα ααααα
αααα»αααΆαααααΎααααα TeraGenα
ααΆαααααΎαααααααΆαα½αααΉαααα·ααΆααα·αααααααααααααααΆ αα·ααααααα
αααααααα αΆαααααααααΌα
ααααΆαα
αααα»αααααααααααααΆαα
ααα
αΆαααααα»αααααααΆααααααΆααα
αααααα ααΆαααααααααααΊααΆααααΆα ααααααΆαα
ααα
αΆαααααΆαα
αΌαααααΎααΆααααααΆαααααΎαααααααααΎαααΆαα
ααΆαααααΆααΊααα’ααααΎααΆααααααα’αααααααΆαααααΆαααΈααα 3 BullSequana S200α ααΆαα½ααααα
αΌαααΆααααααΆαααα·ααααααα
ααα½α 9 αα·αααααΆααααα
ααα½α 3 ααααΌα
ααΆαααΆαααΈααα·αααα·ααααααΆαααααα»ααα»ααα
αααα»αααααΈααααΆαααΆαααααααΆαααΆαααΆαααΆααααααα’ααααΎ OpenStack Virtualization α ααααααααααα TeraSortα ααα ααααα»α 512 MB αααααααΆα
ααααα
ααα½αααΈααΆαα½αααΉαααΆαα’αα·αααααΈαααΊ 23,1 ααΆααΈα
ααΎααααααααα’αΆα αααααΈαααΆααααααααααΆ? αααααααααααααααααααααααααααΆααααααΆαα Data Lake Engineα
- ααααΆαααα·ααααααα αααααΆααααΆαα 40 TB ααααα ααααα’αΆα ααααΎααΆα
- ααααΆαααα·ααΆααααααΆααααααααΆαααα‘αΎα GPU
- αααααΎαααααααααα’αΆαααααααΎαααααΌαααΆαα’αΆααΈααααα (α§ααΆα αααααααα·αααΎα’αααααααΌαααΆα Kafka αα·ααααααααα)
αααα»αααααααΆα Atos Codex Data Lake Engine αα½αααΆαααΆαααααΆαααΈααααααα½αα―α αα·ααααααα·ααΈαααααΆαααα‘αΎαααΆαα»α αα½αααΆααα§ααααα Cloudera αααααΆαα’αΆααααΆαααααα Hadoop αααα½αααΆααααΆαα OpenStack ααΆαα½αααΉααααΆαααΈααα·αααα·ααααααα’ααααΎααΊααα RedHat Enterprise Linux ααΆαα
αααααα·αααααα αα·αααααααααααααα»ααα»α (αα½αααΆααααΆαααααΎααααΆααααααΆααααααα»ααα»α αα·α Cloudera BDR - ααΆαααααα»ααα»ααα·αααΆαααααααααααααααα αααααΆα) α Atos Codex Data Lake Engine ααΊααΆαααααααααΆααα·αααα·αααααΌααααααααααΌαααΆααααααΆαα
ααααα·αααΎα’αααα
αΆααα’αΆααααααααΎααααααΆααααα’α·α ααΎαααΉαααΈαααΆααααα»αααΆαααααΎααααα½αααααααΎααα
αααα»αααα·αααααα
ααααα: www.habr.com