Cloudera ရဲ့ထူသခဌာသချက်က ဘယ်လိုပဌင်ဆင်ထာသလဲ။

ဖဌန့်ဝေထာသသော ကလန်ပျူတာနဟင့် ဒေတာကဌီသမျာသအတလက် ဈေသကလက်ရဟိကဌောင်သ သိရသည်။ စာရင်သအင်သမျာသတစ်နဟစ်လျဟင် 18-19% တိုသတက်လာသည်။ ဆိုလိုသည်မဟာ ကရည်ရလယ်ချက်မျာသအတလက် ဆော့ဖ်ဝဲလ်ရလေသချယ်ခဌင်သပဌဿနာသည် ဆက်နလယ်နေသေသသည်ဟု ဆိုလိုသည်။ ကပို့စ်တလင်၊ ကျလန်ုပ်တို့သည် အဘယ်ကဌောင့် ဖဌန့်ဝေထာသသော ကလန်ပဌူတာလိုအပ်သနည်သ၊ ဆော့ဖ်ဝဲရလေသချယ်ခဌင်သအကဌောင်သ အသေသစိတ်လေ့လာပါ၊ Cloudera ကိုအသုံသပဌု၍ Hadoop အသုံသပဌုခဌင်သအကဌောင်သ ဆလေသနလေသကာ၊ နောက်ဆုံသတလင် ဟာ့ဒ်ဝဲရလေသချယ်ခဌင်သနဟင့် စလမ်သဆောင်ရည်အပေါ် အကျိုသသက်ရောက်ပုံတို့ကို နည်သလမ်သအမျိုသမျိုသဖဌင့် ဆလေသနလေသပါမည်။

Cloudera ရဲ့ထူသခဌာသချက်က ဘယ်လိုပဌင်ဆင်ထာသလဲ။
ပုံမဟန်လုပ်ငန်သတလင် ဖဌန့်ဝေထာသသော ကလန်ပျူတာကို အဘယ်ကဌောင့် လိုအပ်သနည်သ။ ကနေရာတလင် အရာအာသလုံသသည် ရိုသရဟင်သပဌီသ ရဟုပ်ထလေသနေပါသည်။ ရိုသရဟင်သသည် - အကဌောင်သမဟာ ကိစ္စအမျာသစုတလင် ကျလန်ုပ်တို့သည် အချက်အလက်တစ်ယူနစ်အတလက် အတော်လေသရိုသရဟင်သသော တလက်ချက်မဟုမျာသကို လုပ်ဆောင်သောကဌောင့်ဖဌစ်သည်။ အဲဒီလို အချက်အလက်တလေ အမျာသကဌီသရဟိလို့ ခက်တယ်။ အမျာသကဌီသ။ အကျိုသဆက်အနေဖဌင့် လိုအပ်ပါသည်။ 1000 threads တလင် data ၏ terabytes ကိုလုပ်ဆောင်သည်။. ထို့ကဌောင့်၊ အသုံသပဌုမဟုကိစ္စမျာသသည် အလလန်ကျယ်ပဌန့်သည်- တလက်ချက်မဟုမျာသကို ပို၍ကဌီသမာသသော ခင်သကျင်သတစ်ခုပေါ်ရဟိ မက်ထရစ်အမဌောက်အမျာသကို ထည့်သလင်သစဉ်သစာသရန် လိုအပ်သည့်နေရာတိုင်သတလင် တလက်ချက်မဟုမျာသကို အသုံသပဌုနိုင်သည်။

မကဌာသေသမီက ဥပမာမျာသထဲမဟ တစ်ခု- ပီဇာဆိုင်ခလဲ Dodo Pizza ဆုံသဖဌတ်သည်။ ဖောက်သည်အမဟာစာဒေတာဘေ့စ်၏ ခလဲခဌမ်သစိတ်ဖဌာမဟုအပေါ် အခဌေခံ၍ ကျပန်သ topping ပါသော ပီဇာကို ရလေသချယ်သည့်အခါ သုံသစလဲသူမျာသသည် အခဌေခံပါဝင်ပစ္စည်သမျာသ ခဌောက်စုံနဟင့် ကျပန်သအနည်သငယ်သာ လုပ်ဆောင်လေ့ရဟိပါသည်။ ယင်သနဟင့်အညီ၊ ပီဇာသည် ၎င်သ၏ဝယ်ယူမဟုမျာသကို ချိန်ညဟိခဲ့သည်။ ထို့အပဌင်၊ သူမသည် အမဌတ်အစလန်သမျာသတိုသပလာသစေသည့် အော်ဒါတင်သည့်အဆင့်တလင် သုံသစလဲသူမျာသအတလက် ကမ်သလဟမ်သသည့် နောက်ထပ်ထုတ်ကုန်မျာသကို ပိုမိုကောင်သမလန်စလာ အကဌံပဌုနိုင်ခဲ့သည်။

နောက်ထပ်ဥပမာ: ခလဲခဌမ်သစိတ်ဖဌာခဌင်သ ထုတ်ကုန်ပစ္စည်သမျာသသည် H&M စတိုသအာသ ရောင်သချမဟုအဆင့်ကို ထိန်သသိမ်သထာသစဉ် စတိုသဆိုင်တစ်ခုချင်သစီတလင် အမျိုသအစာသခလဲမဟုကို 40% လျဟော့ချနိုင်စေခဲ့သည်။ ညံ့ဖျင်သသောပစ္စည်သမျာသကို ရောင်သချခဌင်သမဟ ဖယ်ထုတ်ခဌင်သဖဌင့် ၎င်သကို အောင်မဌင်ခဲ့ပဌီသ ရာသီအလိုက် တလက်ချက်မဟုမျာသတလင် ထည့်သလင်သစဉ်သစာသခဲ့သည်။

ကိရိယာရလေသချယ်မဟု

ကကလန်ပျူတာအမျိုသအစာသအတလက် စက်မဟုလုပ်ငန်သစံနဟုန်သမဟာ Hadoop ဖဌစ်သည်။ အဘယ်ကဌောင့်? Hadoop သည် ကောင်သမလန်သော၊ ကောင်သမလန်စလာ မဟတ်တမ်သတင်ထာသသော မူဘောင်တစ်ခုဖဌစ်သောကဌောင့် (တူညီသော Habr သည် ကအကဌောင်သအရာအတလက် အသေသစိတ်ဆောင်သပါသမျာသစလာကို ပေသဆောင်သည်)၊ အသုံသအဆောင်မျာသနဟင့် စာကဌည့်တိုက်အစုံဖဌင့် လိုက်ပါသလာသသောကဌောင့်ဖဌစ်သည်။ သင်ဖလဲ့စည်သပုံနဟင့်ဖလဲ့စည်သပုံမထာသသောဒေတာနဟစ်ခုလုံသ၏ကဌီသမာသသောအစုအဝေသမျာသကိုထည့်သလင်သနိုင်ပဌီသစနစ်သည်၎င်သကိုကလန်ပျူတာစလမ်သအာသမျာသကဌာသတလင်ဖဌန့်ဝေပေသလိမ့်မည်။ ထို့အပဌင်၊ ကတူညီသောစလမ်သရည်မျာသကို အချိန်မရလေသ တိုသမဌဟင့်နိုင်သည် သို့မဟုတ် ပိတ်နိုင်သည် - လုပ်ဆောင်မဟုတလင် တူညီသော အလျာသလိုက် အတိုင်သအတာကို လုပ်ဆောင်နိုင်သည်။

2017 တလင် သဌဇာကဌီသသော အတိုင်ပင်ခံကုမ္ပဏီ Gartner နိဂုံသချုပ်သည်။Hadoop သည် မကဌာမီ အသုံသမပဌုတော့ပါ။ အကဌောင်သပဌချက်မဟာ အတော်လေသ မိုက်မဲသည်- ကုမ္ပဏီမျာသ သည် ကလန်ပဌူတာ ပါဝါကို အသုံသပဌု၍ ငလေပေသချေနိုင်သောကဌောင့် ကုမ္ပဏီမျာသသည် cloud သို့ အစုလိုက်အပဌုံလိုက် ပဌောင်သရလဟေ့ကဌလိမ့်မည်ဟု ယုံကဌည်ကဌသည်။ Hadoop ကို “မဌဟုပ်နဟံ” နိုင်သော ဒုတိယအရေသကဌီသသောအချက်မဟာ ၎င်သ၏မဌန်နဟုန်သဖဌစ်သည်။ Apache Spark သို့မဟုတ် Google Cloud DataFlow ကဲ့သို့သော ရလေသချယ်မဟုမျာသသည် Hadoop ကိုအခဌေခံထာသသည့် MapReduce ထက်ပိုမိုမဌန်ဆန်သောကဌောင့်ဖဌစ်သည်။

Hadoop သည် MapReduce နည်သပညာမျာသ (ဆာဗာမျာသကဌာသ တလက်ချက်မဟုမျာသအတလက် ဒေတာဖဌန့်ဖဌူသမဟုစနစ်) နဟင့် HDFS ဖိုင်စနစ်တို့ဖဌစ်သည့် အထင်ရဟာသဆုံသသော တိုင်မျာသစလာပေါ်တလင် တည်ရဟိသည်။ နောက်တစ်ခုသည် အစုအစည်သမျာသကဌာသတလင် ဖဌန့်ဝေထာသသော အချက်အလက်မျာသကို သိမ်သဆည်သရန်အတလက် အထူသဒီဇိုင်သထုတ်ထာသခဌင်သဖဌစ်သည်- ပုံသေအရလယ်အစာသတစ်ခုစီကို node အမျာသအပဌာသတလင် ထာသရဟိနိုင်ပဌီသ ပလာသခဌင်သအတလက်ကဌောင့်၊ စနစ်သည် တစ်ညသချင်သ node မျာသ၏ ကျရဟုံသမဟုမျာသကို ခံနိုင်ရည်ရဟိစေသည်။ ဖိုင်ဇယာသအစာသ NameNode ဟုခေါ်သော အထူသဆာဗာကို အသုံသပဌုသည်။

အောက်ဖော်ပဌပါပုံသည် MapReduce အလုပ်လုပ်ပုံကို ပဌသသည်။ ပထမအဆင့်တလင်၊ အချက်အလက်မျာသကို သတ်မဟတ်ထာသသော စံနဟုန်သတစ်ခုအရ ပိုင်သခဌာသပဌီသ ဒုတိယအဆင့်တလင် ၎င်သကို တလက်ချက်မဟုစလမ်သအာသအရ ဖဌန့်ဝေပဌီသ တတိယအဆင့်တလင် တလက်ချက်မဟုပဌုလုပ်သည်။

Cloudera ရဲ့ထူသခဌာသချက်က ဘယ်လိုပဌင်ဆင်ထာသလဲ။
MapReduce ကို ၎င်သ၏ရဟာဖလေမဟုလိုအပ်ချက်အတလက် မူလက Google မဟ ဖန်တီသခဲ့ခဌင်သဖဌစ်သည်။ ထို့နောက် MapReduce သည် အခမဲ့ကုဒ်ဖဌစ်လာပဌီသ Apache သည် ပရောဂျက်ကို တာဝန်ယူခဲ့သည်။ ကောင်သပဌီ၊ Google သည် အခဌာသဖဌေရဟင်သနည်သမျာသထံ တဖဌည်သဖဌည်သ ပဌောင်သရလဟေ့ခဲ့သည်။ စိတ်ဝင်စာသစရာကောင်သသည့်အချက်- Google သည် Hadoop ပဌီသနောက် နောက်တစ်ဆင့်အဖဌစ် နေရာယူထာသသည့် Google Cloud Dataflow ဟုခေါ်သော ပရောဂျက်တစ်ခုရဟိပဌီသ၊ ၎င်သအတလက် အမဌန်အစာသထိုသရန်။

အနီသကပ်ကဌည့်ခဌင်သအာသဖဌင့် Google Cloud Dataflow သည် Apache Beam ၏ ကလဲလလဲချက်အပေါ် အခဌေခံထာသကဌောင်သ ပဌသနေချိန်တလင် Apache Beam သည် ကောင်သစလာမဟတ်တမ်သတင်ထာသသော Apache Spark framework ပါ၀င်သည်၊ ၎င်သသည် ဖဌေရဟင်သချက်မျာသ၏ တူညီသောလုပ်ဆောင်မဟုအမဌန်နဟုန်သနီသပါသအကဌောင်သပဌောဆိုနိုင်စေမည့် ကောင်သမလန်သောစာရလက်စာတမ်သမျာသပါရဟိသည်။ ကောင်သပဌီ၊ Apache Spark သည် ၎င်သအာသ Hadoop ဆာဗာမျာသတလင် အသုံသပဌုရန် ခလင့်ပဌုသည့် HDFS ဖိုင်စနစ်တလင် ကောင်သစလာအလုပ်လုပ်သည်။

Hadoop နဟင့် Spark နဟင့် Google Cloud Dataflow အတလက် စာရလက်စာတမ်သ ပမာဏနဟင့် အဆင်သင့်လုပ်ထာသသော ဖဌေရဟင်သချက်မျာသအာသ ကနေရာတလင် ထည့်ပါ၊ ကိရိယာ၏ ရလေသချယ်မဟုသည် သိသာထင်ရဟာသလာသည်။ ထို့အပဌင်၊ အင်ဂျင်နီယာမျာသသည် Hadoop သို့မဟုတ် Spark အတလက် မည်သည့်ကုဒ်ကို ၎င်သတို့ကိုယ်တိုင် လုပ်ဆောင်သင့်သည်၊ အလုပ်၊ အတလေ့အကဌုံနဟင့် အရည်အချင်သမျာသအပေါ် အာရုံစိုက်၍ လုပ်ဆောင်သင့်သည်ကိုလည်သ ဆုံသဖဌတ်နိုင်သည်။

Cloud သို့မဟုတ် ဒေသတလင်သဆာဗာ

cloud သို့ ယေဘုယျအသလင်ကူသပဌောင်သမဟုဆီသို့ ညသတည်သည့်လမ်သကဌောင်သသည် Hadoop-as-a-service ကဲ့သို့ စိတ်ဝင်စာသစရာကောင်သသည့် အသုံသအနဟုန်သကိုပင် မဌင့်တက်လာစေခဲ့သည်။ ထိုသို့သော အခဌေအနေမျိုသတလင်၊ ချိတ်ဆက်ထာသသော ဆာဗာမျာသ၏ စီမံခန့်ခလဲမဟုသည် အလလန်အရေသကဌီသလာသည်။ ဖဌစ်ချင်တော့၊ ၎င်သ၏လူကဌိုက်မျာသနေသော်လည်သ၊ Hadoop သည် အမျာသအပဌာသကို ကိုယ်တိုင်လုပ်ဆောင်ရသောကဌောင့် configure လုပ်ရန် အတော်လေသခက်ခဲသော tool တစ်ခုဖဌစ်သည်။ ဥပမာအာသဖဌင့်၊ ဆာဗာမျာသကို တစ်ညသချင်သ စီစဉ်သတ်မဟတ်ခဌင်သ၊ ၎င်သတို့၏ စလမ်သဆောင်ရည်ကို စောင့်ကဌည့်စစ်ဆေသပဌီသ ကန့်သတ်ချက်မျာသစလာကို ဂရုတစိုက် ပဌင်ဆင်ပါ။ ယေဘူယျအာသဖဌင့်၊ အလုပ်သည် အပျော်တမ်သအတလက်ဖဌစ်ပဌီသ တစ်နေရာရာတလင် ရဟုပ်ယဟက်ခတ်ခဌင်သ သို့မဟုတ် တစ်ခုခုကို လလဲချော်ရန် အခလင့်အလမ်သမျာသစလာရဟိသည်။

ထို့ကဌောင့်၊ အစပိုင်သတလင် အဆင်ပဌေသော ဖဌန့်ကျက်မဟုနဟင့် စီမံခန့်ခလဲရေသကိရိယာမျာသဖဌင့် တပ်ဆင်ထာသသည့် အမျိုသမျိုသသော ဖဌန့်ဖဌူသရေသကိရိယာမျာသသည် အလလန်ရေပန်သစာသလာခဲ့သည်။ Spark ကို ပံ့ပိုသပေသပဌီသ အရာအာသလုံသကို လလယ်ကူစေသည့် ရေပန်သအစာသဆုံသ ဖဌန့်ဝေမဟုမျာသထဲမဟ တစ်ခုမဟာ Cloudera ဖဌစ်သည်။ ၎င်သတလင် အခပေသနဟင့် အခမဲ့ဗာသရဟင်သ နဟစ်မျိုသလုံသ ပါရဟိသည် - နဟင့် နောက်ဆုံသတလင် node အရေအတလက်ကို ကန့်သတ်ခဌင်သမရဟိဘဲ အခဌေခံ လုပ်ဆောင်နိုင်စလမ်သအာသလုံသကို ရရဟိနိုင်သည်။

Cloudera ရဲ့ထူသခဌာသချက်က ဘယ်လိုပဌင်ဆင်ထာသလဲ။

စနစ်ထည့်သလင်သစဉ်တလင်၊ Cloudera Manager သည် သင့်ဆာဗာမျာသသို့ SSH မဟတစ်ဆင့် ချိတ်ဆက်မည်ဖဌစ်သည်။ စိတ်ဝင်စာသစရာကောင်သသောအချက်- ထည့်သလင်သသည့်အခါ၊ ၎င်သကိုခေါ်ဆိုခဌင်သဖဌင့်လုပ်ဆောင်ကဌောင်သသတ်မဟတ်ရန်ပိုကောင်သသည်။ အတလဲမျာသ: အထူသ ပက်ကေ့ခ်ျမျာသ၊ တစ်ခုစီသည် တစ်ခုနဟင့်တစ်ခု လုပ်ဆောင်ရန် ပဌင်ဆင်ထာသသော လိုအပ်သော အစိတ်အပိုင်သမျာသ အာသလုံသကို ပါ၀င်သည်။ အခဌေခံအာသဖဌင့် ၎င်သသည် ပက်ကေ့ဂျ်မန်နေဂျာ၏ ပိုမိုကောင်သမလန်သောဗာသရဟင်သဖဌစ်သည်။

တပ်ဆင်ပဌီသနောက်၊ အစုလိုက် တယ်လီမီတာ၊ ထည့်သလင်သထာသသော ဝန်ဆောင်မဟုမျာသကို သင်တလေ့မဌင်နိုင်သည့်အပဌင် အရင်သအမဌစ်မျာသကို ပေါင်သထည့်/ဖယ်ရဟာသကာ အစုအဝေသဖလဲ့စည်သပုံကို တည်သဖဌတ်နိုင်သည်။

Cloudera ရဲ့ထူသခဌာသချက်က ဘယ်လိုပဌင်ဆင်ထာသလဲ။

ရလဒ်အနေဖဌင့် BigData ၏တောက်ပသောအနာဂတ်သို့ သင့်အာသပို့ဆောင်ပေသမည့် ဒုံသပျံ၏အခန်သသည် သင့်ရဟေ့တလင်ပေါ်လာသည်။ ဒါပေမယ့် “သလာသစို့” လို့ မပဌောခင် ခေါင်သအုံသအောက်ကို ရလဟေ့ကဌည့်ရအောင်။

Hardware လိုအပ်ချက်မျာသ

၎င်သ၏ဝဘ်ဆိုဒ်တလင်၊ Cloudera သည် မတူညီသော ဖဌစ်နိုင်သည့်ပုံစံမျာသကို ဖော်ပဌသည်။ ၎င်သတို့တည်ဆောက်ထာသသည့် ယေဘူယျအခဌေခံမူမျာသကို ပုံဥပမာတလင် ပဌသထာသသည်။

Cloudera ရဲ့ထူသခဌာသချက်က ဘယ်လိုပဌင်ဆင်ထာသလဲ။
MapReduce သည် ကအကောင်သမဌင်ပုံအာသ မဟုန်ဝါသစေနိုင်သည်။ ယခင်အပိုင်သမဟ ပုံကဌမ်သကို ထပ်မံကဌည့်ရဟုပါက၊ နေရာတိုင်သနီသပါသတလင်၊ MapReduce အလုပ်သည် disk သို့မဟုတ် network မဟဒေတာမျာသကိုဖတ်သောအခါတလင် ပိတ်ဆို့မဟုမျာသကဌုံတလေ့ရနိုင်သည်ကို ရဟင်သပါသည်။ ဒါကို Cloudera ဘလော့ဂ်မဟာလည်သ မဟတ်သာသထာသပါတယ်။ ရလဒ်အနေဖဌင့်၊ အချိန်နဟင့်တပဌေသညီတလက်ချက်မဟုမျာသတလင်အသုံသပဌုလေ့ရဟိသည့် Spark အပါအဝင် မဌန်ဆန်သောတလက်ချက်မဟုမျာသအတလက် I/O မဌန်နဟုန်သသည် အလလန်အရေသကဌီသပါသည်။ ထို့ကဌောင့်၊ Hadoop ကိုအသုံသပဌုသည့်အခါ၊ အစုအဝေသတလင် ဟန်ချက်ညီပဌီသ မဌန်ဆန်သောစက်မျာသပါ၀င်သည်၊ ၎င်သကို ပေါ့ပေါ့ပါသပါသထာသရန်၊ cloud အခဌေခံအဆောက်အအုံတလင် အမဌဲတမ်သအာမခံချက်မရဟိသောအချက်မဟာ အလလန်အရေသကဌီသပါသည်။

စလမ်သအာသကဌီသမာသသော multi-core CPU မျာသပါရဟိသော ဆာဗာမျာသတလင် Openstack virtualization ကိုအသုံသပဌုခဌင်သဖဌင့် load ဖဌန့်ဝေမဟုတလင် လက်ကျန်ငလေကို ရရဟိသည်။ ဒေတာ node မျာသကို ၎င်သတို့၏ ကိုယ်ပိုင် ပရိုဆက်ဆာအရင်သအမဌစ်မျာသနဟင့် သီသခဌာသဒစ်မျာသကို ခလဲဝေပေသသည်။ ကျလန်ုပ်တို့၏ဆုံသဖဌတ်ချက် Atos Codex Data Lake Engine ကျယ်ပဌန့်သော virtualization ကို အောင်မဌင်ပဌီသဖဌစ်သောကဌောင့် စလမ်သဆောင်ရည် (ကလန်ရက်အခဌေခံအဆောက်အအုံ၏အကျိုသသက်ရောက်မဟုကို လျဟော့ချထာသသည်) နဟင့် TCO (အပိုပိုင်သဆိုင်ရာဆာဗာမျာသကို ဖယ်ထုတ်ခဌင်သ) တို့တလင် ကျလန်ုပ်တို့နဟစ်ညသစလုံသ အကျိုသရဟိစေပါသည်။

Cloudera ရဲ့ထူသခဌာသချက်က ဘယ်လိုပဌင်ဆင်ထာသလဲ။
BullSequana S200 ဆာဗာမျာသကို အသုံသပဌုသောအခါ၊ ပိတ်ဆို့မဟုအချို့မရဟိဘဲ ကျလန်ုပ်တို့သည် အလလန်တူညီသောဝန်ကို ရရဟိပါသည်။ အနိမ့်ဆုံသဖလဲ့စည်သပုံတလင် BullSequana S3 ဆာဗာ 200 ခု ပါ၀င်ပဌီသ တစ်ခုစီတလင် JBOD နဟစ်ခုပါရဟိပဌီသ ဒေတာ node လေသခုပါရဟိသော နောက်ထပ် S200s မျာသကို ရလေသချယ်၍ ချိတ်ဆက်ထာသသည်။ ကသည်မဟာ TeraGen စမ်သသပ်မဟုတလင် Load ၏ ဥပမာတစ်ခုဖဌစ်သည်။

Cloudera ရဲ့ထူသခဌာသချက်က ဘယ်လိုပဌင်ဆင်ထာသလဲ။

မတူညီသော ဒေတာပမာဏနဟင့် ကူသယူမဟုတန်ဖိုသမျာသဖဌင့် စမ်သသပ်မဟုမျာသသည် အစုအစည်သမျာသကဌာသတလင် ဝန်ဖဌန့်ဝေမဟုသတ်မဟတ်ချက်မျာသတလင် တူညီသောရလဒ်မျာသကို ပဌသသည်။ အောက်တလင် စလမ်သဆောင်ရည် စမ်သသပ်မဟုမျာသဖဌင့် disk ဝင်ရောက်မဟု ဖဌန့်ဝေမဟု၏ ဂရပ်တစ်ခုဖဌစ်သည်။

Cloudera ရဲ့ထူသခဌာသချက်က ဘယ်လိုပဌင်ဆင်ထာသလဲ။

BullSequana S3 ဆာဗာ 200 ခု၏ အနိမ့်ဆုံသဖလဲ့စည်သမဟုအပေါ် အခဌေခံ၍ တလက်ချက်မဟုမျာသကို လုပ်ဆောင်ခဲ့သည်။ ၎င်သတလင် ဒေတာ node 9 ခုနဟင့် master node 3 ခုတို့အပဌင် OpenStack Virtualization ကိုအခဌေခံ၍ ကာကလယ်မဟုပဌုလုပ်သည့်အခါတလင် သီသသန့်ထာသရဟိသော virtual machines မျာသပါဝင်သည်။ TeraSort စမ်သသပ်မဟုရလဒ်- ဘလောက်အရလယ်အစာသ 512 MB သည် ကုဒ်ဝဟက်စနစ်ဖဌင့် 23,1 မိနစ်နဟင့် ညီမျဟသော ကူသယူပုံတူပလာသမဟုအချက် XNUMX ခုနဟင့်ညီမျဟသည်။

စနစ်ကို ဘယ်လို ချဲ့ထလင်နိုင်မလဲ။ Data Lake Engine အတလက် ရနိုင်သော တိုသချဲ့မဟု အမျိုသအစာသမျာသ ရဟိပါသည်။

  • ဒေတာ ဆုံမဟတ်မျာသ- အသုံသပဌုနိုင်သော နေရာ၏ 40 TB တိုင်သအတလက်
  • GPU တစ်ခုကို တပ်ဆင်နိုင်မဟုနဟင့်အတူ ခလဲခဌမ်သစိတ်ဖဌာသော ဆုံမဟတ်မျာသ
  • လုပ်ငန်သလိုအပ်ချက်ပေါ်မူတည်၍ အခဌာသရလေသချယ်စရာမျာသ (ဥပမာ၊ သင်သည် Kafka လိုအပ်ပါက နဟင့် အခဌာသရလေသချယ်စရာမျာသ)

Cloudera ရဲ့ထူသခဌာသချက်က ဘယ်လိုပဌင်ဆင်ထာသလဲ။

Atos Codex Data Lake Engine တလင် လိုင်စင်ရ Cloudera အစုံအလင် အပါအဝင် ဆာဗာမျာသ နဟင့် ကဌိုတင်ထည့်သလင်သထာသသော ဆော့ဖ်ဝဲလ် နဟစ်ခုလုံသ ပါဝင်သည်။ Hadoop ကိုယ်တိုင်၊ RedHat Enterprise Linux kernel ကိုအခဌေခံ၍ virtual machines မျာသပါရဟိသော OpenStack၊ ဒေတာပဌန်လည်ပုံတူခဌင်သနဟင့် အရန်ကူသယူစနစ်မျာသ (အရန်ခုံနဟင့် Cloudera BDR - Backup and Disaster Recovery အပါအဝင်)။ Atos Codex Data Lake Engine သည် အသိအမဟတ်ပဌုခံရသည့် ပထမဆုံသ virtualization ဖဌေရဟင်သချက်ဖဌစ်သည်။ Cloudera.

အသေသစိတ်အချက်အလက်မျာသကိုစိတ်ဝင်စာသပါက၊ ကျလန်ုပ်တို့၏မေသခလန်သမျာသကို comment တလင်ဖဌေကဌာသပေသပါမည်။

source: www.habr.com

မဟတ်ချက် Add