YARN တလင် Spark ကို ပဌင်ဆင်ခဌင်သ

ဟာဘ၊ မင်္ဂလာပါ။ မနေ့က Apache Spark အတလက် ရည်ရလယ်ထာသသော တလေ့ဆုံမဟုRambler&Co မဟ ယောက်ျာသလေသမျာသထံမဟ၊ ကကိရိယာကို ပဌင်ဆင်သတ်မဟတ်ခဌင်သနဟင့် ပတ်သက်သည့် ပါဝင်သူမျာသထံမဟ မေသခလန်သမျာသစလာရဟိခဲ့သည်။ သူ့ခဌေရာအတိုင်သလိုက်ဖို့ ဆုံသဖဌတ်ပဌီသ အတလေ့အကဌုံတလေကို မျဟဝေခဲ့ပါတယ်။ ခေါင်သစဉ်သည် မလလယ်ကူပါ - ထို့ကဌောင့် ကျလန်ုပ်တို့သည် သင့်အတလေ့အကဌုံကို မဟတ်ချက်မျာသတလင် မျဟဝေရန် သင့်အာသ ဖိတ်ခေါ်ပါသည်၊ ကျလန်ုပ်တို့လည်သ နာသလည်ပဌီသ မဟာသယလင်သသော တစ်ခုခုကို အသုံသပဌုနိုင်ပါသည်။

Spark ကိုအသုံသပဌုပုံအကဌောင်သ အနည်သငယ်မိတ်ဆက်ပေသပါရစေ။ ကျလန်တော်တို့မဟာ သုံသလအစီအစဉ်ရဟိတယ်။ “ဒေတာပညာရဟင်ကဌီသ”နဟင့် ဒုတိယ သင်ခန်သစာ တစ်လျဟောက်လုံသ ကျလန်ုပ်တို့၏ ပါဝင်သူမျာသသည် ကတူရိယာကို လုပ်ဆောင်ပါသည်။ ထို့ကဌောင့်၊ စီစဉ်သူမျာသအနေဖဌင့် ကျလန်ုပ်တို့၏တာဝန်မဟာ ထိုသို့သောကိစ္စရပ်အတလင်သ အသုံသပဌုရန်အတလက် အစုအဖလဲ့ကို ပဌင်ဆင်ရန်ဖဌစ်သည်။

ကျလန်ုပ်တို့၏အသုံသပဌုမဟု၏ထူသခဌာသချက်မဟာ Spark ကိုတစ်ပဌိုင်နက်တည်သလုပ်ဆောင်နေသောလူအရေအတလက်သည်တစ်ဖလဲ့လုံသနဟင့်တူညီနိုင်သည်။ ဥပမာအာသဖဌင့်၊ ဆလေသနလေသပလဲတစ်ခုမဟာ လူတိုင်သက တစ်ချိန်တည်သမဟာ တစ်ခုခုကဌိုသစာသပဌီသ ငါတို့ရဲ့ဆရာနောက်မဟာ ထပ်ပဌောတဲ့အခါ။ ဒါကအမျာသကဌီသမဟုတ်ပါဘူသ - တစ်ခါတစ်ရံလူ 40 အထိ။ ကမ္ဘာပေါ်တလင် ထိုသို့သောအသုံသပဌုမဟုကိစ္စနဟင့် ရင်ဆိုင်နေရသော ကုမ္ပဏီမျာသစလာ မရဟိပါ။

ထို့နောက်၊ ကျလန်ုပ်တို့သည် အချို့သော config parameters မျာသကို မည်သို့ရလေသချယ်ခဲ့သည်ကို ပဌောပဌပါမည်။

အစကနေ စလိုက်ရအောင်။ Spark တလင် အစုအဝေသတစ်ခုပေါ်တလင် လုပ်ဆောင်ရန် ရလေသချယ်စရာ 3 ခု ရဟိသည်- သီသသန့်၊ Mesos ကိုအသုံသပဌုခဌင်သနဟင့် YARN ကိုအသုံသပဌုခဌင်သ။ ကျလန်ုပ်တို့အတလက် အဓိပ္ပါယ်ရဟိသောကဌောင့် တတိယရလေသချယ်မဟုကို ရလေသချယ်ရန် ဆုံသဖဌတ်ခဲ့သည်။ ကျလန်ုပ်တို့တလင် hadoop အစုအဝေသတစ်ခု ရဟိနဟင့်ပဌီသဖဌစ်သည်။ ကျလန်ုပ်တို့၏ပါဝင်သူမျာသသည် ၎င်သ၏ဗိသုကာပညာကို ကောင်သစလာသိပဌီသဖဌစ်သည်။ YARN သုံသကဌည့်ရအောင်။

spark.master=yarn

ပိုစိတ်ဝင်စာသဖို့ကောင်သတယ်။ က အသုံသချမဟု ရလေသချယ်စရာ 3 ခု တစ်ခုစီတလင် အသုံသချမဟု ရလေသချယ်စရာ 2 ခု ရဟိသည်- client နဟင့် cluster ။ အခဌေခံ စာရလက်စာတမ်သ အင်တာနက်ပေါ်ရဟိ လင့်ခ်အမျိုသမျိုသနဟင့်၊ client သည် အပဌန်အလဟန်အကျိုသပဌုသောအလုပ်အတလက် သင့်လျော်သည်ဟု ကျလန်ုပ်တို့ကောက်ချက်ချနိုင်သည် - ဥပမာအာသဖဌင့်၊ jupyter notebook နဟင့် cluster သည် ထုတ်လုပ်မဟုဖဌေရဟင်သချက်မျာသအတလက် ပိုသင့်လျော်ပါသည်။ ကျလန်ုပ်တို့၏ကိစ္စတလင်၊ ကျလန်ုပ်တို့သည် အပဌန်အလဟန်အကျိုသပဌုသောအလုပ်ကို စိတ်ဝင်စာသခဲ့သည်၊ ထို့ကဌောင့်၊

spark.deploy-mode=client

ယေဘုယျအာသဖဌင့်၊ ယခုမဟစပဌီသ Spark သည် YARN တလင် တစ်နည်သနည်သဖဌင့် လုပ်ဆောင်နိုင်သော်လည်သ ၎င်သသည် ကျလန်ုပ်တို့အတလက် မလုံလောက်ပါ။ ကျလန်ုပ်တို့တလင် ဒေတာကဌီသကဌီသမာသမာသနဟင့်ပတ်သက်သည့် ပရိုဂရမ်တစ်ခုရဟိသောကဌောင့် တစ်ခါတစ်ရံတလင် ပါဝင်သူမျာသသည် အရင်သအမဌစ်မျာသကို ပိုင်သဖဌတ်ခဌင်သ၏ဘောင်အတလင်သ၌ ရရဟိသောအရာမျာသကို လုံလောက်စလာမရရဟိကဌပါ။ ပဌီသတော့ စိတ်ဝင်စာသစရာကောင်သတဲ့အချက် - တက်ကဌလတဲ့အရင်သအမဌစ်ခလဲဝေမဟု။ အတိုချုပ်ပဌောရလျဟင် အချက်မဟာ ကအရာဖဌစ်သည်- အကယ်၍ သင့်တလင် ခက်ခဲသောအလုပ်တစ်ခုရဟိပဌီသ အစုအဖလဲ့သည် အခမဲ့ဖဌစ်သည် (ဥပမာ၊ နံနက်ပိုင်သ)၊ ထို့နောက် ကရလေသချယ်မဟုကို Spark ကိုအသုံသပဌုခဌင်သဖဌင့် သင့်အာသ နောက်ထပ်အရင်သအမဌစ်မျာသကို ပေသနိုင်ပါသည်။ လိုအပ်ချက်မျာသကို ကောက်ကျစ်သော ပုံသေနည်သအရ တလက်ချက်သည်။ အသေသစိတ်အချက်အလက်မျာသကိုကျလန်ုပ်တို့မလေ့လာပါ - ၎င်သသည်ကောင်သစလာအလုပ်လုပ်သည်။

spark.dynamicAllocation.enabled=true

ကျလန်ုပ်တို့သည် ကသတ်မဟတ်ချက်ကို သတ်မဟတ်ပဌီသ စတင်ချိန်တလင် Spark ပျက်သလာသပဌီသ မစတင်ပါ။ မဟန်တယ် ဆိုတော့ ကျလန်တော် ဖတ်ခဲ့ရတယ်။ စာရလက်စာတမ်သ ပိုဂရုတစိုက်။ အရာအာသလုံသ အဆင်ပဌေစေရန်အတလက် အပိုဘောင်တစ်ခုကိုလည်သ ဖလင့်ထာသရန် လိုအပ်သည်ဟု ၎င်သကဆိုသည်။

spark.shuffle.service.enabled=true

ဘာကဌောင့် လိုအပ်တာလဲ။ ကျလန်ုပ်တို့၏အလုပ်သည် အရင်သအမဌစ်မျာသစလာမလိုအပ်တော့သည့်အခါ Spark သည် ၎င်သတို့ကို ဘုံရေကန်သို့ ပဌန်ပေသသင့်သည်။ MapReduce လုပ်စရာအာသလုံသနီသပါသတလင် အချိန်ကုန်ဆုံသအဆင့်မဟာ မဌူသကဌလသည့်အဆင့်ဖဌစ်သည်။ ကအဆင့်သတ်မဟတ်ချက်သည် သင့်အာသ ကအဆင့်တလင် ထုတ်ပေသသည့်ဒေတာကို သိမ်သဆည်သနိုင်ပဌီသ စီမံအုပ်ချုပ်သူမျာသကို လျော်ညီစလာ ထုတ်ပဌန်နိုင်စေမည်ဖဌစ်သည်။ ပဌီသတော့ executor က အလုပ်သမာသအပေါ် အရာအာသလုံသကို တလက်ချက်ပေသတဲ့ လုပ်ငန်သစဉ်ပါ။ ၎င်သတလင် အချို့သော ပရိုဆက်ဆာ Core အရေအတလက်နဟင့် မဟတ်ဉာဏ်ပမာဏအချို့ ရဟိသည်။

ကသတ်မဟတ်ချက်ကို ထည့်သလင်သပဌီသဖဌစ်သည်။ အရာအာသလုံသက အလုပ်ဖဌစ်ပုံရသည်။ ပါဝင်သူမျာသသည် ၎င်သတို့ကို လိုအပ်သောအခါတလင် အရင်သအမဌစ်မျာသ ပိုမိုပေသအပ်ခဲ့ကဌောင်သ သိသာထင်ရဟာသလာသည်။ သို့သော် အခဌာသပဌဿနာတစ်ခု ပေါ်လာသည်- တစ်ချိန်ချိန်တလင် အခဌာသပါဝင်သူမျာသ နိုသလာပဌီသ Spark ကို အသုံသပဌုလိုသော်လည်သ ထိုနေရာတလင် အရာအာသလုံသ အလုပ်ရဟုပ်နေပဌီသ ၎င်သတို့သည် မပျော်မရလဟင် ဖဌစ်နေကဌသည်။ သူတို့နာသလည်နိုင်တယ်။ စာရလက်စာတမ်သတလေကို စတင်ကဌည့်ရဟုခဲ့ကဌတယ်။ လုပ်ငန်သစဉ်ကို လလဟမ်သမိုသရန် အသုံသပဌုနိုင်သည့် အခဌာသသော ကန့်သတ်ချက်မျာသ မျာသစလာရဟိနေကဌောင်သ တလေ့ရဟိရပါသည်။ ဥပမာအာသဖဌင့်၊ executor သည် standby mode တလင်ရဟိနေပါက၊ အရင်သအမဌစ်မျာသကိုမည်သည့်အချိန်မဟထုတ်ယူနိုင်မည်နည်သ။

spark.dynamicAllocation.executorIdleTimeout=120s

ကျလန်ုပ်တို့၏အခဌေအနေတလင်၊ သင်၏တရာသစီရင်ရေသမဟူသမျာသသည် နဟစ်မိနစ်ကဌာအောင် ဘာမဟမလုပ်ပါက၊ ၎င်သတို့ကို ဘုံရေကန်သို့ ပဌန်ပို့ပေသပါ။ ဒါပေမယ့် ဒီသတ်မဟတ်ချက်က အမဌဲတမ်သ မလုံလောက်ပါဘူသ။ ထိုလူသည် အချိန်အတော်ကဌာအောင် ဘာမဟမလုပ်ဘဲ၊ အရင်သအမဌစ်မျာသ မလလတ်မဌောက်ကဌောင်သ ထင်ရဟာသပါသည်။ ကက်ရဟ်ဒေတာပါရဟိသော executors ကိုရလေသချယ်ရန် မည်သည့်အချိန်ပဌီသနောက်တလင် အထူသကန့်သတ်ဘောင်တစ်ခုလည်သ ရဟိနေကဌောင်သ တလေ့ရဟိရပါသည်။ မူရင်သအာသဖဌင့်၊ ကကန့်သတ်ချက်သည် အဆုံသမရဟိဖဌစ်သည်။ အဲဒါကို ကျလန်တော်တို့ ပဌင်တယ်။

spark.dynamicAllocation.cachedExecutorIdleTimeout=600s

ဆိုလိုသည်မဟာ၊ သင်၏တရာသစီရင်ရေသမဟူသမျာသသည် ၅ မိနစ်ကဌာမျဟ ဘာမဟမလုပ်ပါက၊ ၎င်သတို့ကို ဘုံရေကန်သို့ ပေသလိုက်ပါ။ ကမုဒ်တလင်၊ အသုံသပဌုသူအမျာသအပဌာသအတလက် အရင်သအမဌစ်မျာသကို ထုတ်လလဟတ်ခဌင်သနဟင့် ထုတ်ပေသခဌင်သ၏ အမဌန်နဟုန်သသည် သင့်တင့်လျောက်ပတ်သည်။ မကျေမနပ်ဖဌစ်မဟု ပမာဏ လျော့သလာသပါပဌီ။ သို့သော် ကျလန်ုပ်တို့သည် ထပ်ဆင့်သလာသရန် ဆုံသဖဌတ်ပဌီသ လျဟောက်လလဟာတစ်ခုလျဟင် အမျာသဆုံသ စီမံအုပ်ချုပ်သူ အရေအတလက်ကို ကန့်သတ်ရန် ဆုံသဖဌတ်ခဲ့သည် - အခဌေခံအာသဖဌင့် ပရိုဂရမ်ပါဝင်သူ တစ်ညသစီအတလက် ဖဌစ်သည်။

spark.dynamicAllocation.maxExecutors=19

အခု၊ တစ်ဖက်မဟာ မကျေနပ်တဲ့သူတလေရဟိတယ် - "အစုအဝေသက ဘာမဟမလုပ်ဘဲ၊ ငါ့မဟာ အမဟုစီရင်သူ ၁၉ ယောက်ပဲရဟိတယ်" ဒါပေမယ့် မင်သဘာလုပ်နိုင်မလဲ။ မဟန်ကန်တဲ့ ချိန်ခလင်လျဟာမျိုသလိုတယ်။ လူတိုင်သကို ပျော်ရလဟင်အောင် မလုပ်နိုင်ပါဘူသ။

ကျလန်ုပ်တို့၏ဖဌစ်ရပ်နဟင့်ပတ်သက်သော နောက်ထပ်အသေသစိတ်အကဌောင်သအရာတစ်ခု။ တစ်နည်သတစ်ဖုံအာသဖဌင့် လူမျာသစလာသည် လက်တလေ့သင်ခန်သစာအတလက် နောက်ကျခဲ့ကဌပဌီသ အကဌောင်သတစ်ခုခုကဌောင့် Spark သည် ၎င်သတို့အတလက် မစတင်ခဲ့ပေ။ အခမဲ့အရင်သအမဌစ်မျာသ ပမာဏကို ကျလန်ုပ်တို့ကဌည့်ရဟုခဲ့သည်- ထိုနေရာတလင် ရဟိနေပုံရသည်။ မီသပလာသစတင်သင့်သည်။ ကံကောင်သထောက်မစလာ၊ ထိုအချိန်တလင် စာရလက်စာတမ်သမျာသကို တစ်နေရာရာသို့ subcortex တလင်ထည့်သလင်သထာသပဌီသဖဌစ်ပဌီသ စတင်သည့်အခါ Spark သည် စတင်မည့် port ကိုရဟာဖလေနေကဌောင်သ ကျလန်ုပ်တို့သတိရမိသည်။ အကလာအဝေသရဟိ ပထမ port သည် အလုပ်မျာသနေပါက၊ ၎င်သသည် အစဉ်လိုက်အတိုင်သ နောက်တစ်ခုသို့ ရလဟေ့သည်။ အလကာသရရင် ဖမ်သတယ်။ ပဌီသတော့ ဒီအတလက် အမျာသဆုံသ ကဌိုသစာသမဟု အရေအတလက်ကို ညလဟန်ပဌတဲ့ ကန့်သတ်ချက်တစ်ခု ရဟိပါတယ်။ မူရင်သမဟာ 16 ဖဌစ်သည်။ နံပါတ်သည် အတန်သရဟိ ကျလန်ုပ်တို့၏အဖလဲ့ရဟိ လူအရေအတလက်ထက် နည်သပါသည်။ ထို့ကဌောင့်၊ 16 ကဌိမ်ကဌိုသစာသပဌီသနောက် Spark သည်လက်လျဟော့ပဌီသ ကျလန်ုပ်မစတင်နိုင်တော့ကဌောင်သပဌောခဲ့သည်။ ကျလန်ုပ်တို့သည် ကကန့်သတ်ချက်ကို ပဌုပဌင်ပဌီသဖဌစ်သည်။

spark.port.maxRetries=50

ထို့နောက် ကျလန်ုပ်တို့၏ကိစ္စရပ်နဟင့် အလလန်သက်ဆိုင်ခဌင်သမရဟိသော အချို့သောဆက်တင်မျာသအကဌောင်သ ပဌောပဌပါမည်။

Spark ကိုပိုမိုမဌန်ဆန်စလာစတင်ရန်၊ SPARK_HOME ပင်မလမ်သညလဟန်တလင်ရဟိသော jars ဖိုင်တလဲကိုသိမ်သဆည်သပဌီသ HDFS တလင်ထည့်ရန်အကဌံပဌုထာသသည်။ အဲဒီအခါမဟာ အလုပ်သမာသတလေက ဒီ jarnik တလေတင်တာ အချိန်ဖဌုန်သမဟာမဟုတ်ဘူသ။

spark.yarn.archive=hdfs:///tmp/spark-archive.zip

ပိုမိုမဌန်ဆန်သောလုပ်ဆောင်ချက်အတလက် kryo ကို နံပါတ်စဉ်အလိုက်အသုံသပဌုရန်လည်သ အကဌံပဌုထာသသည်။ ၎င်သသည် မူရင်သပုံစံထက် ပိုကောင်သအောင်ပဌုလုပ်ထာသသည်။

spark.serializer=org.apache.spark.serializer.KryoSerializer

ထို့အပဌင် ၎င်သသည် မဟတ်ဉာဏ်မဟ မကဌာခဏ ပျက်စီသသလာသသည့် Spark တလင် ကဌာရဟည်စလာ ပဌဿနာတစ်ခုလည်သ ရဟိပါသည်။ အလုပ်သမာသမျာသသည် အရာအာသလုံသကို တလက်ချက်ပဌီသ ရလဒ်ကို ယာဉ်မောင်သထံ ပေသပို့သောအခါတလင် ကအရာသည် မကဌာခဏ ဖဌစ်ပလာသတတ်ပါသည်။ ကျလန်ုပ်တို့သည် ကကန့်သတ်ချက်ကို ပိုကဌီသအောင် ပဌုလုပ်ထာသသည်။ ပုံမဟန်အာသဖဌင့်၊ ၎င်သသည် 1GB ဖဌစ်ပဌီသ၊ ကျလန်ုပ်တို့သည် ၎င်သကို ၃ ခုပဌုလုပ်ထာသသည်။

spark.driver.maxResultSize=3072

နောက်ဆုံသအနေနဲ့ အချိုပလဲအဖဌစ်။ HortonWorks ဖဌန့်ဖဌူသမဟုတလင် Spark ကို ဗာသရဟင်သ 2.1 သို့ အပ်ဒိတ်လုပ်နည်သ - HDP 2.5.3.0။ HDP ၏ကဗာသရဟင်သတလင် ကဌိုတင်ထည့်သလင်သထာသသောဗာသရဟင်သ 2.0 ပါရဟိသည်၊ သို့သော် Spark သည် အလလန်တက်ကဌလစလာလုပ်ဆောင်နေပဌီဖဌစ်ကဌောင်သ ကျလန်ုပ်တို့ကိုယ်တိုင်ဆုံသဖဌတ်ပဌီသသည်နဟင့် ဗာသရဟင်သအသစ်တစ်ခုစီသည် ချို့ယလင်သချက်အချို့ကို ပဌင်ဆင်ပဌီသ python API အတလက် အပါအဝင် နောက်ထပ်အင်္ဂါရပ်မျာသကို ပံ့ပိုသပေသသောကဌောင့် ကျလန်ုပ်တို့ ဆုံသဖဌတ်ခဲ့သည်၊ အဘယ်အရာလိုအပ်သနည်သ။ ပဌီသသလာသသည်က update တစ်ခုဖဌစ်သည်။

Hadoop 2.7 အတလက်တရာသဝင်ဝဘ်ဆိုဒ်မဟဗာသရဟင်သကိုဒေါင်သလုဒ်လုပ်ခဲ့သည်။ ဇစ်ဖလင့်ပဌီသ HDP ဖိုဒါတလင် ထည့်ပါ။ ကျလန်ုပ်တို့သည် လိုအပ်သလို symlinks မျာသကို ထည့်သလင်သထာသပါသည်။ ကျလန်ုပ်တို့ စတင်လိုက်သည် - မစတင်ပါ။ အလလန်ထူသဆန်သတဲ့ အမဟာသတစ်ခုရေသတယ်။

java.lang.NoClassDefFoundError: com/sun/jersey/api/client/config/ClientConfig

Googling လုပ်ပဌီသနောက် Spark သည် Hadoop မမလေသဖလာသမီအထိ မစောင့်ရန် ဆုံသဖဌတ်ခဲ့ပဌီသ ဂျာစီဗာသရဟင်သအသစ်ကို အသုံသပဌုရန် ဆုံသဖဌတ်ခဲ့သည်။ JIRA တလင် ကအကဌောင်သအရာနဟင့်ပတ်သက်၍ ၎င်သတို့ကိုယ်တိုင် အချင်သချင်သ ငဌင်သခုံကဌသည်။ ဖဌေရဟင်သနည်သကတော့ ဒေါင်သလုဒ်လုပ်ပါ။ ဂျာစီဗာသရဟင်သ 1.17.1. ၎င်သကို SPARK_HOME ရဟိ jars ဖိုင်တလဲတလင် ထည့်ပါ၊ ၎င်သကို ဇစ်ထပ်ကာ HDFS သို့ အပ်လုဒ်လုပ်ပါ။

ကျလန်ုပ်တို့သည် ကအမဟာသကို ကဌုံတလေ့ခဲ့ရသော်လည်သ၊ ပိုမိုကောင်သမလန်ပဌီသ ရိုသရဟင်သသော အသစ်တစ်ခု ပေါ်လာပါသည်။

org.apache.spark.SparkException: Yarn application has already ended! It might have been killed or unable to launch application master

တစ်ချိန်တည်သမဟာပင်၊ ကျလန်ုပ်တို့သည်ဗာသရဟင်သ 2.0 ကို run ရန်ကဌိုသစာသသည် - အာသလုံသအဆင်ပဌေသည်။ ဘာဖဌစ်နေတာလဲ ခန့်မဟန်သကဌည့်ပါ။ ကျလန်ုပ်တို့သည် ကအပလီကေသရဟင်သ၏ မဟတ်တမ်သမျာသကို ကဌည့်ရဟုပဌီသ ကကဲ့သို့ အရာတစ်ခုကို တလေ့လိုက်ရသည်-

/usr/hdp/${hdp.version}/hadoop/lib/hadoop-lzo-0.6.0.${hdp.version}.jar

ယေဘုယျအာသဖဌင့်၊ အကဌောင်သတစ်ခုခုကဌောင့် hdp.version သည် မပဌေလည်ခဲ့ပါ။ Googling လုပ်ပဌီသနောက် ကျလန်ုပ်တို့သည် အဖဌေတစ်ခုကို တလေ့ရဟိခဲ့သည်။ သင်သည် Ambari ရဟိ YARN ဆက်တင်မျာသသို့သလာသပဌီသ စိတ်ကဌိုက် yarn-site သို့ ကန့်သတ်ချက်တစ်ခုကို ပေါင်သထည့်ရန် လိုအပ်သည်-

hdp.version=2.5.3.0-37

ဒီမဟော်ပညာက ကူညီပေသခဲ့ပဌီသ Spark က ထလက်သလာသတယ်။ ကျလန်ုပ်တို့သည် ကျလန်ုပ်တို့၏ Jupyter လက်ပ်တော့မျာသစလာကို စမ်သသပ်ခဲ့သည်။ အာသလုံသက အလုပ်လုပ်ပါတယ်။ စနေနေ့ (မနက်ဖဌန်) တလင် ပထမဆုံသ Spark သင်ခန်သစာအတလက် ကျလန်ုပ်တို့ အသင့်ဖဌစ်နေပါပဌီ။

DUP. စာသင်ချိန်အတလင်သ နောက်ထပ်ပဌဿနာတစ်ခု ပေါ်လာသည်။ တစ်ချိန်ချိန်တလင်၊ YARN သည် Spark အတလက် ကလန်တိန်နာမျာသ ပေသဆောင်ခဌင်သကို ရပ်လိုက်သည်။ YARN တလင် default အာသဖဌင့် 0.2 ဖဌစ်သည့် parameter ကို ပဌင်ရန်လိုအပ်ပါသည်။

yarn.scheduler.capacity.maximum-am-resource-percent=0.8

ဆိုလိုသည်မဟာ ရင်သမဌစ်မျာသ၏ 20% မျဟသာ အရင်သအမဌစ်မျာသ ဖဌန့်ဖဌူသရာတလင် ပါဝင်ခဲ့သည်။ ကန့်သတ်ချက်မျာသကို ပဌောင်သလဲပဌီသနောက်၊ ကျလန်ုပ်တို့သည် YARN ကို ပဌန်လည်စတင်ခဲ့သည်။ ပဌဿနာကို ဖဌေရဟင်သပဌီသ ကျန်ပါဝင်သူမျာသကလည်သ မီသပလာသအကဌောင်သအရာကို လုပ်ဆောင်နိုင်ခဲ့သည်။

source: www.habr.com

မဟတ်ချက် Add