Habr, เบชเบฐเบเบฒเบเบเบต! เบกเบทเปเบงเบฒเบเบเบตเป , เบเบฒเบ guys เบเบฒเบ Rambler & Co, เบกเบตเบเปเบญเบเบเปเบฒเบเบซเบผเบฒเบเบเปเบฒเบเบฒเบกเบเบฒเบเบเบนเปเปเบเบปเปเบฒเบฎเปเบงเบกเบเบตเปเบเปเบฝเบงเบเปเบญเบเบเบฑเบเบเบฒเบเบเบฑเปเบเบเปเบฒเปเบเบทเปเบญเบเบกเบทเบเบตเป. เบเบงเบโเปเบฎเบปเบฒโเปเบเปโเบเบฑเบโเบชเบดเบโเปเบโเบเบตเปโเบเบฐโเปเบเบตเบโเบเบฒเบกโเบฎเบญเบโเบเบตเบโเบเบญเบโเบเบฃเบฐโเบญเบปเบโเปเบฅเบฐโเปเบเปเบโเบเบฑเบโเบเบฐโเบชเบปเบโเบเบฒเบโเบเบญเบโเบเบงเบโเปเบฎเบปเบฒ. เบซเบปเบงเบเปเปเบเปเปเปเบกเปเบเปเบฅเบทเปเบญเบเบเปเบฒเบ - เบเบฑเปเบเบเบฑเปเบเบเบงเบเปเบฎเบปเบฒเปเบเบตเบเบเปเบฒเบเปเบเปเบเบเบฑเบเบเบฐเบชเบปเบเบเบฒเบเบเบญเบเบเปเบฒเบเปเบเบเปเบฒเปเบซเบฑเบ, เบเบฒเบเบเบตเบเบงเบเปเบฎเบปเบฒเบเบฑเบเปเบเบปเปเบฒเปเบเปเบฅเบฐเปเบเปเบเบฒเบเบชเบดเปเบเบเบฒเบเบขเปเบฒเบเบเบตเปเบเบดเบเบเบฒเบ.
เบเบฒเบเปเบเบฐเบเปเบฒเปเบฅเบฑเบเบเปเบญเบเบเปเบฝเบงเบเบฑเบเบงเบดเบเบตเบเบตเปเบเบงเบเปเบฎเบปเบฒเปเบเป Spark. เบเบงเบเปเบฎเบปเบฒเบกเบตเปเบเบเบเบฒเบเบชเบฒเบกเปเบเบทเบญเบ , เปเบฅเบฐเบเบฐเบซเบผเบญเบเปเบกเบเบนเบเบเบตเบชเบญเบเบเบนเปเปเบเบปเปเบฒเบฎเปเบงเบกเบเบญเบเบเบงเบเปเบฎเบปเบฒเปเบฎเบฑเบเบงเบฝเบเบเปเบฝเบงเบเบฑเบเปเบเบทเปเบญเบเบกเบทเบเบตเป. เบเบฑเปเบเบเบฑเปเบ, เบงเบฝเบเบเบฒเบเบเบญเบเบเบงเบเปเบฎเบปเบฒ, เปเบเบเบฒเบเบฐเบเบนเปเบเบฑเบเบเบฑเปเบ, เปเบกเปเบเบเบฒเบเบเบฐเบเบฝเบกเบเบธเปเบกเบชเปเบฒเบฅเบฑเบเบเบฒเบเบเปเบฒเปเบเปเบเบฒเบเปเบเบเปเบฅเบฐเบเบตเบเบฑเปเบเบเปเบฒเบง.
peculiarity เบเบญเบเบเบฒเบเบเปเบฒเปเบเปเบเบญเบเบเบงเบเปเบฎเบปเบฒเปเบกเปเบเบงเปเบฒเบเปเบฒเบเบงเบเบเบญเบเบเบฐเบเบฒเบเบปเบเบเปเบญเบกเปเบเบฑเบเปเบฎเบฑเบเบงเบฝเบเบเปเบฝเบงเบเบฑเบ Spark เบชเบฒเบกเบฒเบเปเบเบปเปเบฒเบเบฑเบเบเบธเปเบกเบเบฑเบเบซเบกเบปเบ. เบเบปเบงเบขเปเบฒเบ, เปเบเบเบญเบเบเบฐเบเบธเบกเบชเปเบฒเบกเบฐเบเบฒ, เปเบกเบทเปเบญเบเบธเบเบเบปเบเบเบฐเบเบฒเบเบฒเบกเบเบฒเบเบชเบดเปเบเบเบฒเบเบขเปเบฒเบเปเบเปเบงเบฅเบฒเบเบฝเบงเบเบฑเบเปเบฅเบฐเปเบฎเบฑเบเบเปเปเบฒเบญเบตเบเบซเบผเบฑเบเบเบฒเบเบเบนเบชเบญเบเบเบญเบเบเบงเบเปเบฎเบปเบฒ. เปเบฅเบฐเบเบตเปเบเปเปเปเบกเปเบเบซเบผเบฒเบ - เบเบฒเบเบเบฑเปเบเปเบเบดเบ 40 เบเบปเบ. เบญเบฒเบเบเบฐเบเปเปเบกเบตเบเปเบฅเบดเบชเบฑเบเบเปเบฒเบเบงเบเบซเบผเบฒเบเปเบเปเบฅเบเบเบตเปเบเบฐเปเบเบตเบเบเบฑเบเบเปเบฅเบฐเบเบตเบเบฒเบเบเปเบฒเปเบเปเบเบฑเปเบเบเปเบฒเบง.
เบเปเปเปเบ, เบเปเบญเบเบเบฐเบเบญเบเปเบเบปเปเบฒเบงเปเบฒเปเบเบงเปเบเปเบฅเบฐเปเบเบฑเบเบซเบเบฑเบเบเบงเบเปเบฎเบปเบฒเปเบฅเบทเบญเบเบเบปเบงเบเปเบฒเบเบปเบเบเบฒเบเบเปเบฒเบซเบเบปเบเบเปเบฒเบเบตเปเปเบเปเบเบญเบ.
เปเบซเปเปเบฅเบตเปเบกเบเบปเปเบเบเบฒเบเบเบธเบเปเบฅเบตเปเบกเบเบปเปเบ. Spark เบกเบต 3 เบเบฒเบโเปเบฅเบทเบญเบโเปเบโเบเบฒเบโเบเปเบฒโเปเบเบตเบโเบเบฒเบโเปเบโเบเบธเปเบกโ: standaloneโ, เบเบฒเบโเบเปเบฒโเปเบเป Mesosโ, เปเบฅเบฐโเบเบฒเบโเบเปเบฒโเปเบเป YARNโ. เบเบงเบเปเบฎเบปเบฒเบเบฑเบเบชเบดเบเปเบเปเบฅเบทเบญเบเบเบฒเบเปเบฅเบทเบญเบเบเบตเบชเบฒเบกเปเบเบฒเบฐเบงเปเบฒเบกเบฑเบเบกเบตเบเบงเบฒเบกเบซเบกเบฒเบเบชเปเบฒเบฅเบฑเบเบเบงเบเปเบฎเบปเบฒ. เบเบงเบเปเบฎเบปเบฒเบกเบตเบเบธเปเบก hadoop เปเบฅเปเบง. เบเบนเปเปเบเบปเปเบฒเบฎเปเบงเบกเบเบญเบเบเบงเบเปเบฎเบปเบฒเปเบกเปเบเบฎเบนเปเบเบฑเบเบเบตเบเบฑเบเบชเบฐเบเบฒเบเบฑเบเบเบฐเบเบฐเบเปเบฒเบเบญเบเบกเบฑเบ. เปเบซเปเปเบเป YARN.
spark.master=yarnเบซเบเปเบฒเบชเบปเบเปเบเบซเบผเบฒเบ. เปเบเปเบฅเบฐเบเบปเบงเปเบฅเบทเบญเบเบเบฒเบเบเบณเปเบเป 3 เบญเบฑเบเบเบตเปเบกเบต 2 เบเบฒเบเปเบฅเบทเบญเบเปเบเบเบฒเบเบเบณเปเบเป: เบฅเบนเบเบเปเบฒ เปเบฅเบฐเบเบธเปเบก. เบญเบตเบ เปเบฅเบฐเบเบฒเบเปเบเบทเปเบญเบกเบเปเปเบเปเบฒเบเปเปเบเบญเบดเบเปเบเบตเปเบเบฑเบ, เบเบงเบเปเบฎเบปเบฒเบชเบฒเบกเบฒเบเบชเบฐเบซเบผเบธเบเปเบเปเบงเปเบฒเบฅเบนเบเบเปเบฒเปเบกเปเบเปเบซเบกเบฒเบฐเบชเบปเบกเบชเปเบฒเบฅเบฑเบเบเบฒเบเปเบฎเบฑเบเบงเบฝเบเปเบเบเปเบเปเบเบญเบ - เบเบปเบงเบขเปเบฒเบ, เปเบเบเบเปเบฒเบเบเบทเปเบกเบเบฑเบเบเบถเบเบเบญเบ jupyter, เปเบฅเบฐ cluster เปเบกเปเบเปเบซเบกเบฒเบฐเบชเบปเบกเบชเปเบฒเบฅเบฑเบเบเบฒเบเปเบเปเปเบเบเบฒเบเบเบฐเบฅเบดเบ. เปเบเบเปเบฅเบฐเบเบตเบเบญเบเบเบงเบเปเบฎเบปเบฒ, เบเบงเบเปเบฎเบปเบฒเบกเบตเบเบงเบฒเบกเบชเบปเบเปเบเปเบเบเบฒเบเปเบฎเบฑเบเบงเบฝเบเปเบเบเปเบเปเบเบญเบ, เบเบฑเปเบเบเบฑเปเบ:
spark.deploy-mode=clientเปเบเบเบเบปเปเบงเปเบเปเบฅเปเบง, เบเบฒเบเบเบตเป Spark เบเบฐเปเบฎเบฑเบเบงเบฝเบเบขเบนเปเปเบ YARN, เปเบเปเบเบตเปเบเปเปเบเบฝเบเบเปเบชเปเบฒเบฅเบฑเบเบเบงเบเปเบฎเบปเบฒ. เปเบเบทเปเบญเบเบเบฒเบเบเบงเบเปเบฎเบปเบฒเบกเบตเปเบเบเบเบฒเบเบเปเบฝเบงเบเบฑเบเบเปเปเบกเบนเบเปเบซเบเป, เบเบฒเบเบเบฑเปเบเบเบนเปเปเบเบปเปเบฒเบฎเปเบงเบกเบเปเปเบกเบตเบเบฝเบเบเปเบเบญเบเบชเบดเปเบเบเบตเปเปเบเปเบฎเบฑเบเปเบเบเบญเบเบเบญเบเบเบฑเบเบเบฐเบเบฒเบเบญเบเบเบตเปเบเบฑเบเบเบฑเบ. เปเบฅเบฐเบซเบผเบฑเบเบเบฒเบเบเบฑเปเบเบเบงเบเปเบฎเบปเบฒเปเบเปเบเบปเบเปเบซเบฑเบเบชเบดเปเบเบเบตเปเบซเบเปเบฒเบชเบปเบเปเบ - dynamic resource allocation . เปเบเบชเบฑเปเบ, เบเบธเบเบเบตเปเปเบกเปเบ: เบเปเบฒเบเปเบฒเบเบกเบตเบงเบฝเบเบเบตเปเบกเบตเบเบงเบฒเบกเบซเบเบธเปเบเบเบฒเบเปเบฅเบฐเบเบธเปเบกเปเบกเปเบเบเปเปเปเบชเบเบเปเบฒ (เบเบปเบงเบขเปเบฒเบ, เปเบเบเบญเบเปเบเบปเปเบฒ), เบซเบผเบฑเบเบเบฒเบเบเบฑเปเบ, เบเบฒเบเบเปเบฒเปเบเปเบเบฒเบเปเบฅเบทเบญเบเบเบตเป Spark เบชเบฒเบกเบฒเบเปเบซเปเบเบฑเบเบเบฐเบเบฒเบเบญเบเปเบเบตเปเบกเปเบเบตเบก. เบเบงเบฒเบกเบเปเบฒเปเบเบฑเบเปเบเปเบเบทเบเบเบดเบเปเบฅเปเบขเบนเปเบเบตเปเบเบฑเปเบเบเบฒเบกเบชเบนเบเบเบตเปเบชเบฐเบซเบฅเบฒเบ. เบเบงเบเปเบฎเบปเบฒเบเบฐเบเปเปเปเบเบปเปเบฒเปเบเปเบเบฅเบฒเบเบฅเบฐเบญเบฝเบ - เบกเบฑเบเปเบฎเบฑเบเบงเบฝเบเปเบเปเบเบต.
spark.dynamicAllocation.enabled=trueเบเบงเบเปเบฎเบปเบฒเบเปเบฒเบเบปเบเบเบฒเบฅเบฒเบกเบดเปเบเบตเบเบตเป, เปเบฅเบฐเปเบกเบทเปเบญเปเบฅเบตเปเบกเบเบปเปเบ Spark crashed เปเบฅเบฐเบเปเปเปเบเปเปเบฅเบตเปเบกเบเบปเปเบ. เบเบฑเปเบเปเบกเปเบ, เปเบเบฒเบฐเบงเปเบฒเบเปเบญเบเบเปเบญเบเบญเปเบฒเบเบกเบฑเบ เบฅเบฐเบกเบฑเบเบฅเบฐเบงเบฑเบเบซเบผเบฒเบเบเบถเปเบ. เบกเบฑเบเบฅเบฐเบเบธเบงเปเบฒเปเบเบทเปเบญเปเบซเปเบเบธเบเบชเบดเปเบเบเบธเบเบขเปเบฒเบเบเปเปเปเบเบฑเบเบซเบเบฑเบ, เบเปเบฒเบเบเปเปเบเปเบฒเปเบเบฑเบเบเปเบญเบเปเบเบตเบเปเบเปเบเบปเบงเบเปเบฒเบเบปเบเบเบฒเบเปเบเบตเปเบกเปเบเบตเบก.
spark.shuffle.service.enabled=trueเปเบเบฑเบเบซเบเบฑเบเบกเบฑเบเบเบถเปเบเบเปเบฒเปเบเบฑเบ? เปเบกเบทเปเบญเบงเบฝเบเบเบญเบเบเบงเบเปเบฎเบปเบฒเบเปเปเบเปเบญเบเบเบฒเบเบเบฑเบเบเบฐเบเบฒเบเบญเบเบซเบผเบฒเบ, Spark เบเบงเบเบชเบปเปเบเบเบงเบเบกเบฑเบเบเบฑเบเบเบทเบเบชเบนเปเบชเบฐเบเบธเบเปเบเบตเบเบปเปเบงเปเบ. เบเบฑเปเบเบเบญเบเบเบตเปเปเบเปเปเบงเบฅเบฒเบซเบผเบฒเบเบเบตเปเบชเบธเบเปเบเปเบเบทเบญเบเบเบธเบเบซเบเปเบฒเบงเบฝเบ MapReduce เปเบกเปเบเบเบฑเปเบเบเบญเบเบเบญเบ Shuffle. เบเบฒเบฅเบฒเบกเบดเปเบเบตเบเบตเปเบเปเบงเบเปเบซเปเบเปเบฒเบเบชเบฒเบกเบฒเบเบเบฑเบเบเบถเบเบเปเปเบกเบนเบเบเบตเปเบเบทเบเบชเปเบฒเบเบเบถเปเบเปเบเบเบฑเปเบเบเบญเบเบเบตเปเปเบฅเบฐเบเปเบญเบเบเบปเบงเบเบฐเบเบดเบเบฑเบเบเบฒเบเบเบฒเบกเบเบงเบฒเบกเปเบซเบกเบฒเบฐเบชเบปเบก. เปเบฅเบฐเบเบนเปเบเบฐเบเบดเบเบฑเบเปเบกเปเบเบเบฐเบเบงเบเบเบฒเบเบเบตเปเบเบดเบเปเบฅเปเบเบธเบเบชเบดเปเบเบเบธเบเบขเปเบฒเบเบเปเบฝเบงเบเบฑเบเบเบนเปเบญเบญเบเปเบฎเบเบเบฒเบ. เบกเบฑเบเบกเบตเบเปเบฒเบเบงเบเบเบตเปเปเบเปเบเบญเบเบเบญเบเปเบเบเบเบฐเบกเบงเบเบเบปเบเปเบฅเบฐเบเปเบฒเบเบงเบเบซเบเปเบงเบเบเบงเบฒเบกเบเปเบฒเบเบตเปเปเบเปเบเบญเบ.
เบเบฒเบฅเบฒเบกเบดเปเบเบตเบเบตเปเปเบเปเบเบทเบเปเบเบตเปเบก. เบเบธเบเบขเปเบฒเบเปเบเบดเปเบเบเบทเบงเปเบฒเปเบฎเบฑเบเบงเบฝเบ. เบกเบฑเบเปเบเปเบเบฒเบเปเบเบฑเบเบเบตเปเบชเบฑเบเปเบเบเปเบซเบฑเบเบงเปเบฒเบเบนเปเปเบเบปเปเบฒเบฎเปเบงเบกเปเบเปเบฎเบฑเบเบเบฑเบเบเบฐเบเบฒเบเบญเบเบซเบผเบฒเบเปเบกเบทเปเบญเบเบงเบเปเบเบปเบฒเบเปเบญเบเบเบฒเบ. เปเบเปเบเบฑเบเบซเบฒเบญเบทเปเบเบเปเปเปเบเบตเบเบเบทเปเบ - เปเบเบเบฒเบเบเบธเบเบเบนเปเปเบเบปเปเบฒเบฎเปเบงเบกเบญเบทเปเบเปเบเบทเปเบเบเบถเปเบเปเบฅเบฐเบเบฑเบเบเปเบญเบเบเบฒเบเปเบเป Spark, เปเบเปเบเบธเบเบชเบดเปเบเบเบธเบเบขเปเบฒเบเบเปเปเบซเบเบธเปเบเบขเบนเปเบเบตเปเบเบฑเปเบ, เปเบฅเบฐเบเบงเบเปเบเบปเบฒเบเปเปเบเปเปเบ. เบเบงเบเปเบเบปเบฒเบชเบฒเบกเบฒเบเปเบเบปเปเบฒเปเบเปเบเป. เบเบงเบเปเบฎเบปเบฒเปเบฅเบตเปเบกเปเบเบดเปเบเปเบญเบเบฐเบชเบฒเบ. เบกเบฑเบเปเบเปเบซเบฑเบเบญเบญเบเบงเปเบฒเบกเบตเบเปเบฒเบเบงเบเบเบปเบงเบเปเบฒเบเบปเบเบเบฒเบเบญเบทเปเบเปเบเบตเปเบชเบฒเบกเบฒเบเบเบทเบเบเปเบฒเปเบเปเปเบเบทเปเบญเบกเบตเบญเบดเบเบเบดเบเบปเบเบเปเปเบเบฐเบเบงเบเบเบฒเบ. เบเบปเบงเบขเปเบฒเบ, เบเปเบฒเบเบปเบงเบเบฐเบเบดเบเบฑเบเบขเบนเปเปเบเปเบซเบกเบเบชเบฐเปเบเบเบเบฒเบ, เบซเบผเบฑเบเบเบฒเบเปเบงเบฅเบฒเปเบเบเบตเปเบเบฑเบเบเบฐเบเบฒเบเบญเบเบชเบฒเบกเบฒเบเปเบญเบปเบฒเบกเบฒเบเบฒเบเบกเบฑเบเปเบเป?
spark.dynamicAllocation.executorIdleTimeout=120sเปเบโเบเปโเบฅเบฐโเบเบตโเบเบญเบโเบเบงเบโเปเบฎเบปเบฒโ, เบเปเบฒโเบซเบฒเบโเบงเปเบฒโเบเบนเปโเบเบฐโเบเบดโเบเบฑเบโเบเบญเบโเบเปเบฒเบโเบเปเปโเปเบเปโเปเบฎเบฑเบโเบซเบเบฑเบโเบชเปเบฒโเบฅเบฑเบโเบชเบญเบโเบเบฒโเบเบตโ, เบซเบผเบฑเบโเบเบฒเบโเบเบฑเปเบโเบเบฐโเบฅเบธโเบเบฒโเบเบฑเบโเบเบทเบโเปเบโเบเปเบญเบโเบชเบฐโเบเบธเบโเปเบเบตโเบเบปเปเบงโเปเบโ. เปเบเปเบเบฒเบฅเบฒเบกเบดเปเบเบตเบเบตเปเบเปเปเบเบฝเบเบเปเบชเบฐเปเบซเบกเบต. เบกเบฑเบเปเบเบฑเบเบเบตเปเบเบฑเบเปเบเบเบงเปเบฒเบเบธเบเบเบปเบเบเบฑเปเบเบเปเปเปเบเปเปเบฎเบฑเบเบซเบเบฑเบเปเบเบฑเบเปเบงเบฅเบฒเบเบปเบเบเบฒเบ, เปเบฅเบฐเบเบฑเบเบเบฐเบเบฒเบเบญเบเบเปเปเปเบเปเบเบทเบเบเบปเบเบเปเบญเบ. เบกเบฑเบเปเบเปเบซเบฑเบเบญเบญเบเบงเปเบฒเบเบฑเบเบกเบตเบเบปเบงเบเปเบฒเบเบปเบเบเบฒเบเบเบดเปเบชเบ - เบซเบผเบฑเบเบเบฒเบเปเบงเบฅเบฒเปเบเบเบตเปเบเบฐเปเบฅเบทเบญเบเปเบญเบปเบฒเบเบนเปเบเบฐเบเบดเบเบฑเบเบเบฒเบเบเบตเปเบกเบตเบเปเปเบกเบนเบเบเบฒเบเบเบฒเบเบเบงเบฒเบกเบเปเบฒ. เปเบเบเบเปเบฒเปเบฅเบตเปเบกเบเบปเปเบ, เบเบฒเบฃเบฒเบกเบดเปเบเบตเบเบตเปเปเบกเปเบเบเปเปเบกเบตเบเบญเบเปเบเบ! เบเบงเบเปเบฎเบปเบฒเปเบเปเปเบเบกเบฑเบ.
spark.dynamicAllocation.cachedExecutorIdleTimeout=600sเบเบฑเปเบเปเบกเปเบ, เบเปเบฒเบเบนเปเบเปเบฅเบดเบซเบฒเบเบเบญเบเปเบเบปเปเบฒเบเปเปเปเบฎเบฑเบเบซเบเบฑเบเปเบเบฑเบเปเบงเบฅเบฒ 5 เบเบฒเบเบต, เปเบซเปเบเบงเบเปเบเบปเบฒเบขเบนเปเปเบเบชเบฐเบฅเบญเบเบเปเปเบฒเบเบปเปเบงเปเบ. เปเบเปเบซเบกเบเบเบตเป, เบเบงเบฒเบกเปเบงเบเบญเบเบเบฒเบเบเปเบญเบเปเบฅเบฐเบญเบญเบเบเบฑเบเบเบฐเบเบฒเบเบญเบเบชเปเบฒเบฅเบฑเบเบเบนเปเปเบเปเบเปเบฒเบเบงเบเบซเบฅเบฒเบเปเบเปเบเบฒเบเปเบเบฑเบเบเบตเปเปเบซเบกเบฒเบฐเบชเบปเบก. เบเปเบฒเบเบงเบเบเบงเบฒเบกเบเปเปเบเปเปเบเปเบเปเบซเบผเบธเบเบฅเบปเบ. เปเบเปเบเบงเบเปเบฎเบปเบฒเปเบเปเบเบฑเบเบชเบดเบเปเบเบเบตเปเบเบฐเปเบเบเบทเปเบกเบญเบตเบเปเบฅเบฐเบเปเบฒเบเบฑเบเบเปเบฒเบเบงเบเบเบนเปเบเบฐเบเบดเบเบฑเบเบชเบนเบเบชเบธเบเบเปเปเบเปเบฒเบฎเปเบญเบเบชเบฐเบซเบกเบฑเบ - เบชเปเบฒเบเบฑเบเบเปเปเบเบนเปเปเบเบปเปเบฒเบฎเปเบงเบกเปเบเบเบเบฒเบ.
spark.dynamicAllocation.maxExecutors=19เบเบฝเบงเบเบตเป, เปเบเปเบเบญเบ, เบกเบตเบเบปเบเบเบตเปเบเปเปเบเปเปเบเปเบเบญเบตเบเบเปเบฒเบ เปเบถเปเบ - "เบเบธเปเบกเบเปเปเปเบฎเบฑเบเบงเบฝเบ, เปเบฅเบฐเบเปเบญเบเบกเบตเบเบฝเบเปเบเป 19 เบเบนเปเบเปเบฅเบดเบซเบฒเบ," เปเบเปเปเบเบปเปเบฒเบชเบฒเบกเบฒเบเปเบฎเบฑเบเบซเบเบฑเบเปเบเป? เบเบงเบเปเบฎเบปเบฒเบเปเบญเบเบเบฒเบเบเบงเบฒเบกเบชเบปเบกเบเบธเบเบเบตเปเบเบทเบเบเปเบญเบเบเบฒเบเบขเปเบฒเบ. เบเปเบฒเบเบเปเปเบชเบฒเบกเบฒเบเปเบฎเบฑเบเปเบซเปเบเบธเบเบเบปเบเบกเบตเบเบงเบฒเบกเบชเบธเบ.
เปเบฅเบฐเปเบฅเบทเปเบญเบเปเบฅเบฑเบเปเบเปเบญเบเปเบญเบตเบเปเบฅเบทเปเบญเบเปเบถเปเบเบเบตเปเบเปเบฝเบงเบเปเบญเบเบเบฑเบเบชเบฐเปเบเบฒเบฐเบเบญเบเบเปเบฅเบฐเบเบตเบเบญเบเบเบงเบเปเบฎเบปเบฒ. เบเบฒเบเบขเปเบฒเบ, เบซเบผเบฒเบเปเบเบปเบเปเบเปเบกเบฒเบเปเบฒเบชเปเบฒเบฅเบฑเบเบเบปเบเบฎเบฝเบเบเบฒเบเบเบฐเบเบดเบเบฑเบ, เปเบฅเบฐเบชเปเบฒเบฅเบฑเบเปเบซเบเบเบปเบเบเบฒเบเบขเปเบฒเบ Spark เบเปเปเปเบเปเปเบฅเบตเปเบกเบเบปเปเบเบชเปเบฒเบฅเบฑเบเบเบงเบเปเบเบปเบฒ. เบเบงเบเปเบฎเบปเบฒเปเบเปเปเบเบดเปเบเบเปเบฒเบเบงเบเบเบฑเบเบเบฐเบเบฒเบเบญเบเบเบตเปเบเปเปเปเบชเบเบเปเบฒ - เบกเบฑเบเปเบเบดเปเบเบเบทเบงเปเบฒเบขเบนเปเบเบตเปเบเบฑเปเบ. Spark เบเบงเบเปเบฅเบตเปเบกเบเบปเปเบ. เปเบเบเบเบต, เปเบเปเบงเบฅเบฒเบเบฑเปเบเปเบญเบเบฐเบชเบฒเบเปเบเปเบเบทเบเปเบเบตเปเบกเปเบเบปเปเบฒเปเบเปเบ subcortex เบขเบนเปเบเปเบญเบเปเบเบเปเบญเบเบซเบเบถเปเบ, เปเบฅเบฐเบเบงเบเปเบฎเบปเบฒเบเบทเปเปเบเปเบงเปเบฒเปเบกเบทเปเบญเปเบเบตเบเบเบปเบง, Spark เบเบญเบเบซเบฒเบเบญเบเบเบตเปเบเบฐเปเบฅเบตเปเบกเบเบปเปเบ. เบเปเบฒเบเบญเบเบเปเบฒเบญเบดเบเปเบเบเบญเบเปเบเบเบเปเปเบซเบงเปเบฒเบ, เบกเบฑเบเบเบฐเบเปเบฒเบเปเบเบเปเบญเบเบเปเปเปเบเบเบฒเบกเบฅเปเบฒเบเบฑเบ. เบเปเบฒเบกเบฑเบเบเปเปเปเบชเบเบเปเบฒ, เบกเบฑเบเบเบฑเบ. เปเบฅเบฐเบกเบตเบเบฒเบฅเบฒเบกเบดเปเบเบตเบเบตเปเบเบตเปเปเบซเปเปเบซเบฑเบเปเบเบดเบเบเปเบฒเบเบงเบเบชเบนเบเบชเบธเบเบเบญเบเบเบงเบฒเบกเบเบฐเบเบฒเบเบฒเบกเบชเปเบฒเบฅเบฑเบเบเบฒเบเบเบตเป. เบเปเบฒเปเบฅเบตเปเบกเบเบปเปเบเปเบกเปเบ 16. เบเบปเบงเปเบฅเบเปเบกเปเบเบซเบเปเบญเบเบเบงเปเบฒเบเปเบฒเบเบงเบเบเบปเบเปเบเบเบธเปเบกเบเบญเบเบเบงเบเปเบฎเบปเบฒเปเบเบซเปเบญเบเบฎเบฝเบ. เบเบฑเปเบเบเบฑเปเบ, เบซเบผเบฑเบเบเบฒเบ 16 เบเบงเบฒเบกเบเบฐเบเบฒเบเบฒเบก, Spark เปเบเปเบเบญเบกเปเบเปเปเบฅเบฐเปเบงเบปเปเบฒเบงเปเบฒเบเปเบญเบเบเปเปเบชเบฒเบกเบฒเบเปเบฅเบตเปเบกเบเบปเปเบเปเบเป. เบเบงเบเปเบฎเบปเบฒเปเบเปเปเบเปเปเบเบเบฒเบฅเบฒเบกเบดเปเบเบตเบเบตเปเปเบฅเปเบง.
spark.port.maxRetries=50เบเปเปเปเบเบเปเบฒเบเบฐเปเบเบปเปเบฒเบเบฐเบเบญเบเบเปเบฒเบเบเปเบฝเบงเบเบฑเบเบเบฒเบเบเบฑเปเบเบเปเบฒเบเบฒเบเบขเปเบฒเบเบเบตเปเบเปเปเบเปเบฝเบงเบเปเบญเบเบเบฑเบเบชเบฐเปเบเบฒเบฐเบเบญเบเบเปเบฅเบฐเบเบตเบเบญเบเบเบงเบเปเบฎเบปเบฒ.
เปเบเบทเปเบญเปเบฅเบตเปเบกเบเบปเปเบ Spark เปเบเปเปเบงเบเบถเปเบ, เปเบเบฐเบเบณเปเบซเปเปเบเบฑเบเปเบเบเปเบเบต jars เบเบตเปเบเบฑเปเบเบขเบนเปเปเบ SPARK_HOME home directory เปเบฅเปเบงเปเบชเปเปเบ HDFS. เบซเบผเบฑเบเบเบฒเบเบเบฑเปเบ, เบฅเบฒเบงเบเบฐเบเปเปเปเบชเบเปเบงเบฅเบฒเปเบเบเบฒเบเปเบซเบผเบเบเบฐเบเปเบญเบเปเบซเบผเบปเปเบฒเบเบตเปเปเบเบเบเบปเบเบเบฒเบ.
spark.yarn.archive=hdfs:///tmp/spark-archive.zipเบกเบฑเบเบเบฑเบเปเบเบฐเบเปเบฒเปเบซเปเปเบเป kryo เปเบเบฑเบ serializer เบชเปเบฒเบฅเบฑเบเบเบฒเบเบเปเบฒเปเบเบตเบเบเบฒเบเปเบงเบเบถเปเบ. เบกเบฑเบเบเบทเบเบเบฑเบเบเบธเบเปเบซเปเบเบตเบเบตเปเบชเบธเบเบเปเบงเบฒเบเปเบฒเปเบฅเบตเปเบกเบเบปเปเบ.
spark.serializer=org.apache.spark.serializer.KryoSerializerเปเบฅเบฐเบเบฑเบเบกเบตเบเบฑเบเบซเบฒเบเบตเปเบเบฒเบงเบเบฒเบเบเบฑเบ Spark เบเบตเปเบกเบฑเบเบกเบฑเบเบเบฐเบเบฑเบเบเบฒเบเบเบงเบฒเบกเบเบปเบเบเปเบฒ. เปเบฅเบทเปเบญเบเปเบเบตเปเปเบเบตเบเบเบทเปเบเปเบเปเบงเบฅเบฒเบเบตเปเบเบปเบเบเบฒเบเปเบเปเบเบดเบเปเบฅเปเบเบธเบเบขเปเบฒเบเปเบฅเบฐเบชเบปเปเบเบเบปเบเปเบซเปเบเบนเปเบเบฑเบเบเบตเป. เบเบงเบเปเบฎเบปเบฒเปเบฎเบฑเบเปเบซเปเบเบฒเบฅเบฒเบกเบดเปเบเบตเบเบตเปเปเบซเบเปเบเบถเปเบเบชเปเบฒเบฅเบฑเบเบเบปเบงเปเบฎเบปเบฒเปเบญเบ. เปเบเบเบเปเบฒเปเบฅเบตเปเบกเบเบปเปเบ, เบกเบฑเบเปเบกเปเบ 1GB, เบเบงเบเปเบฎเบปเบฒเปเบฎเบฑเบเปเบซเปเบกเบฑเบ 3.
spark.driver.maxResultSize=3072เปเบฅเบฐเบชเบธเบเบเปเบฒเบ, เปเบเบฑเบ dessert. เบงเบดเบเบตเบเบฒเบเบญเบฑเบเปเบเบ Spark เปเบเบฑเบเปเบงเบตเบเบฑเบ 2.1 เบเปเบฝเบงเบเบฑเบเบเบฒเบเปเบเบเบขเบฒเบ HortonWorks - HDP 2.5.3.0. เบชเบฐเบเบฑเบเบเบตเปเบเบญเบ HDP เบเบฐเบเบญเบเบเปเบงเบเปเบงเบตเบเบฑเบ 2.0 เบเบตเปเบเบดเบเบเบฑเปเบเปเบงเปเบเปเบญเบ, เปเบเปเบเบงเบเปเบฎเบปเบฒเปเบเปเบเบฑเบเบชเบดเบเปเบเบชเปเบฒเบฅเบฑเบเบเบปเบงเปเบฎเบปเบฒเปเบญเบเบงเปเบฒ Spark เบเปเบฒเบฅเบฑเบเบเบฑเบเบเบฐเบเบฒเบขเปเบฒเบเบซเปเบฒเบงเบซเบฑเบ, เปเบฅเบฐเปเบเปเบฅเบฐเบฎเบธเปเบเปเบซเบกเปเปเบเปเปเบเบเบฒเบเบเปเปเบเบปเบเบเปเบญเบเบเบงเบเบเบฑเบเบเบธเบเบชเบปเบกเบเบฑเบเปเบเบตเปเบกเปเบเบตเบก, เบฅเบงเบกเบเบฑเบเบชเปเบฒเบฅเบฑเบ python API, เบเบฑเปเบเบเบฑเปเบเบเบงเบเปเบฎเบปเบฒเปเบเปเบเบฑเบเบชเบดเบเปเบ, เบชเบดเปเบเบเบตเปเบเปเบญเบเบเบฒเบ. เปเบฎเบฑเบเปเบกเปเบเบเบฒเบเบเบฑเบเบเบธเบ.
เบเบฒเบงเปเบซเบฅเบเปเบงเบตเบเบฑเบเบเบฒเบเปเบงเบฑเบเปเบเบเปเบเบฒเบเบเบฒเบเบชเปเบฒเบฅเบฑเบ Hadoop 2.7. Unzipped เบกเบฑเบเปเบฅเบฐเปเบญเบปเบฒเปเบชเปเปเบเปเบเบเปเบเบต HDP. เบเบงเบเปเบฎเบปเบฒเบเบดเบเบเบฑเปเบ symlinks เบเบฒเบกเบเบงเบฒเบกเบเปเบญเบเบเบฒเบ. เบเบงเบเปเบฎเบปเบฒเปเบเบตเบเบเบปเบงเบกเบฑเบ - เบกเบฑเบเบเปเปเปเบเปเปเบฅเบตเปเบกเบเบปเปเบ. เบเบฝเบเบเปเปเบเบดเบเบเบฒเบเบเบตเปเปเบเบเบเบฐเบซเบผเบฒเบเบซเบผเบฒเบ.
java.lang.NoClassDefFoundError: com/sun/jersey/api/client/config/ClientConfigเบซเบผเบฑเบเบเบฒเบ googling, เบเบงเบเปเบฎเบปเบฒเบเบปเบเบงเปเบฒ Spark เบเบฑเบเบชเบดเบเปเบเบเปเปเบฅเปเบเปเบฒเบเบปเบเบเปเบงเบฒ Hadoop เปเบเบตเบ, เปเบฅเบฐเบเบฑเบเบชเบดเบเปเบเปเบเป jersey เบฎเบธเปเบเปเบซเบกเป. เบเบงเบเปเบเบปเบฒเปเบญเบเปเบเปเบเบฝเบเบเบฑเบเบเปเบฝเบงเบเบฑเบเบซเบปเบงเบเปเปเบเบตเปเปเบ JIRA. เบเบฒเบเปเบเปเปเบเปเบกเปเบเปเบเบทเปเบญเบเบฒเบงเปเบซเบฅเบ . เบงเบฒเบเบญเบฑเบเบเบตเปเปเบงเปเปเบเปเบเบเปเบเบต jars เปเบ SPARK_HOME, เบเบตเบเบญเบฑเบเบกเบฑเบเบญเบตเบเบเบฑเปเบ เปเบฅเบฐเบญเบฑเบเปเบซเบฅเบเปเบชเป HDFS.
เบเบงเบโเปเบฎเบปเบฒโเปเบเปโเบฎเบฑเบโเบเบฐโเบกเบฒเบโเบเบงเบฒเบกโเบเบดเบโเบเบฒเบโเบเบตเปโ, เปเบเปโเบงเปเบฒโเบซเบเบถเปเบโเปเบซเบกเปโเปเบฅเบฐโเบชเบฐโเบเบงเบโเบชเบฐโเบเบฒเบโเบซเบผเบฒเบโเปเบเปโเปเบเบตเบโเบเบถเปเบโ.
org.apache.spark.SparkException: Yarn application has already ended! It might have been killed or unable to launch application masterเปเบเปเบงเบฅเบฒเบเบฝเบงเบเบฑเบ, เบเบงเบเปเบฎเบปเบฒเบเบฐเบเบฒเบเบฒเบกเบเปเบฒเปเบเบตเบเบเบฒเบเบชเบฐเบเบฑเบ 2.0 - เบเบธเบเบชเบดเปเบเบเบธเบเบขเปเบฒเบเปเบกเปเบเบเบต. เบเบฐเบเบฒเบเบฒเบกเปเบเบปเบฒเบงเปเบฒเบกเบตเบซเบเบฑเบเปเบเบตเบเบเบถเปเบ. เบเบงเบโเปเบฎเบปเบฒโเปเบเบดเปเบโเปเบโเบเบฑเบโเบเบถเบโเบเบญเบโเบเปเบฒโเบฎเปเบญเบโเบชเบฐโเบซเบกเบฑเบโเบเบตเปโเปเบฅเบฐโเปเบเปโเปเบซเบฑเบโเบเบฒเบโเบชเบดเปเบโเบเบฒเบโเบขเปเบฒเบโเปเบเบฑเปเบโเบเบตเปโ:
/usr/hdp/${hdp.version}/hadoop/lib/hadoop-lzo-0.6.0.${hdp.version}.jarเปเบเบเบเบปเปเบงเปเบ, เบชเปเบฒเบฅเบฑเบเปเบซเบเบเบปเบเบเบฒเบเบขเปเบฒเบ hdp.version เบเปเปเปเบเปเปเบเปเปเบ. เบซเบผเบฑเบเบเบฒเบ google, เบเบงเบเปเบฎเบปเบฒเบเบปเบเปเบซเบฑเบเบงเบดเบเบตเปเบเปเปเบ. เบเปเบฒเบเบเปเบฒเปเบเบฑเบเบเปเบญเบเปเบเบเบตเปเบเบฒเบเบเบฑเปเบเบเปเบฒ YARN เปเบ Ambari เปเบฅเบฐเปเบเบตเปเบกเบเบฒเบฅเบฒเบกเบดเปเบเบตเบขเบนเปเบเบตเปเบเบฑเปเบเปเบเบทเปเบญเบเปเบฒเบเบปเบเปเบญเบ yarn-site:
hdp.version=2.5.3.0-37magic เบเบตเปเบเปเบงเบเปเบเป, เปเบฅเบฐ Spark เปเบญเบปเบฒเปเบ. เบเบงเบเปเบฎเบปเบฒเปเบเปเบเบปเบเบชเบญเบเปเบเบเบเบธเบ jupyter เบเบญเบเบเบงเบเปเบฎเบปเบฒเบซเบผเบฒเบเปเปเบงเบ. เบเบธเบเบชเบดเปเบเบเบธเบเบขเปเบฒเบเปเบกเปเบเปเบฎเบฑเบเบงเบฝเบ. เบเบงเบเปเบฎเบปเบฒเบเบฝเบกเบเปเบญเบกเบชเปเบฒเบฅเบฑเบเบเบปเบเบฎเบฝเบ Spark เบเปเบฒเบญเบดเบเปเบเบงเบฑเบเปเบชเบปเบฒ (เบกเบทเปเบญเบทเปเบ)!
DUP. เปเบโเบฅเบฐโเบซเบงเปเบฒเบโเบเบปเบโเบฎเบฝเบโ, เบเบฑเบโเบซเบฒโเบซเบเบถเปเบโเปเบเปโเปเบเบตเบโเบเบถเปเบโ. เปเบเบเบฒเบเบเบธเบ, YARN เบขเบธเบเปเบเบปเบฒเบเบฒเบเบชเบฐเบซเบเบญเบเบเบฑเบเบเบธเบชเปเบฒเบฅเบฑเบ Spark. เปเบ YARN เบกเบฑเบเบเปเบฒเปเบเบฑเบเบเปเบญเบเปเบเปเปเบเบเบฒเบฅเบฒเบกเบดเปเบเบต, เปเบเบดเปเบเปเบเบเบเปเบฒเปเบฅเบตเปเบกเบเบปเปเบเปเบกเปเบ 0.2:
yarn.scheduler.capacity.maximum-am-resource-percent=0.8 เบเบฑเปเบเปเบกเปเบ, เบกเบตเบเบฝเบเปเบเป 20% เบเบญเบเบเบฑเบเบเบฐเบเบฒเบเบญเบเบเบตเปเปเบเบปเปเบฒเบฎเปเบงเบกเปเบเบเบฒเบเปเบเบเบขเบฒเบเบเบฑเบเบเบฐเบเบฒเบเบญเบ. เบซเบผเบฑเบเบเบฒเบเบเบฒเบเบเปเบฝเบเปเบเบเบเบฒเบฅเบฒเบกเบดเปเบเบต, เบเบงเบเปเบฎเบปเบฒเปเบซเบผเบ YARN เบเบทเบเปเปเป. เบเบฑเบเบซเบฒเปเบเปเบเบทเบเปเบเปเปเบเปเบฅเบฐเบชเปเบงเบเบเบตเปเปเบซเบผเบทเบญเบเบญเบเบเบนเปเปเบเบปเปเบฒเบฎเปเบงเบกเบเบฑเบเบชเบฒเบกเบฒเบเบเปเบฒเปเบเบตเบเบเบฒเบ spark context.
เปเบซเบผเปเบเบเปเปเบกเบนเบ: www.habr.com
