"Von er slæm stefna." SRE intensive í Moskvu, 3.-5. febrúar

Við erum að tilkynna fyrsta verklega námskeiðið um SRE í Rússlandi: Slurm SRE.

Á meðan á átakinu stendur munum við eyða þremur dögum í að byggja, brjóta, gera við og endurbæta vefsíðu fyrir söfnun til að selja bíómiða.

"Von er slæm stefna." SRE intensive í Moskvu, 3.-5. febrúar

Við völdum miðasöfnun vegna þess að hann hefur margar bilunarsviðsmyndir: innstreymi gesta og DDoS árásir, bilun í einni af mörgum mikilvægum örþjónustum (heimild, bókanir, greiðsluvinnsla), óaðgengi eins af mörgum kvikmyndahúsum (gagnaskipti um u.þ.b. laus sæti og bókanir), og neðar á listanum.

Við munum móta hugmyndina um áreiðanleika fyrir safnsíðuna okkar, sem við munum þróa áfram í verkfræði, greina hönnunina frá sjónarhóli SRE, velja mælikvarða, setja upp eftirlit þeirra, útrýma uppkomnum atvikum, stunda þjálfun fyrir teymisvinnu með atvikum við aðstæður nálægt bardaga, skipuleggja skýrslutöku.

Verkefnið er rekið af starfsmönnum Booking.com og Google.
Að þessu sinni verður engin fjarþátttaka: Námskeiðið byggir á persónulegum samskiptum og teymisvinnu.

Upplýsingar undir klippingu

Hátalarar

Ivan Kruglov
Aðalhönnuður hjá Booking.com (Holland)
Síðan hann kom til Booking.com árið 2013 hefur hann unnið að innviðaverkefnum eins og dreifðri sendingu og vinnslu skilaboða, BigData og vefstakka, leit.
Er að vinna að því að byggja upp innra ský og þjónustunet.

Ben Tyler
Aðalhönnuður hjá Booking.com (USA)
Tekur þátt í innri þróun Booking.com vettvangsins.
Sérhæfir sig í þjónustuneti / þjónustuuppgötvun, tímasetningu lotuvinnu, viðbrögðum við atvikum og ferli eftir slátrun.
Talar og kennir á rússnesku.

Evgeniy Varavva
Almennur þróunaraðili hjá Google (San Francisco).
Reynsla frá álagi á vefverkefnum til rannsókna í tölvusjón og vélfærafræði.
Síðan 2011 hefur hann tekið þátt í gerð og rekstri dreifðra kerfa hjá Google og tekið þátt í heildarlífsferli verkefnisins: hugmyndagerð, hönnun og arkitektúr, ræsingu, brjóta saman og öll millistig.

Eduard Medvedev
CTO hjá Tungsten Labs (Þýskalandi)
Starfaði sem verkfræðingur hjá StackStorm, ábyrgur fyrir ChatOps virkni pallsins. Þróaði og innleiddi ChatOps fyrir sjálfvirkni gagnavera. Ræðumaður á rússneskum og alþjóðlegum ráðstefnum.

Program

Forritið er í virkri þróun. Nú lítur þetta svona út, í febrúar gæti það batnað og stækkað.

Efni #1: Grunnreglur og aðferðir SRE

  • Hvað þarf til að verða SRE?
  • DevOps vs SRE
  • Hvers vegna verktaki metur SRE og eru mjög leiðir þegar þeir eru ekki í verkefninu
  • SLI, SLO og SLA
  • Villufjárhagsáætlun og hlutverk þess í SRE

Efni #2: Hönnun dreifðra kerfa

  • Forritaarkitektúr og virkni
  • Óabstrakt stór kerfishönnun
  • Nothæfni / Hönnun fyrir bilun
  • gRPC eða REST
  • Útgáfa og afturábak eindrægni

Efni #3: Hvernig SRE verkefni er samþykkt

  • Bestu starfsvenjur frá SRE
  • Gátlisti fyrir viðurkenningu verkefna
  • Skráning, mælingar, rakning
  • Að taka CI/CD í okkar eigin hendur

Viðfangsefni nr. 4: Hönnun og gangsetning á dreifðu kerfi

  • Reverse engineering - hvernig virkar kerfið?
  • Við erum sammála um SLI og SLO
  • Æfðu getuáætlun
  • Þegar umferð er hleypt af stað í forritið, byrja notendur okkar að „nota“ það
  • Sjósetja Prometheus, Grafana, Elastic

Efni #5: Vöktun, athugun og viðvörun

  • Eftirlit vs. Athugunarhæfni
  • Setja upp eftirlit og viðvörun með Prometheus
  • Hagnýtt eftirlit með SLI og SLO
  • Einkenni vs. Ástæður
  • Black-Box vs. White-box eftirlit
  • Dreift eftirlit með framboði forrita og netþjóna
  • 4 gullmerki (fráviksgreining)

Viðfangsefni nr. 6: Æfing við að prófa áreiðanleika kerfisins

  • Að vinna undir álagi
  • Bilun-innspýting
  • Chaos api

Efni #7: Viðbragðsæfingar við atvik

  • Reiknirit fyrir streitustjórnun
  • Samspil þátttakenda atviks
  • Postmortem
  • Þekkingarmiðlun
  • Að móta menninguna
  • Bilanaeftirlit
  • Framkvæma saklausa skýrslutöku

Efni #8: Álagsstjórnunarvenjur

  • Álagsjöfnun
  • Bilanaþol forrita: reyndu aftur, tímamörk, bilunarinnspýting, aflrofi
  • DDoS (skapar álag) + Cascading Failures

Efni #9: Viðbrögð við atvikum

  • Samantekt
  • Vaktæfingar
  • Ýmsar tegundir slysa (prófanir, stillingarbreytingar, vélbúnaðarbilun)
  • Samskiptareglur um atviksstjórnun

Efni #10: Greining og úrlausn vandamála

  • Skógarhögg
  • Villuleit
  • Æfðu greiningu og villuleit á forritinu okkar

Efni #11: Kerfisáreiðanleikaprófun

  • Streitupróf
  • Stillingarprófun
  • Frammistöðuprófun
  • Losun frá Kanarí

Viðfangsefni nr.12: Sjálfstætt starf og upprifjun

Ráðleggingar og kröfur til þátttakenda

SRE er hópefli. Við mælum eindregið með því að taka námskeiðið í hóp. Þess vegna bjóðum við upp á mikinn afslátt fyrir tilbúin teymi.

Verð á námskeiðinu er 60 ₽ á mann.
Ef fyrirtæki sendir hóp 5+ manna - 40 ₽.

Námskeiðið er byggt á Kubernetes. Til að standast þarftu að þekkja Kubernetes á grunnstigi. Ef þú vinnur ekki með honum geturðu farið í gegnum Slurm Basic (онлайн eða ákafur 18-20 nóvember).
Að auki þarftu að vera fær í Linux og kunna Gitlab og Prometheus.

Skráning

Ef þú ert með flókna hugmynd um þátttöku, til dæmis að forstjóri, tæknistjóri og hópur þróunaraðila komi á námskeiðið og að þeir fari í starfsnám með hliðsjón af lóðréttu stjórnunarstigi, skrifaðu mér þá í persónulegum skilaboðum.

Heimild: www.habr.com

Bæta við athugasemd