Urang tuang gajah sabagian. Strategi ngawaskeun kaséhatan aplikasi sareng conto

Hello dulur!

Perusahaan kami kalibet dina pamekaran parangkat lunak sareng dukungan téknis salajengna. Pangrojong téknis sanés ngan ukur ngalereskeun kasalahan, tapi ngawaskeun kinerja aplikasi urang.

Salaku conto, upami salah sahiji jasa nabrak, maka anjeun kedah otomatis ngarékam masalah ieu sareng ngawitan ngabéréskeunana, sareng henteu ngadagoan pangguna anu teu puas ngahubungi dukungan téknis.

Simkuring boga parusahaan leutik, urang teu boga daya pikeun diajar jeung mertahankeun sagala solusi kompléks pikeun ngawaskeun aplikasi, urang diperlukeun pikeun manggihan solusi basajan tur éféktif.

Urang tuang gajah sabagian. Strategi ngawaskeun kaséhatan aplikasi sareng conto

Strategi ngawaskeun

Henteu gampang pikeun mariksa pungsionalitas aplikasi; tugas ieu henteu sepele, bahkan tiasa nyarios kreatif. Ieu hususna hésé pariksa sistem multi-link kompléks.

Kumaha anjeun tiasa tuang gajah? Ngan dina bagian! Kami nganggo pendekatan ieu pikeun ngawas aplikasi.

Intina strategi monitoring kami:

Megatkeun aplikasi anjeun kana komponén.
Jieun cék kontrol pikeun tiap komponén.

Komponén dianggap operasional upami sadaya pamariksaan kontrolna dilaksanakeun tanpa kasalahan. Hiji aplikasi dianggap séhat upami sadaya komponénna tiasa dianggo.

Ku kituna, sagala sistem bisa digambarkeun salaku tangkal komponén. Komponén kompléks direcah jadi leuwih basajan. komponén basajan boga cék.

Urang tuang gajah sabagian. Strategi ngawaskeun kaséhatan aplikasi sareng conto

Tolok ukur henteu dimaksudkeun pikeun ngalakukeun tés fungsional, sanés tés unit. Cék kontrol kedah mariksa kumaha perasaan komponén dina waktos ayeuna, naha aya sadaya sumber daya anu dipikabutuh pikeun fungsina, sareng naha aya masalah.

Henteu aya kaajaiban; kalolobaan cék kedah dikembangkeun sacara mandiri. Tapi ulah sieun, sabab di hal nu ilahar hiji dipariksa nyokot 5-10 garis kode, tapi anjeun bisa nerapkeun logika wae jeung anjeun bakal jelas ngartos kumaha cék jalan.

Sistim pangimeutan

Hayu urang ngabagi aplikasi kana komponén, datang sareng ngalaksanakeun cék pikeun tiap komponén, tapi naon anu kudu dilakukeun ku hasil cék ieu? Kumaha urang terang upami sababaraha cek gagal?

Urang bakal butuh sistem monitoring. Anjeunna bakal ngalaksanakeun tugas di handap ieu:

  • Nampi hasil tés sareng dianggo pikeun nangtukeun status komponén.
    Sacara visual, ieu sigana nyorot tangkal komponén. Komponén fungsional janten héjo, anu masalah janten beureum.
  • Ngalakukeun cék umum out of the box.
    Sistem ngawaskeun tiasa ngalakukeun sababaraha cék sorangan. Naha reinvent kabayang, hayu urang ngagunakeun aranjeunna. Salaku conto, anjeun tiasa pariksa yén halaman wéb dibuka atanapi pangladén nuju ping.
  • Kirim bewara ngeunaan masalah ka pihak kabetot.
  • Visualisasi data ngawaskeun, penyediaan laporan, grafik sareng statistik.

pedaran ringkes sistem ASMO

Hadé pisan mun éta ngajelaskeun kalawan conto. Hayu urang tingali kumaha ngawaskeun kinerja sistem ASMO diatur.

ASMO mangrupikeun sistem dukungan météorologi otomatis. Sistim nu mantuan spesialis jasa jalan ngartos dimana jeung iraha perlu pikeun ngubaran jalan kalawan bahan de-icing. Sistem ngumpulkeun data tina titik kontrol jalan. Titik kontrol jalan mangrupikeun tempat di jalan dimana peralatan dipasang: stasiun cuaca, kaméra pidéo, jsb. Pikeun ngaduga kaayaan bahaya, sistem narima ramalan cuaca ti sumber éksternal.

Urang tuang gajah sabagian. Strategi ngawaskeun kaséhatan aplikasi sareng conto

Janten, komposisi sistemna rada khas: situs wéb, agén, alat. Hayu urang mimitian ngawas.

Ngabagi sistem kana komponén

Komponén di handap ieu tiasa dibédakeun dina sistem ASMO:

1. Akun pribadi
Ieu mangrupikeun aplikasi wéb. Sahenteuna, anjeun kedah pariksa yén aplikasina sayogi dina Internét.

2. Pangkalan data
Databés nyimpen data anu penting pikeun ngalaporkeun, sareng anjeun kedah mastikeun yén cadangan database suksés didamel.

3. Server
Ku server kami hartosna hardware anu ngajalankeun aplikasi. Perlu mariksa status HDD, RAM, CPU.

4. Agén
Ieu mangrupikeun layanan Windows anu ngalaksanakeun seueur tugas anu béda dina jadwal. Sahenteuna, anjeun kedah pariksa yén jasa éta jalan.

5. Tugas agén
Ngan terang yén agén damel henteu cekap. Agén tiasa dianggo, tapi henteu ngalaksanakeun tugas anu ditugaskeun. Hayu urang ngabagi komponén agén kana tugas sareng pariksa naha unggal tugas agén tiasa suksés.

6. Titik kontrol jalan (wadah sadaya MPCs)
Aya seueur titik kontrol jalan, janten hayu urang ngagabungkeun sadayana MPC dina hiji komponén. Ieu bakal ngagampangkeun maca data ngawaskeun. Nalika ningali status komponén "sistem ASMO", éta bakal langsung jelas dimana masalahna: dina aplikasi, hardware atanapi dina sistem kontrol maksimal.

7. Titik kontrol jalan (hiji wates maksimum)
Kami bakal nganggap komponén ieu tiasa dilayanan upami sadaya alat dina MPC ieu tiasa dilayanan.

8. Paranti
Ieu mangrupikeun kaméra pidéo atanapi stasiun cuaca anu dipasang dina wates konsentrasi maksimal. Perlu mariksa yén alatna berpungsi leres.

Dina sistem monitoring, tangkal komponén bakal kasampak kawas kieu:

Urang tuang gajah sabagian. Strategi ngawaskeun kaséhatan aplikasi sareng conto

Pangimeutan Aplikasi Wéb

Janten, kami parantos ngabagi sistem kana komponén, ayeuna urang kedah ngadamel cek pikeun tiap komponén.

Pikeun ngawas aplikasi wéb kami nganggo cék ieu:

1. Mariksa muka halaman utama
Pamariksaan ieu dilakukeun ku sistem ngawaskeun. Jang ngalampahkeunana, kami nunjukkeun alamat halaman, sempalan réspon anu dipiharep sareng waktos palaksanaan pamundut maksimal.

2. Mariksa wates waktu mayar domain
Cék anu penting pisan. Lamun domain a tetep unpaid, pamaké teu bisa muka loka. Ngarengsekeun masalah tiasa nyandak sababaraha dinten, sabab ... Parobihan DNS henteu langsung diterapkeun.

3. Mariksa sertipikat SSL
Ayeuna, ampir sadaya situs wéb nganggo protokol https pikeun aksés. Pikeun protokol tiasa dianggo leres, anjeun peryogi sertipikat SSL anu valid.

Di handap ieu komponén "Akun Pribadi" dina sistem ngawaskeun:

Urang tuang gajah sabagian. Strategi ngawaskeun kaséhatan aplikasi sareng conto

Sadaya pamariksaan di luhur bakal tiasa dianggo pikeun kalolobaan aplikasi sareng henteu ngabutuhkeun coding. Ieu saé pisan sabab anjeun tiasa ngamimitian ngawaskeun aplikasi wéb dina 5 menit. Di handap ieu aya pamariksaan tambahan anu tiasa dilakukeun pikeun aplikasi wéb, tapi palaksanaanna langkung rumit sareng khusus pikeun aplikasi, janten kami moal nutupan aranjeunna dina tulisan ieu.

Naon deui anu anjeun tiasa pariksa?

Pikeun ngawas aplikasi wéb anjeun langkung lengkep, anjeun tiasa ngalaksanakeun pamariksaan ieu:

  • Jumlah kasalahan JavaScript per période
  • Jumlah kasalahan dina sisi aplikasi wéb (tukang-tungtung) pikeun période
  • Jumlah réspon aplikasi wéb anu henteu suksés (kode réspon 404, 500, jsb.)
  • Rata-rata waktos palaksanaan query

Ngawaskeun jasa windows (agén)

Dina sistem ASMO, agén maénkeun peran panjadwal tugas, anu ngalaksanakeun tugas anu dijadwalkeun di latar tukang.

Upami sadaya pancén agén parantos suksés, agén éta jalanna leres. Tétéla yén pikeun ngawas agén, anjeun kedah ngawas tugasna. Ku alatan éta, urang ngabagi komponén "Agen" kana tugas. Pikeun unggal tugas, urang bakal nyieun komponén misah dina sistem monitoring, dimana komponén "Agen" bakal "indungna".

Urang ngabagi komponén Agén kana komponén anak (tugas):

Urang tuang gajah sabagian. Strategi ngawaskeun kaséhatan aplikasi sareng conto

Ku kituna, urang geus ngarecah komponén kompléks jadi sababaraha basajan. Ayeuna urang kudu datang nepi ka cék pikeun tiap komponén basajan. Punten dicatet yén komponén indungna "Agen" moal gaduh cék, sabab sistem ngawaskeun bakal ngitung statusna sacara mandiri dumasar kana status komponén anakna. Kalayan kecap sanésna, upami sadaya pancén parantos réngsé, maka agén parantos suksés.

Aya leuwih ti saratus tugas dina sistem ASMO, éta bener perlu datang nepi ka cék unik pikeun tiap tugas? Tangtosna, kontrol bakal langkung saé upami urang datang sareng ngalaksanakeun pamariksaan khusus urang sorangan pikeun unggal tugas agén, tapi dina kalolobaan kasus éta cekap nganggo cek universal.

Sistem ASMO ngan ukur nganggo cék universal pikeun tugas sareng ieu cekap pikeun ngawas kinerja sistem.

Mariksa kamajuan
Pamariksaan pangbasajanna sareng paling efektif nyaéta pamariksaan palaksanaan. Cék marios yén tugas parantos réngsé tanpa kasalahan. Sadaya tugas gaduh cék ieu.

Algoritma mariksa

Sanggeus unggal palaksanaan tugas, Anjeun kudu ngirimkeun hasil cék SUCCESS ka sistem ngawaskeun lamun palaksanaan tugas éta suksés, atawa ERROR lamun palaksanaan réngsé kalawan kasalahan.

Pamariksaan ieu tiasa ngadeteksi masalah di handap ieu:

  1. Tugas jalan tapi gagal ku kasalahan.
  2. Tugas geus dieureunkeun ngajalankeun, contona, geus beku.

Hayu urang tingali kumaha masalah ieu direngsekeun dina leuwih jéntré.

Masalah 1 - Tugas dijalankeun tapi gagal ku kasalahan
Di handap ieu kasus dimana tugas dijalankeun tapi gagal antara 14:00 jeung 16:00.

Urang tuang gajah sabagian. Strategi ngawaskeun kaséhatan aplikasi sareng conto

Angka nunjukkeun yén nalika tugas gagal, sinyal langsung dikirim ka sistem ngawaskeun sareng status cek anu aya dina sistem ngawaskeun janten alarem.

Punten dicatet yén dina sistem ngawaskeun, status komponén gumantung kana status verifikasi. Status alarem tina cék bakal ngarobah sakabéh komponén tingkat luhur jadi alarem, tingali gambar di handap.

Urang tuang gajah sabagian. Strategi ngawaskeun kaséhatan aplikasi sareng conto

Masalah 2 - Tugas dieureunkeun palaksanaan (beku)
Kumaha sistem ngawaskeun bakal ngartos yén tugas macét?

Hasil cék ngagaduhan periode validitas, contona, 1 jam. Upami sajam pas sareng teu aya hasil tés énggal, sistem ngawaskeun bakal nyetél status tés janten alarem.

Urang tuang gajah sabagian. Strategi ngawaskeun kaséhatan aplikasi sareng conto

Dina gambar di luhur, lampu dipareuman jam 14:00. Jam 15:00, sistem ngawaskeun bakal ngadeteksi yén hasil tés (ti 14:00) busuk, sabab Waktu relevansi geus kadaluwarsa (hiji jam), tapi euweuh hasilna anyar, sarta bakal pindah cék ka status alarem.

Tabuh 16:00 lampu dihurungkeun deui, program bakal ngarengsekeun tugas sareng ngirim hasil palaksanaan ka sistem ngawaskeun, status tés bakal suksés deui.

Naon waktos mariksa relevansi kuring kedah nganggo?

Waktu relevansi kedah langkung ageung tibatan waktos palaksanaan tugas. Abdi nyarankeun nyetel waktos relevansi 2-3 kali leuwih panjang batan periode palaksanaan tugas. Ieu dipikabutuh pikeun ngahindarkeun nampi béwara palsu nalika, contona, tugas langkung lami tibatan biasana atanapi aya anu nga-reload program éta.

Mariksa kamajuan

Sistem ASMO ngagaduhan tugas "Beban Ramalan", anu nyobian ngaunduh ramalan énggal tina sumber éksternal sajam sakali. Waktu pasti nalika ramalan anyar muncul dina sistem éksternal teu dipikawanoh, tapi dipikanyaho yén ieu kajadian 2 kali sapoé. Tétéla yén lamun teu aya ramalan anyar pikeun sababaraha jam, mangka ieu normal, tapi lamun euweuh ramalan anyar pikeun leuwih ti sapoé, aya hiji hal geus pegat wae. Contona, format data dina sistem ramalan éksternal bisa robah, naha ASMO moal ningali release ramalan anyar.

Algoritma mariksa

Tugas ngirimkeun hasil pamariksaan SUKSES ka sistem ngawaskeun nalika suksés kéngingkeun kamajuan (ngunduh ramalan cuaca énggal). Upami teu aya kamajuan atanapi aya kasalahan, maka teu aya anu dikirim ka sistem ngawaskeun.

Cék kedah gaduh interval relevansi supados salami ieu dijamin nampi kamajuan énggal.

Urang tuang gajah sabagian. Strategi ngawaskeun kaséhatan aplikasi sareng conto

Punten dicatet yén urang bakal diajar ngeunaan masalah sareng reureuh, sabab sistem ngawaskeun ngantosan dugi ka jaman validitas hasil scan terakhir tamat. Ku alatan éta, periode validitas cék henteu kedah panjang teuing.

ngawaskeun databés

Pikeun ngadalikeun pangkalan data dina sistem ASMO, urang ngalaksanakeun pamariksaan ieu:

  1. Verifikasi nyieun cadangan
  2. Mariksa rohangan disk kosong

Verifikasi nyieun cadangan
Dina kalolobaan aplikasi, hal anu penting pikeun boga cadangan database up-to-date jadi lamun server gagal, Anjeun bisa nyebarkeun program ka server anyar.

ASMO nyiptakeun salinan cadangan saminggu sakali sareng ngirimkeunana ka panyimpenan. Nalika prosedur ieu parantos suksés, hasil pamariksaan kasuksésan dikirim ka sistem ngawaskeun. Hasil verifikasi valid pikeun 9 dinten. Jelema. Pikeun ngadalikeun nyiptakeun cadangan, mékanisme "pariksa kamajuan", anu kami bahas di luhur, dianggo.

Mariksa rohangan disk kosong
Upami rohangan bébas dina disk henteu cekap, pangkalan data moal tiasa dianggo leres, janten penting pikeun ngontrol jumlah rohangan kosong.

Éta merenah ngagunakeun métrik pikeun pariksa parameter numeris.

Métrik mangrupakeun variabel numerik, nilai nu dikirimkeun ka sistem monitoring. Sistem ngawaskeun mariksa nilai ambang sareng ngitung status métrik.

Di handap ieu gambar kumaha komponén "Database" dina sistem ngawaskeun:

Urang tuang gajah sabagian. Strategi ngawaskeun kaséhatan aplikasi sareng conto

Pangimeutan server

Pikeun ngawas server kami nganggo cék sareng métrik ieu:

1. rohangan disk bébas
Upami rohangan disk béak, aplikasi moal tiasa jalan. Kami nganggo 2 nilai bangbarung: tingkat kahiji nyaéta PERHATOSAN, tingkat kadua nyaéta ALARM.

2. Rata nilai RAM dina persen per jam
Kami nganggo rata-rata per jam sabab ... urang teu kabetot dina ras langka.

3. Rata-rata persentase CPU per jam
Kami nganggo rata-rata per jam sabab ... urang teu kabetot dina ras langka.

4. Ping cék
Cék yén server online. Sistem ngawaskeun tiasa ngalakukeun pamariksaan ieu; teu kedah nyerat kode.

Di handap ieu gambar kumaha komponén "Server" dina sistem ngawaskeun:

Urang tuang gajah sabagian. Strategi ngawaskeun kaséhatan aplikasi sareng conto

Alat ngawaskeun

Kuring gé ngabejaan ka maneh kumaha data ieu dicandak. Pikeun unggal titik kontrol jalan (MPC) aya tugas dina Nu Ngarencana tugas, contona, "Survey MPC M2 km 200". Tugasna nampi data tina sadaya alat MPC unggal 30 menit.

Masalah saluran komunikasi
Kaseueuran alatna aya di luar kota, jaringan GSM dianggo pikeun pangiriman data, anu henteu tiasa dianggo sacara stabil (aya jaringan, atanapi henteu aya).

Kusabab sering gagal jaringan, mimitina, mariksa survey MPC dina ngawaskeun sapertos kieu:

Urang tuang gajah sabagian. Strategi ngawaskeun kaséhatan aplikasi sareng conto

Janten jelas yén ieu sanés pilihan anu tiasa dianggo, sabab aya seueur béwara palsu ngeunaan masalah. Lajeng ieu mutuskeun pikeun ngagunakeun "kamajuan cék" pikeun tiap alat, i.e. Ngan sinyal kasuksésan dikirimkeun ka sistem ngawaskeun nalika alat keur ngajajal tanpa kasalahan. Waktu relevansi disetel ka 5 jam.

Urang tuang gajah sabagian. Strategi ngawaskeun kaséhatan aplikasi sareng conto

Ayeuna ngawaskeun ngirimkeun béwara ngeunaan masalah ngan ukur nalika alatna teu tiasa dijajal langkung ti 5 jam. Kalayan probabilitas anu luhur, ieu sanés alarm palsu, tapi masalah nyata.

Di handap ieu gambar kumaha alat-alat dina sistem monitoring:

Urang tuang gajah sabagian. Strategi ngawaskeun kaséhatan aplikasi sareng conto

Penting!
Nalika jaringan GSM lirén damel, sadaya alat MDC henteu dijajal. Pikeun ngirangan jumlah email tina sistem ngawaskeun, insinyur kami ngalanggan béwara ngeunaan masalah komponén sareng jinis "MPC" tinimbang "Alat". Ieu ngidinan Anjeun pikeun nampa hiji bewara pikeun tiap MPC, tinimbang narima bewara misah pikeun tiap alat.

Skéma ngawaskeun ASMO ahir

Hayu urang kumpulkeun sadayana sareng tingali skéma ngawaskeun naon anu urang gaduh.

Urang tuang gajah sabagian. Strategi ngawaskeun kaséhatan aplikasi sareng conto

kacindekan

Hayu urang nyimpulkeun.
Naon anu ngawaskeun kinerja ASMO masihan kami?

1. waktos éliminasi cacad geus turun
Kami kantos nguping ngeunaan cacad ti pangguna, tapi henteu sadayana pangguna ngalaporkeun cacad. Kajadian urang diajar ngeunaan gangguan tina komponén sistem saminggu saatos muncul. Ayeuna sistem ngawaskeun ngabéjaan urang ngeunaan masalah pas aya masalah dideteksi.

2. stabilitas Sistim geus ngaronjat
Kusabab cacad mimiti dileungitkeun sateuacana, sistem sacara gembleng mimiti dianggo langkung stabil.

3. Ngurangan jumlah télépon ka rojongan teknis
Loba masalah ayeuna dibereskeun saméméh pamaké malah nyaho ngeunaan eta. Pamaké mimiti ngahubungan rojongan teknis kirang sering. Sadaya ieu gaduh pangaruh anu hadé dina reputasi urang.

4. Ningkatkeun kasatiaan palanggan sareng pangguna
Konsumén noticed parobahan positif dina stabilitas sistem. Pamaké mendakan langkung seueur masalah nganggo sistem.

5. Ngurangan waragad rojongan teknis
Kami parantos lirén ngalaksanakeun pamariksaan manual. Ayeuna sadaya cék otomatis. Saméméhna, urang diajar ngeunaan masalah ti pamaké; éta mindeng hésé ngarti naon masalah pamaké éta ngobrol ngeunaan. Ayeuna, seueur masalah dilaporkeun ku sistem ngawaskeun; bewara ngandung data téknis, anu salawasna ngajelaskeun naon anu salah sareng dimana.

Penting!
Anjeun teu tiasa masang sistem ngawaskeun dina server anu sami dimana aplikasi anjeun dijalankeun. Upami server turun, aplikasi bakal lirén damel sareng moal aya anu ngabéjaan ngeunaan éta.

Sistim ngawaskeun kudu ngajalankeun dina server misah di puseur data sejen.

Upami anjeun henteu hoyong nganggo server khusus dina pusat data énggal, anjeun tiasa nganggo sistem ngawaskeun awan. Perusahaan kami nganggo sistem ngawaskeun awan Zidium, tapi anjeun tiasa nganggo sistem ngawaskeun anu sanés. Biaya sistem ngawaskeun awan langkung handap tina nyéwa server énggal.

saran:

  1. Ngarecah aplikasi sareng sistem dina bentuk tangkal komponén saloba mungkin, ku kituna bakal merenah pikeun ngarti dimana jeung naon nu pegat, sarta kontrol bakal leuwih lengkep.
  2. Pikeun mariksa pungsionalitas komponén, paké tés. Hadé pisan mun éta ngagunakeun loba cék basajan ti hiji kompléks.
  3. Ngonpigurasikeun ambang métrik di sisi sistem ngawaskeun, tinimbang nyeratna dina kode. Ieu bakal nyalametkeun anjeun tina kudu recompile, reconfigure, atawa balikan deui aplikasi.
  4. Pikeun cék khusus, paké margin waktos relevansi pikeun ngahindarkeun béwara palsu sabab sababaraha cék nyandak sakedik langkung lami pikeun réngsé ti biasana.
  5. Coba sangkan komponén dina sistem ngawaskeun ngahurungkeun beureum ngan lamun aya pasti masalah. Upami aranjeunna janten beureum kanggo nanaon, maka anjeun bakal lirén nengetan béwara sistem ngawaskeun, hartosna bakal leungit.

Upami anjeun henteu acan nganggo sistem ngawaskeun, mimitian! Teu sakumaha hésé sakumaha sigana. Meunang tajongan kaluar tina nempo tangkal bahan héjo nu tumuwuh sorangan.

Good tuah.

sumber: www.habr.com

Tambahkeun komentar