David O'Brien (Xirus): Metrik! Metrik! Metrik! Bahagian 1

David O'Brien baru-baru ini melancarkan syarikatnya sendiri, Xirus (https://xirus.com.au), memfokuskan pada produk awan Microsoft Azure Stack. Mereka direka bentuk untuk membina dan menjalankan aplikasi hibrid secara konsisten di pusat data, lokasi tepi, pejabat terpencil dan awan.

David melatih individu dan syarikat tentang semua perkara Microsoft Azure dan Azure DevOps (dahulunya VSTS) dan masih melakukan perundingan langsung dan infracoding. Beliau telah menjadi pemenang Anugerah Microsoft MVP (Microsoft Most Valuable Professional) selama 5 tahun dan baru-baru ini menerima Anugerah MVP Azure. Sebagai penganjur bersama Melbourne Microsoft Cloud dan Datacentre Meetup, O'Brien kerap bercakap di persidangan antarabangsa, menggabungkan minatnya untuk mengembara ke seluruh dunia dengan semangat untuk berkongsi cerita IT dengan komuniti. Blog David terletak di david-obrien.net, dia juga menerbitkan latihan dalam taliannya tentang Pluralsight.

Ceramah bercakap tentang kepentingan metrik dalam memahami perkara yang berlaku dalam persekitaran anda dan prestasi aplikasi anda. Microsoft Azure mempunyai cara yang berkuasa dan mudah untuk memaparkan metrik untuk semua jenis beban kerja, dan kuliah menerangkan cara anda boleh menggunakan kesemuanya.

Pada pukul 3 pagi pada hari Ahad, semasa anda sedang tidur, anda tiba-tiba dikejutkan oleh mesej teks: "aplikasi superkritikal tidak bertindak balas lagi." Apa yang sedang berlaku? Di mana dan apakah sebab "brek"? Dalam ceramah ini, anda akan mempelajari tentang perkhidmatan yang ditawarkan oleh Microsoft Azure kepada pelanggan untuk mengumpul log dan, khususnya, metrik daripada beban kerja awan anda. David akan memberitahu anda apakah metrik yang anda patut minati semasa bekerja pada platform awan dan cara untuk mendapatkannya. Anda akan belajar tentang alatan sumber terbuka dan pembinaan papan pemuka, dan berakhir dengan pengetahuan yang mencukupi untuk mencipta papan pemuka anda sendiri.

Dan jika anda dikejutkan semula pada pukul 3 pagi dengan mesej bahawa aplikasi kritikal telah ranap, anda boleh mengetahui puncanya dengan cepat.

Selamat petang, hari ini kita akan bercakap tentang metrik. Nama saya David O'Brien, saya adalah pengasas bersama dan pemilik sebuah syarikat perunding Australia yang kecil, Xirus. Terima kasih sekali lagi kerana datang ke sini untuk meluangkan masa anda dengan saya. Jadi mengapa kita di sini? Untuk bercakap tentang metrik, atau sebaliknya, saya akan memberitahu anda tentangnya, dan sebelum melakukan apa-apa perkara, mari kita mulakan dengan teori.

David O'Brien (Xirus): Metrik! Metrik! Metrik! Bahagian 1

Saya akan memberitahu anda apa itu metrik, perkara yang boleh anda lakukan dengannya, perkara yang perlu anda perhatikan, cara mengumpul dan mendayakan pengumpulan metrik dalam Azure dan apakah visualisasi metrik itu. Saya akan menunjukkan kepada anda rupa perkara ini dalam awan Microsoft dan cara bekerja dengan awan ini.

Sebelum kita bermula, saya akan bertanyakan tangan daripada mereka yang menggunakan Microsoft Azure. Siapa yang bekerja dengan AWS? Saya nampak sedikit. Bagaimana dengan Google? Awan ALI? Seorang lelaki! Hebat. Jadi apakah metrik? Takrifan rasmi Institut Piawaian dan Teknologi Kebangsaan AS ialah: "Metrik ialah piawaian ukuran yang menerangkan syarat dan peraturan untuk mengukur harta dan berfungsi untuk memahami hasil pengukuran." Apakah maksudnya?

Mari kita ambil contoh metrik untuk menukar ruang cakera kosong mesin maya. Sebagai contoh, kita diberi nombor 90, dan nombor ini bermakna peratusan, iaitu jumlah ruang cakera kosong ialah 90%. Saya perhatikan bahawa tidak begitu menarik untuk membaca penerangan definisi metrik, yang mengambil masa 40 halaman dalam format pdf.

Walau bagaimanapun, metrik tidak menyatakan bagaimana hasil pengukuran diperoleh, ia hanya menunjukkan hasil ini. Apa yang kita lakukan dengan metrik?

Pertama, kita mengukur nilai sesuatu untuk kemudian menggunakan hasil pengukuran.

David O'Brien (Xirus): Metrik! Metrik! Metrik! Bahagian 1

Sebagai contoh, kami mendapati jumlah ruang cakera kosong dan kini kami boleh menggunakannya, menggunakan memori ini, dsb. Setelah kami menerima hasil metrik, kami mesti mentafsirnya. Sebagai contoh, metrik mengembalikan hasil 90. Kita perlu tahu maksud nombor ini: jumlah ruang kosong atau jumlah ruang cakera terpakai dalam peratus atau gigabait, kependaman rangkaian sama dengan 90 ms, dan seterusnya, iaitu , kita perlu mentafsir maksud nilai metrik. Agar metrik menjadi bermakna sama sekali, selepas mentafsir nilai metrik tunggal, kita perlu memastikan bahawa berbilang nilai dikumpulkan. Ini sangat penting kerana ramai orang tidak menyedari keperluan untuk mengumpul metrik. Microsoft telah menjadikannya sangat mudah untuk mengumpul metrik, tetapi terpulang kepada anda untuk memastikan ia dikumpulkan. Metrik ini disimpan selama 41 hari sahaja dan hilang pada hari ke-42. Oleh itu, bergantung pada sifat peralatan luaran atau dalaman anda, anda harus menjaga cara menyimpan metrik selama lebih daripada 41 hari - dalam bentuk log, log, dsb. Oleh itu, selepas pengumpulan, anda harus meletakkannya di beberapa tempat yang membolehkan anda mengeluarkan semua statistik perubahan dalam hasil metrik jika perlu. Sebaik sahaja anda meletakkannya di sana, anda boleh mula bekerja dengan mereka dengan berkesan.

Hanya selepas anda memperoleh metrik, mentafsirkannya dan mengumpulnya, anda boleh membuat perjanjian tahap perkhidmatan SLA. SLA ini mungkin tidak begitu penting kepada pelanggan anda; ia lebih penting kepada rakan sekerja anda, pengurus, mereka yang menyelenggara sistem dan mengambil berat tentang fungsinya. Metrik boleh mengukur bilangan tiket - contohnya, anda menerima 5 tiket setiap hari, dan dalam kes ini ia menunjukkan kelajuan tindak balas kepada permintaan pengguna dan kelajuan penyelesaian masalah. Metrik tidak seharusnya hanya menyatakan bahawa tapak anda dimuatkan dalam 20ms atau kelajuan tindak balas anda ialah 20ms, metrik adalah lebih daripada satu penunjuk teknikal.

Oleh itu, tugas perbualan kami adalah untuk memberikan anda gambaran terperinci tentang intipati metrik. Metrik berfungsi supaya dengan melihatnya anda boleh mendapatkan gambaran lengkap tentang proses tersebut.

David O'Brien (Xirus): Metrik! Metrik! Metrik! Bahagian 1

Sebaik sahaja kami mempunyai metrik, kami boleh menjamin 99% bahawa sistem berfungsi, kerana ia bukan hanya melihat fail log yang menyatakan sistem berfungsi. Jaminan masa hidup 99% bermakna, sebagai contoh, 99% masa API bertindak balas pada kelajuan biasa 30 ms. Inilah yang menarik minat pengguna, rakan sekerja dan pengurus anda. Ramai pelanggan kami memantau log pelayan web, tetapi mereka tidak menyedari sebarang ralat padanya dan menganggap bahawa semuanya baik-baik saja. Sebagai contoh, mereka melihat kelajuan rangkaian 200 Mb/s dan berfikir: "ok, semuanya hebat!" Tetapi untuk mencapai 200 ini, pengguna memerlukan kelajuan tindak balas 30 milisaat, dan ini adalah tepat penunjuk yang tidak diukur dan tidak dikumpulkan dalam fail log. Pada masa yang sama, pengguna terkejut bahawa tapak dimuatkan dengan sangat perlahan, kerana, tidak mempunyai metrik yang diperlukan, mereka tidak tahu sebab untuk kelakuan ini.

Tetapi memandangkan kami mempunyai SLA masa operasi 100%, pelanggan mula merungut kerana tapak itu sebenarnya sangat sukar untuk digunakan. Oleh itu, untuk mencipta SLA objektif, adalah perlu untuk melihat gambaran lengkap proses yang dibuat oleh metrik yang dikumpul. Ini adalah isu berterusan yang saya hadapi dengan beberapa pembekal yang, apabila mencipta SLA, tidak tahu maksud istilah "masa hidup" dan dalam kebanyakan kes tidak menerangkan kepada pelanggan mereka cara API mereka berfungsi.

Jika anda mencipta perkhidmatan, sebagai contoh, API untuk orang ketiga, anda harus memahami maksud metrik 39,5 yang terhasil - respons, respons yang berjaya, respons pada kelajuan 20 ms atau pada kelajuan 5 ms. Terpulang kepada anda untuk menyesuaikan SLA mereka kepada SLA anda sendiri, mengikut metrik anda sendiri.

Sebaik sahaja anda mengetahui semua ini, anda boleh mula mencipta papan pemuka yang menakjubkan. Beritahu saya, adakah sesiapa telah menggunakan aplikasi visualisasi interaktif Grafana? Hebat! Saya peminat besar sumber terbuka ini kerana perkara ini percuma dan mudah digunakan.

David O'Brien (Xirus): Metrik! Metrik! Metrik! Bahagian 1

Jika anda belum menggunakan Grafana lagi, saya akan memberitahu anda cara untuk bekerja dengannya. Sesiapa yang lahir pada tahun 80-an dan 90-an mungkin masih ingat CareBears? Saya tidak tahu betapa popularnya beruang ini di Rusia, tetapi apabila bercakap tentang metrik, kita sepatutnya menjadi "beruang penjagaan" yang sama. Seperti yang saya katakan, anda memerlukan gambaran besar tentang cara keseluruhan sistem berfungsi, dan ia bukan sahaja mengenai API anda, tapak web anda atau perkhidmatan yang dijalankan dalam mesin maya.

David O'Brien (Xirus): Metrik! Metrik! Metrik! Bahagian 1

Anda mesti menyusun koleksi metrik tersebut yang paling mencerminkan operasi keseluruhan sistem. Kebanyakan anda adalah pembangun perisian, jadi kehidupan anda sentiasa berubah, menyesuaikan diri dengan keperluan produk baharu, dan sama seperti anda prihatin dengan proses pengekodan, anda harus mengambil berat dengan metrik. Anda perlu tahu bagaimana metrik itu berkaitan dengan setiap baris kod yang anda tulis. Sebagai contoh, minggu depan anda memulakan kempen pemasaran baharu dan mengharapkan sejumlah besar pengguna melawat tapak anda. Untuk menganalisis acara ini, anda memerlukan metrik dan anda mungkin memerlukan keseluruhan papan pemuka untuk menjejak aktiviti orang ini. Anda memerlukan metrik untuk memahami sejauh mana kejayaan kempen pemasaran anda dan bagaimana ia sebenarnya berprestasi. Mereka akan membantu anda, sebagai contoh, membangunkan CRM yang berkesan - sistem pengurusan perhubungan pelanggan.

Jadi mari kita mulakan dengan perkhidmatan awan Azure kami. Sangat mudah untuk mencari dan mengatur koleksi metrik kerana ia mempunyai Azure Monitor. Monitor ini memusatkan pengurusan konfigurasi sistem anda. Setiap elemen Azure yang anda ingin gunakan pada sistem anda mempunyai banyak metrik yang didayakan secara lalai. Ini adalah aplikasi percuma yang berfungsi di luar kotak dan tidak memerlukan sebarang tetapan awal; anda tidak perlu menulis atau "menarik" apa-apa ke sistem anda. Kami akan mengesahkan ini dengan melihat demo berikut.

David O'Brien (Xirus): Metrik! Metrik! Metrik! Bahagian 1

Selain itu, adalah mungkin untuk menghantar metrik ini kepada aplikasi pihak ketiga, seperti sistem storan dan analisis log Splunk, aplikasi pengurusan log berasaskan awan SumoLogic, alat pemprosesan log ELK dan Radar IBM. Benar, terdapat sedikit perbezaan yang bergantung pada sumber yang anda gunakan - mesin maya, perkhidmatan rangkaian, pangkalan data Azure SQL, iaitu, penggunaan metrik berbeza bergantung pada fungsi persekitaran kerja anda. Saya tidak akan mengatakan bahawa perbezaan ini serius, tetapi, malangnya, mereka masih ada, dan ini harus diambil kira. Mendayakan dan menghantar metrik boleh dilakukan dalam beberapa cara: melalui Portal, CLI/Power Shell atau menggunakan templat ARM.

David O'Brien (Xirus): Metrik! Metrik! Metrik! Bahagian 1

Sebelum saya memulakan demo pertama saya, saya akan menjawab sebarang soalan yang anda ada. Jika tiada soalan, mari mulakan. Skrin menunjukkan rupa halaman Azure Monitor. Bolehkah sesiapa di antara anda mengatakan bahawa monitor ini tidak berfungsi?

David O'Brien (Xirus): Metrik! Metrik! Metrik! Bahagian 1

Jadi sekarang semuanya baik-baik saja, anda boleh melihat bagaimana rupa perkhidmatan monitor. Saya boleh mengatakan bahawa ini adalah alat yang sangat baik dan sangat mudah untuk kerja seharian. Ia boleh digunakan untuk memantau aplikasi, rangkaian dan infrastruktur. Baru-baru ini, antara muka pemantauan telah dipertingkatkan, dan jika sebelum ini perkhidmatan terletak di tempat yang berbeza, kini semua maklumat mengenai perkhidmatan disatukan pada halaman utama monitor.

Jadual metrik ialah tab di sepanjang laluan HomeMonitorMetrics, yang anda boleh pergi ke untuk melihat semua metrik yang tersedia dan memilih metrik yang anda perlukan. Tetapi jika anda perlu mendayakan pengumpulan metrik, anda perlu menggunakan laluan direktori tetapan HomeMonitorDiagnostic dan tandakan kotak pilihan Metrik Didayakan/Dilumpuhkan. Secara lalai, hampir semua metrik didayakan, tetapi jika anda perlu mendayakan sesuatu tambahan, anda perlu menukar status diagnostik daripada Dilumpuhkan kepada Didayakan.

David O'Brien (Xirus): Metrik! Metrik! Metrik! Bahagian 1

Untuk melakukan ini, klik pada baris metrik yang dipilih dan pada tab yang terbuka, dayakan mod diagnostik. Jika anda akan menganalisis metrik yang dipilih, kemudian selepas mengklik pada pautan Hidupkan diagnostik, anda perlu menyemak kotak semak Hantar ke Log Analitis dalam tetingkap yang muncul.

David O'Brien (Xirus): Metrik! Metrik! Metrik! Bahagian 1

Log Analitis agak serupa dengan Splunk, tetapi kosnya lebih murah. Perkhidmatan ini membolehkan anda mengumpul semua metrik, log dan semua yang anda perlukan dan meletakkannya dalam ruang kerja Analitis Log. Perkhidmatan ini menggunakan bahasa pemprosesan pertanyaan KQL khas - Kusto Quarry Language, kami akan melihat kerjanya dalam demo seterusnya. Buat masa ini, saya akan ambil perhatian bahawa dengan bantuannya anda boleh membuat pertanyaan mengenai metrik, log, istilah, aliran, corak, dll. dan buat papan pemuka.

Jadi, kami menandai kotak pilihan Hantar ke Log Analitis dan kotak pilihan panel LOG: DataPlaneRequests, MongoRequests dan QueryRuntimeStatistics, dan di bawah pada panel METRIC – kotak pilihan Permintaan. Kemudian kami menetapkan nama dan menyimpan tetapan. Pada baris arahan, ini mewakili dua baris kod. Dengan cara ini, cangkerang Awan Azure dalam pengertian ini menyerupai Google, yang juga membolehkan anda menggunakan baris arahan dalam pelayar web anda. AWS tidak mempunyai apa-apa seperti itu, jadi Azure adalah lebih mudah dalam pengertian ini.

Sebagai contoh, saya boleh menjalankan demo melalui antara muka web tanpa menggunakan sebarang kod pada komputer riba saya. Untuk melakukan ini, saya mesti mengesahkan dengan akaun Azure saya. Kemudian anda boleh menggunakan, sebagai contoh, terrafone, jika anda sudah menggunakannya, tunggu sambungan kepada perkhidmatan dan dapatkan persekitaran kerja Linux yang Microsoft gunakan secara lalai.

David O'Brien (Xirus): Metrik! Metrik! Metrik! Bahagian 1

Seterusnya, saya menggunakan Bash, terbina dalam Azure Cloud Shell. Perkara yang sangat berguna ialah IDE terbina dalam penyemak imbas, versi Kod VS yang ringan. Seterusnya, saya boleh pergi ke templat metrik ralat saya, mengeditnya dan menyesuaikannya mengikut keperluan saya.

David O'Brien (Xirus): Metrik! Metrik! Metrik! Bahagian 1

Setelah anda menyediakan koleksi metrik dalam templat ini, anda boleh menggunakannya untuk membuat metrik untuk keseluruhan infrastruktur anda. Setelah kami menggunakan metrik, mengumpulnya dan menyimpannya, kami perlu memvisualisasikannya.

David O'Brien (Xirus): Metrik! Metrik! Metrik! Bahagian 1

Azure Monitor hanya berurusan dengan metrik dan tidak memberikan gambaran keseluruhan tentang kesihatan sistem anda. Anda mungkin mempunyai beberapa aplikasi lain yang dijalankan di luar persekitaran Azure. Jadi jika anda perlu memantau semua proses, memvisualisasikan semua metrik yang dikumpul di satu tempat, maka Azure Monitor tidak sesuai untuk ini.

Untuk menyelesaikan masalah ini, Microsoft menawarkan alat Power BI, perisian komprehensif untuk analisis perniagaan yang merangkumi visualisasi pelbagai jenis data. Ini adalah produk yang agak mahal, kosnya bergantung pada set fungsi yang anda perlukan. Secara lalai, ia menawarkan anda 48 jenis data untuk diproses dan dipautkan kepada Gudang Data Azure SQL, Storan Tasik Data Azure, Perkhidmatan Pembelajaran Mesin Azure dan Azure Databricks. Menggunakan kebolehskalaan, anda boleh menerima data baharu setiap 30 minit. Ini mungkin atau mungkin tidak mencukupi untuk keperluan anda jika anda memerlukan visualisasi pemantauan masa nyata. Dalam kes ini, adalah disyorkan untuk menggunakan aplikasi seperti Grafana yang saya nyatakan. Selain itu, dokumentasi Microsoft menerangkan keupayaan untuk menghantar metrik, log dan jadual acara menggunakan alat SIEM kepada sistem visualisasi radar Splunk, SumoLogic, ELK dan IBM.

23:40 min

Akan diteruskan tidak lama lagi...

Beberapa iklan πŸ™‚

Terima kasih kerana tinggal bersama kami. Adakah anda suka artikel kami? Ingin melihat kandungan yang lebih menarik? Sokong kami dengan membuat pesanan atau mengesyorkan kepada rakan, cloud VPS untuk pembangun dari $4.99, analog unik pelayan peringkat permulaan, yang kami cipta untuk anda: Keseluruhan kebenaran tentang VPS (KVM) E5-2697 v3 (6 Teras) 10GB DDR4 480GB SSD 1Gbps daripada $19 atau bagaimana untuk berkongsi pelayan? (tersedia dengan RAID1 dan RAID10, sehingga 24 teras dan sehingga 40GB DDR4).

Dell R730xd 2 kali lebih murah di pusat data Equinix Tier IV di Amsterdam? Hanya disini 2 x Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 TV daripada $199 di Belanda! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - daripada $99! Baca tentang Bagaimana untuk membina infrastruktur corp. kelas dengan penggunaan pelayan Dell R730xd E5-2650 v4 bernilai 9000 euro untuk satu sen?

Sumber: www.habr.com

Tambah komen