Mengenai keanehan habrostatistik

Saya telah melihat tingkah laku pelik dalam penilaian sebelum ini, tetapi baru-baru ini keanehan itu menjadi terlalu jelas. Dan saya memutuskan untuk menyiasat masalah menggunakan kaedah saintifik yang tersedia untuk saya, iaitu: untuk menganalisis dinamik tambah-tolak. Adakah anda tiba-tiba membayangkan?

Saya masih seorang pengaturcara, tetapi saya boleh melakukan perkara yang sangat asas. Jadi saya mengodkan utiliti mudah yang mengumpul statistik dari panel jawatan Khabrov: kebaikan, keburukan, pandangan, penanda halaman, dll.

Mengenai keanehan habrostatistik

Statistik dipaparkan dalam graf, selepas mengkaji yang mana kami dapat menemui beberapa lagi kejutan, yang lebih kecil. Tetapi perkara pertama dahulu.

Keanehan 1.
Di sinilah sebenarnya penyelidikan statistik saya bermula.

Nampaknya pelik kepada saya bahawa dalam beberapa jam pertama selepas penerbitan beberapa siaran saya, mereka menjadi negatif secara mendadak, kemudian menjadi sifar dan akhirnya memperoleh tambah yang diharapkan. Mengapa ia berlaku?

Saya baru sahaja hendak menerbitkan satu lagi siaran - dalam dua bahagian. Saya memutuskan untuk menundukkan dia kepada analisis statistik.

Menerbitkan bahagian pertama. Pada masa yang sama, saya melancarkan utiliti dan mula menunggu hasilnya. Malangnya, pada waktu malam - semasa saya sedang tidur - program berhenti mengumpul maklumat kerana pepijat. Keesokan paginya saya membetulkan kesilapan, tetapi statistik ternyata tidak sampai sehari. Walau bagaimanapun, trend juga jelas untuk masa bekerja.

Data disediakan untuk 14 jam pertama dari saat penerbitan, selang antara pengukuran ialah 10 minit.

Mengenai keanehan habrostatistik

Mata tidak menipu kami: kebanyakan minus berlaku pada jam pertama kewujudan jawatan itu. Pada mulanya jawatan itu masuk ke wilayah negatif, kemudian ia pulih. Berikut adalah nombor yang digunakan untuk memplot graf:

Mengenai keanehan habrostatistik

Dan ini walaupun pada hakikatnya pandangan meningkat dengan lancar!

Mengenai keanehan habrostatistik

Langkah-langkah bermula dari nilai seribu dijelaskan oleh fakta bahawa singkatan bermula di panel Khabrov: tidak ada tempat untuk mendapatkan jumlah tontonan yang tepat (mungkin ia boleh diambil dari perkhidmatan pihak ketiga, tetapi saya tidak menggunakannya ).

Saya bukan pakar dalam statistik, tetapi pengedaran tolak sedemikian adalah tidak normal, sejauh yang saya faham?!

Lihat, penanda halaman diedarkan lebih kurang sama rata sepanjang tempoh pendaftaran:

Mengenai keanehan habrostatistik

Komen juga diedarkan sama rata:

Mengenai keanehan habrostatistik

Terdapat letusan aktiviti dan pasif, tetapi ia juga diedarkan sepanjang tempoh: mengulas sama ada pudar atau menyambung semula.

Begitu juga dengan pelanggan – terdapat peningkatan yang seragam:

Mengenai keanehan habrostatistik

Karma tidak berubah semasa tempoh pelaporan - saya tidak memetiknya. Dan penilaian itu dikira oleh Habr, tidak ada gunanya menyenaraikannya.

Semua penunjuk berubah mengikut perkadaran dengan bilangan tontonan, dan hanya dengan minus adalah sesuatu yang salah: ledakan kemarahan berlaku pada jam pertama dari permulaan penerbitan. Perkara yang sama berlaku dengan catatan saya sebelum ini. Tetapi jika sebelum ini, boleh dikatakan, tanggapan peribadi, kini ia disahkan melalui pendaftaran.

Pada pendapat saya yang noob semata-mata, pengedaran sedemikian bermakna: terdapat beberapa pengguna di tapak yang sengaja melihat siaran terkini yang diterbitkan dan menolak beberapa siaran - berdasarkan keperluan yang hanya diketahui oleh mereka. Saya menulis "beberapa catatan" kerana saya perhatikan kesan ini bukan sahaja dalam penerbitan saya. Dalam semua kes, kesannya jelas, jika tidak, saya tidak akan memberi perhatian kepadanya.

Saya mempunyai empat versi mengapa ini berlaku.

ВСрсия 1. Penyimpangan mental. Orang yang sakit sengaja mengawasi pengarang yang mereka rasa tidak menyenangkan dan menurunkan undi mereka, dengan matlamat mencederakan mereka.

Saya tidak percaya dengan versi ini.

ВСрсия 2. Kesan psikologi. Yang mana satu - saya tidak tahu. Nah, mengapa pembaca mula-mula sebulat suara menolak siaran itu, kemudian tidak kurang sebulat suara menyokongnya? Adakah mereka tolak sebagai bukan tematik, tetapi ditambah selepas ahli kecantikan mendapati diri mereka dalam majoriti? Saya tidak tahu.

Jika ada ahli psikologi di kalangan pembaca, biarlah mereka bersuara.

ВСрсия 3. Hamba berlakon. Mengapa bos mereka perlu menyebarkan busuk pada jawatan Khabrov Tuhan yang tahu. Walau bagaimanapun, terdapat anggota kerahan bukan sahaja di negara kita. Siapa yang akan memahami mereka, Russophobes?!

ВСрсия 4. Kesan gabungan faktor yang dinyatakan sebelum ini.

Agak boleh dibayangkan.

Walau apa pun, penolak berjaya mengurangkan bilangan tontonan. Saya tidak biasa dengan peraturan untuk membawa siaran Khabrov ke atas, saya tidak tahu sama ada algoritma ini telah didedahkan kepada umum atau tidak, tetapi ia jelas kepada saya: tolak awal tidak membenarkan jawatan yang diasingkan untuk mencapai puncak - lebih tepat lagi, ia melambatkan ke sana, yang seterusnya dengan ketara, pada masa-masa tertentu, mengurangkan bilangan tontonan.

Setakat yang saya faham, tidak ada cara yang berkesan untuk memerangi kejahatan ini. Satu-satunya cara ialah mengundi peribadi. Hanya dalam kes ini anda boleh menentukan profil yang menjejaki secara berkala dan menolak siaran terkini. Walau bagaimanapun, tiada undian peribadi pada HabrΓ© (atau lebih tepat, ia tidak didedahkan kepada umum).

Tetapi tidak semuanya begitu mudah.

Seperti yang saya katakan, bahan yang dibedah itu diterbitkan dalam bahagian. Selepas penerbitan bahagian kedua, saya menjangkakan gambar yang sama: dengan output awal dalam tolak dan yang berikutnya dalam tambah. Walau bagaimanapun, kesannya ternyata lebih lancar: jawatan itu tidak berubah menjadi tolak.

Pada masa bahagian kedua diterbitkan, pepijat telah dibetulkan, jadi data diberikan setiap hari:

Mengenai keanehan habrostatistik

Saya tidak tahu dari mana datangnya pelicinan itu. Mungkin kerana ia diterbitkan pada hari Sabtu (undi bawah tidak berfungsi pada hari Sabtu?) atau kerana ini adalah penamat bahan yang diterbitkan sebelum ini.

Walau bagaimanapun, pengedaran tolak masih tidak sekata: semua tolak berlaku pada separuh pertama tempoh pendaftaran, dan tolak berakhir lebih awal daripada tambah. Pada masa yang sama, paparan diedarkan sepanjang tempoh sama seperti kali terakhir - sama rata:

Mengenai keanehan habrostatistik

Kenaikan yang berlaku sekitar pukul tiga petang itu bukan bahan sulit. Internet saya baru sahaja terputus selama sejam. Utiliti tidak dapat menyambung ke tapak.

Mengenai keanehan habrostatistik

Semua yang lain adalah standard sepenuhnya.

Penanda halaman:

Mengenai keanehan habrostatistik

Komen: seperti kali terakhir, tempoh aktiviti silih berganti dengan tempoh senyap.

Mengenai keanehan habrostatistik

Karma. Peningkatan beberapa unit telah direkodkan - sudah tentu, bukan serentak:

Mengenai keanehan habrostatistik

Dan pelanggan. Jumlahnya kekal tidak berubah (nampaknya, mereka yang berminat mendaftar apabila bahagian pertama diterbitkan). Hanya sekitar jam satu tengah hari terdapat satu turun naik: seseorang berhenti melanggan - mungkin tersilap - tetapi segera mendaftar semula. Jika ia adalah orang yang berbeza, pampasan berlaku: jumlah bilangan pelanggan tidak berubah.

Mengenai keanehan habrostatistik

Jadi, metrik siaran berkelakuan dengan cara yang jelas dan boleh diramal. Semua penunjuk, kecuali tolak. Oleh kerana saya tidak melihat sebab yang jelas untuk ini, saya mendapati puncak tolak sekurang-kurangnya pelik.

Keanehan 2.
Kadang-kadang bilangan tontonan berkurangan (yang, sudah tentu, adalah mustahil), tetapi tidak lama lagi kembali normal.

Saya menjejakinya secara tidak sengaja, semasa menyahpepijat atur cara, apabila fungsi eksport-import belum lagi dilampirkan, jadi zigzag yang sepadan hilang pada graf. Anda boleh mengambil kata-kata saya untuk itu - kesan ini diperhatikan dua kali. Beberapa ribu tontonan, tiba-tiba jumlah tontonan berkurangan beberapa ratus, selepas 10-20 minit ia dipulihkan ke tahap sebelumnya (tanpa mengambil kira peningkatan semula jadi).

Ini agak mudah: pepijat di tapak. Dan tiada apa yang perlu difikirkan.

Keanehan 3.
Inilah yang saya rasa lebih pelik daripada kesan pertama dan teknikal kedua secara sukarela. Tambahan tidak berlaku secara tunggal, dengan pengagihan seragam sepanjang tempoh, tetapi dalam blok. Tetapi menambah bukan ulasan, apabila soalan secara semula jadi diikuti dengan jawapan, ia adalah tindakan individu!

Lihat dengan lebih dekat pada graf hasil yang diterbitkan di atas: blok adalah ketara.

Orang yang berpengetahuan mengangguk kepada saya tentang pengedaran Poisson, tetapi saya tidak dapat mengira kebarangkalian itu sendiri. Jika anda mampu, lakukan matematik. Sudah jelas kepada saya bahawa bilangan tambah berganda jauh melebihi norma.

Berikut ialah data digital tentang kelebihan bahagian pertama siaran. Graf menunjukkan bilangan tambah untuk kedudukan tunggal, dua kali ganda dan tiga kali ganda dalam jumlah bilangan penilaian yang diberikan. Seperti yang dinyatakan sebelum ini, selang pengukuran ialah 10 minit.

Mengenai keanehan habrostatistik

Daripada 30 cucuk dalam 84 sel, dua sel dicucuk tiga kali. Nah, saya tidak tahu sejauh mana ini sepadan dengan teori kebarangkalian...

Data untuk bahagian kedua siaran (memandangkan tempoh pengukuran lebih panjang, saya memendekkannya mengikut tempoh bahagian pertama, untuk perbandingan):

Mengenai keanehan habrostatistik

Ngomong-ngomong, di sini salah satu tambah tunggal adalah bersebelahan dalam masa dengan tiga kali ganda, iaitu, dalam kira-kira 20 minit terdapat lonjakan dalam tambah (29% daripada jumlah mereka adalah tambah). Dan ini tidak berlaku pada minit pertama penerbitan.

Hubungan antara kedudukan tunggal, dua dan tiga adalah lebih kurang sama seperti bahagian pertama. Dan penurunan bahagian penilaian dalam ukuran dijelaskan oleh fakta bahawa penarafan diberikan kurang kerap. Pengukuran telah diambil, tetapi tiada kelebihan direkodkan.

Saya tidak dapat menjelaskan kesan campur blok ini dalam apa jua cara, iaitu, tidak sama sekali. Untuk keburukan, tingkah laku "menghalang" sedemikian nampaknya tidak tipikal.

Adakah pemancar kebaikan menghantar cadangan secara berkelompok, menghidupkan dan mematikan? Hehehehe...

PS
Jika sesiapa ingin menganalisis statistik siaran menggunakan kaedah yang lebih maju atau menyemak aritmetik, fail dengan data sumber ada di sini:
yadi.sk/d/iN4SL6tzsGEQxw

Saya tidak menegaskan keraguan saya - mungkin saya salah, terutamanya kerana statistiknya suram. Saya berharap komen daripada ahli statistik profesional, ahli psikologi dan pengguna lain yang berminat akan menjelaskan kekeliruan yang timbul.

Terima kasih atas perhatian anda.

Sumber: www.habr.com

Tambah komen