Habrostatistikaning g'alati jihatlari haqida

Men ilgari reytinglarda g'alati xatti-harakatlarni sezganman, ammo yaqinda g'alatilik juda aniq bo'lib qoldi. Va men muammoni menda mavjud bo'lgan ilmiy usullardan foydalangan holda tekshirishga qaror qildim, ya'ni: ortiqcha-minus dinamikasini tahlil qilish. Birdan tasavvur qildingizmi?

Men hali ham dasturchiman, lekin juda oddiy narsalarni qila olaman. Shunday qilib, men Xabrov postining panellaridan statistik ma'lumotlarni to'playdigan oddiy yordamchi dasturni kodladim: afzalliklari, kamchiliklari, ko'rinishlari, xatcho'plari va boshqalar.

Habrostatistikaning g'alati jihatlari haqida

Statistik ma'lumotlar grafiklarda aks ettirilgan, ularni o'rganib chiqqanimizdan so'ng biz yana bir nechta kutilmagan hodisalarni, kichikroqlarini aniqlashga muvaffaq bo'ldik. Lekin birinchi narsa birinchi.

G'alati 1.
Bu erda mening statistik tadqiqotlarim boshlandi.

Mening ba'zi postlarim chop etilgandan keyingi dastlabki soatlarda ular keskin salbiy ko'rinishga ega bo'lib, keyin nolga tushib, oxir-oqibat kutilgan plyusga ega bo'lishlari menga g'alati tuyuldi. Nima uchun bu sodir bo'ldi?

Men yana bir postni nashr etmoqchi edim - ikki qismdan iborat. Men uni statistik tahlilga topshirishga qaror qildim.

Birinchi qismini chop etdi. Shu bilan birga, men yordamchi dasturni ishga tushirdim va natijani kutishni boshladim. Afsuski, kechalari - men uxlayotganimda, dastur xato tufayli ma'lumot to'plashni to'xtatdi. Ertasi kuni ertalab men xatoni tuzatdim, ammo statistika bir kundan kamroq vaqtga to'g'ri keldi. Biroq, tendentsiyalar ishlagan vaqt uchun ham aniq.

Ma'lumotlar e'lon qilingan paytdan boshlab dastlabki 14 soat davomida taqdim etiladi, o'lchovlar orasidagi interval 10 minut.

Habrostatistikaning g'alati jihatlari haqida

Ko'zlar bizni aldamadi: minuslarning aksariyati postning mavjudligining birinchi soatida sodir bo'ladi. Avvaliga post salbiy hududga kirdi, keyin u tiklandi. Grafikni tuzish uchun quyidagi raqamlar ishlatiladi:

Habrostatistikaning g'alati jihatlari haqida

Va bu ko'rishlar asta-sekin o'sib borayotganiga qaramay!

Habrostatistikaning g'alati jihatlari haqida

Minginchi qiymatlardan boshlanadigan qadamlar qisqartmalar Xabrov panelida boshlanishi bilan izohlanadi: ko'rishlarning aniq sonini olish uchun hech qanday joy yo'q (ehtimol bu uchinchi tomon xizmatlaridan olingan bo'lishi mumkin, lekin men ulardan foydalanmadim. ).

Men statistika bo'yicha mutaxassis emasman, lekin minuslarning bunday taqsimlanishi g'ayritabiiy, men tushunganimdek?!

Qarang, xatcho'plar ro'yxatga olish davrida ko'proq yoki kamroq taqsimlanadi:

Habrostatistikaning g'alati jihatlari haqida

Sharhlar ham teng taqsimlangan:

Habrostatistikaning g'alati jihatlari haqida

Faollik va passivlikning portlashlari bor, lekin ular ham davr bo'ylab taqsimlanadi: sharhlash yo o'chadi yoki davom etadi.

Abonentlar bilan ham xuddi shunday - bir xilda biroz o'sish bor:

Habrostatistikaning g'alati jihatlari haqida

Hisobot davrida karma o'zgarmadi - men buni keltirmayman. Va reyting Habr tomonidan hisoblab chiqilgan, uni ro'yxatga olishning ma'nosi yo'q.

Barcha ko'rsatkichlar ko'rishlar soniga mutanosib ravishda o'zgaradi va faqat minuslar bilan noto'g'ri narsa: g'azabning portlashi nashr boshlanganidan boshlab birinchi soatda sodir bo'ladi. Xuddi shu narsa mening oldingi postlarim bilan sodir bo'ldi. Ammo agar ilgari bu shaxsiy taassurotlar bo'lsa, endi ular ro'yxatdan o'tish orqali tasdiqlanadi.

Mening fikrimcha, bunday tarqatish shuni anglatadiki, saytda bir nechta foydalanuvchilar bor, ular faqat o'zlariga ma'lum bo'lgan ehtiyojdan kelib chiqib, so'nggi e'lon qilingan xabarlarni maqsadli ravishda ko'rib chiqadilar va ba'zi xabarlarni pastga baholaydilar. Men "ba'zi xabarlar" ni yozaman, chunki men bu ta'sirni nafaqat nashrlarimda sezdim. Har holda, ta'sir sezilarli bo'ladi, aks holda men bunga e'tibor bermagan bo'lardim.

Nima uchun bu sodir bo'lishining to'rtta versiyasi bor.

Versiya 1. Ruhiy buzilish. Kasal odamlar o'zlariga yoqimsiz bo'lgan mualliflarni ataylab kuzatib boradilar va ularga zarar yetkazish maqsadida ularni past baholaydilar.

Men bu versiyaga ishonmayman.

Versiya 2. Psixologik ta'sir. Qaysi biri - men bilmayman. Xo'sh, nega o'quvchilar bir ovozdan postni rad etadilar, keyin esa bir ovozdan uni yoqlaydilar? Ular tematik bo'lmagan kabi minusmi, lekin go'zallikni biluvchilar ko'pchilikni topgandan keyin? Bilmayman bilmayman.

O‘quvchilar orasida psixologlar bo‘lsa, o‘z fikrini bildirsin.

Versiya 3. Xizmatkorlar harakat qilmoqda. Nega ularning boshliqlari Xabrovning postlariga chirishi kerak? Biroq, nafaqat bizning mamlakatimizda harbiy xizmatchilar bor. Ularni kim tushunadi, rusofoblar?!

Versiya 4. Yuqorida aytib o'tilgan omillarning birgalikdagi ta'siri.

Juda tasavvur qilish mumkin.

Qanday bo'lmasin, minuslar ko'rishlar sonini kamaytirishga muvaffaq bo'lishadi. Men Xabrovning postlarini yuqoriga ko'tarish qoidalari bilan tanish emasman, bu algoritmlar ommaga e'lon qilinganmi yoki yo'qligini ham bilmayman, lekin bu menga ayon: erta minus chetlangan postlarning yuqoriga chiqishiga imkon bermaydi - aniqrog'i, u erga borishni kechiktiradi, bu esa o'z navbatida, ko'rishlar sonini sezilarli darajada kamaytiradi.

Men tushunganimdek, bu yovuzlikka qarshi kurashishning samarali usullari yo'q. Yagona yo'l - shaxsiy ovoz berish. Faqat bu holatda siz qaysi profillar vaqti-vaqti bilan kuzatilayotganini va so'nggi xabarlarni olib tashlashni aniqlashingiz mumkin. Biroq, Habré bo'yicha shaxsiy ovoz berish yo'q (aniqrog'i, u ochiqlanmaydi).

Ammo hamma narsa juda oddiy emas.

Aytganimdek, ajratilgan material qismlarga bo'lingan. Ikkinchi qism nashr etilgandan so'ng, men shunga o'xshash rasmni kutgandim: dastlabki chiqish minusda va keyingisi plyusda. Biroq, ta'sir ancha silliqlashdi: post minusga aylanmadi.

Ikkinchi qism chop etilganda, xato tuzatildi, shuning uchun ma'lumotlar kuniga beriladi:

Habrostatistikaning g'alati jihatlari haqida

Men silliqlash qayerdan kelganini bilmayman. Ehtimol, u shanba kuni chop etilgan (past ovozlar shanba kuni ishlamaydimi?) yoki bu avval chop etilgan materialning oxiri.

Biroq, minuslarning taqsimlanishi hali ham notekis: barcha minuslar ro'yxatga olish davrining birinchi yarmida sodir bo'ladi va minus ortiqchadan ancha oldin tugaydi. Shu bilan birga, ko'rishlar davr bo'yicha xuddi oxirgi marta bo'lgani kabi taqsimlanadi - teng ravishda:

Habrostatistikaning g'alati jihatlari haqida

Tushdan keyin soat uchlar atrofida sodir bo'lgan keskin ko'tarilish maxfiy material emas. Mening internetim bir soatcha uzilib qoldi. Yordamchi dastur saytga ulana olmadi.

Habrostatistikaning g'alati jihatlari haqida

Qolganlarning hammasi standart.

Xatcho'plar:

Habrostatistikaning g'alati jihatlari haqida

Sharhlar: oxirgi marta bo'lgani kabi, faoliyat davrlari sukunat davrlari bilan almashadi.

Habrostatistikaning g'alati jihatlari haqida

Karma. Bir necha birlikning o'sishi qayd etildi - albatta, bir vaqtning o'zida emas:

Habrostatistikaning g'alati jihatlari haqida

Va obunachilar. Umumiy soni o'zgarishsiz qoldi (ko'rinishidan, birinchi qism chop etilganda qiziquvchilar ro'yxatdan o'tgan). Peshindan keyin soat birlar atrofida bitta tebranish bor edi: kimdir obunani bekor qildi - ehtimol xatolik bilan - lekin darhol qayta ro'yxatdan o'tdi. Agar u boshqa shaxs bo'lsa, kompensatsiya sodir bo'ldi: abonentlarning umumiy soni o'zgarmadi.

Habrostatistikaning g'alati jihatlari haqida

Shunday qilib, post ko'rsatkichlari aniq va bashorat qilinadigan tarzda harakat qiladi. Minuslardan tashqari barcha ko'rsatkichlar. Buning aniq sababini ko'rmaganim uchun, men minus cho'qqini hech bo'lmaganda g'alati deb bilaman.

G'alati 2.
Ba'zida ko'rishlar soni kamayadi (bu, albatta, mumkin emas), lekin tez orada normal holatga qaytadi.

Men uni tasodifan, dasturni disk raskadrovka qilishda, eksport-import funksiyasi hali biriktirilmaganda kuzatdim, shuning uchun grafikda mos keladigan zigzag yo'q. Siz mening so'zimni qabul qilishingiz mumkin - bu ta'sir ikki marta kuzatilgan. Bir necha ming ko'rish, birdan ko'rishlar soni bir necha yuzga kamayadi, 10-20 daqiqadan so'ng u avvalgi darajasiga qaytadi (tabiiy o'sishni hisobga olmagan holda).

Bu juda oddiy: saytdagi xato. Va o'ylaydigan hech narsa yo'q.

G'alati 3.
Bu menga voluntaristik birinchi va texnik ikkinchi effektlardan ko'ra g'alati tuyuldi. Plyuslar birma-bir sodir bo'lmaydi, davr bo'yicha bir xil taqsimlanadi, lekin bloklarda. Lekin qo'shish izoh emas, agar savoldan keyin tabiiy ravishda javob kelsa, ular individual harakatdir!

Yuqorida e'lon qilingan natijalar grafiklarini diqqat bilan ko'rib chiqing: bloklar sezilarli.

Bilimli odamlar menga Puasson taqsimoti haqida bosh irg'adi, lekin men o'zim bu ehtimollikni hisoblay olmayman. Agar imkoningiz bo'lsa, matematikani bajaring. Menga allaqachon ayon bo'ldiki, ikki tomonlama plyuslar soni normadan ancha oshadi.

Bu erda postning birinchi qismining afzalliklari haqida raqamli ma'lumotlar mavjud. Grafikda berilgan reytinglarning umumiy sonida bitta, ikki va uch martalik pozitsiyalar uchun plyuslar soni ko'rsatilgan. Yuqorida aytib o'tilganidek, o'lchov oralig'i 10 minut.

Habrostatistikaning g'alati jihatlari haqida

30 ta hujayradagi 84 ta pokedan ikkitasi uch marta teshilgan. Xo'sh, bu ehtimollik nazariyasiga qanchalik mos kelishini bilmayman ...

Xabarning ikkinchi qismi uchun ma'lumotlar (o'lchov muddati uzoqroq bo'lganligi sababli, taqqoslash uchun uni birinchi qismning davomiyligiga qarab qisqartiraman):

Habrostatistikaning g'alati jihatlari haqida

Aytgancha, bu erda bitta plyuslardan biri uch barobarga o'z vaqtida qo'shni, ya'ni taxminan 20 daqiqada plyuslarning ko'payishi kuzatildi (ularning umumiy sonining 29 foizi plyuslar edi). Va bu nashrning birinchi daqiqalarida sodir bo'lmadi.

Yagona, ikki va uch pozitsiyalar o'rtasidagi munosabatlar birinchi qism bilan taxminan bir xil. Va o'lchovlardagi reytinglar ulushining kamayishi reytinglar kamroq berilganligi bilan izohlanadi. O'lchovlar olib borildi, ammo hech qanday afzalliklar qayd etilmadi.

Men bu blok plyus effektini hech qanday tarzda tushuntira olmayman, ya'ni umuman emas. Kamchiliklari uchun bunday "blokli" xatti-harakatlar odatiy ko'rinmaydi.

Yaxshilik emitentlari o'z takliflarini yoqadimi yoki o'chiradimi? Hehehehe...

PS
Agar kimdir ilg'or usullardan foydalangan holda post statistikasini tahlil qilishni yoki arifmetikani tekshirishni xohlasa, manba ma'lumotlari bo'lgan fayllar bu erda:
yadi.sk/d/iN4SL6tzsGEQxw

Men o'zimning shubhalarimni talab qilmayman - ehtimol men noto'g'riman, ayniqsa statistik ma'lumotlar noaniq bo'lgani uchun. Umid qilamanki, professional statistiklar, psixologlar va boshqa manfaatdor foydalanuvchilarning izohlari yuzaga kelgan chalkashliklarga oydinlik kiritadi.

E'tiboringiz uchun rahmat.

Manba: www.habr.com

a Izoh qo'shish