Par habrostatistikas dīvainībām

Jau iepriekÅ” esmu pamanÄ«jis dÄ«vainu uzvedÄ«bu reitingos, taču pēdējā laikā dÄ«vainÄ«ba ir kļuvusi pārāk acÄ«mredzama. Un es nolēmu izpētÄ«t problēmu, izmantojot man pieejamās zinātniskās metodes, proti: analizēt plus-mÄ«nus dinamiku. Vai pēkŔņi iedomājies?

Es joprojām esmu programmētājs, bet varu darÄ«t ļoti elementāras lietas. Tāpēc es iekodēju vienkārÅ”u utilÄ«tu, kas apkopo statistiku no Habrova ziņojuma paneļiem: plusi, mÄ«nusi, skatÄ«jumi, grāmatzÄ«mes utt.

Par habrostatistikas dīvainībām

Statistika ir attēlota grafikos, pēc kuru izpētes varējām atklāt vēl pāris pārsteigumus, mazākus. Bet vispirms vispirms.

Dīvainība 1.
Šeit faktiski sākās mans statistikas pētījums.

Man Ŕķita dÄ«vaini, ka pirmajās stundās pēc dažu manu ierakstu publicÄ“Å”anas tie strauji kļuva negatÄ«vi, pēc tam aizgāja uz nulli un galu galā nopelnÄ«ja gaidÄ«to plusu. Kāpēc tas notika?

Tikko grasÄ«jos publicēt vēl vienu ierakstu ā€“ divās daļās. Es nolēmu viņu pakļaut statistiskai analÄ«zei.

Publicēja pirmo daļu. Tajā paŔā laikā es palaižu utilÄ«tu un sāku gaidÄ«t rezultātu. Diemžēl naktÄ« - kamēr es gulēju - programma pārtrauca vākt informāciju kļūdas dēļ. Nākamajā rÄ«tā kļūdu izlaboju, bet statistika izrādÄ«jās par nepilnu dienu. Tomēr tendences ir acÄ«mredzamas arÄ« attiecÄ«bā uz nostrādāto laiku.

Dati sniegti par pirmajām 14 stundām no publicÄ“Å”anas brīža, intervāls starp mērÄ«jumiem ir 10 minÅ«tes.

Par habrostatistikas dīvainībām

Acis mÅ«s nepievÄ«la: lielākā daļa mÄ«nusu rodas pirmajā pasta pastāvÄ“Å”anas stundā. Sākumā ieraksts nonāca negatÄ«vajā teritorijā, bet pēc tam atguvās. Å eit ir norādÄ«ti skaitļi, kas izmantoti diagrammas attēloÅ”anai:

Par habrostatistikas dīvainībām

Un tas neskatoties uz to, ka skati nepārtraukti pieaug!

Par habrostatistikas dīvainībām

DarbÄ«bas, kas sākas ar tÅ«kstoÅ”daļām, ir izskaidrojamas ar to, ka saÄ«sinājumi sākas Habrova panelÄ«: nav kur iegÅ«t precÄ«zu skatÄ«jumu skaitu (iespējams, to varēja ņemt no treÅ”o puÅ”u pakalpojumiem, bet es tos neizmantoju ).

Neesmu eksperts statistikā, bet tāds mīnusu sadalījums ir nenormāls, cik saprotu?!

Paskatieties, grāmatzīmes reģistrācijas periodā ir sadalītas vairāk vai mazāk vienmērīgi:

Par habrostatistikas dīvainībām

Komentāri ir arī vienmērīgi sadalīti:

Par habrostatistikas dīvainībām

Ir aktivitātes un pasivitātes uzliesmojumi, taču tie ir arÄ« sadalÄ«ti pa periodu: komentÄ“Å”ana vai nu izgaist, vai atsāk.

Tas pats ar abonentiem - ir vienmērīgs neliels pieaugums:

Par habrostatistikas dīvainībām

Karma pārskata periodā nemainÄ«jās ā€“ es to necitÄ“Å”u. Un reitingu rēķina Habrs, nav jēgas to uzskaitÄ«t.

Visi rādÄ«tāji mainās proporcionāli skatÄ«jumu skaitam, un tikai ar mÄ«nusiem kaut kas nav kārtÄ«bā: dusmu uzliesmojums notiek pirmajā stundā no publicÄ“Å”anas sākuma. Tas pats notika ar maniem iepriekŔējiem ierakstiem. Bet, ja agrāk tie bija, tā teikt, personÄ«gi iespaidi, tad tagad tos apstiprina reÄ£istrācija.

Pēc manām tÄ«ri noob domām, Ŕāds sadalÄ«jums nozÄ«mē: vietnē ir vairāki lietotāji, kuri mērÄ·tiecÄ«gi skatās jaunākos publicētos ierakstus un dažus ierakstus noņem negatÄ«vi ā€“ pamatojoties uz tikai viņiem zināmu vajadzÄ«bu. Es rakstu ā€œdažus ierakstusā€, jo Å”o efektu pamanÄ«ju ne tikai savās publikācijās. Visos gadÄ«jumos efekts ir izteikts, citādi es tam vienkārÅ”i nebÅ«tu pievērsusi uzmanÄ«bu.

Man ir četras versijas, kāpēc tas notiek.

1. versija. GarÄ«gā perversija. Slimi cilvēki apzināti uzrauga autorus, kuri viņiem Ŕķiet nepatÄ«kami, un tos negatÄ«vi vērtē, lai tiem nodarÄ«tu kaitējumu.

Es neticu Ŕai versijai.

2. versija. PsiholoÄ£iskā ietekme. KurÅ” no tiem - es nezinu. Nu, kāpēc lasÄ«tāji vispirms vienbalsÄ«gi atņem ziņu, pēc tam ne mazāk vienbalsÄ«gi par to balso? Vai tie ir mÄ«nus kā netematiski, bet plus pēc tam, kad skaistuma pazinēji ir vairākumā? ES nezinu.

Ja lasītāju vidū ir psihologi, lai viņi izsaka savu viedokli.

3. versija. Kalpi rÄ«kojas. Kāpēc viņu priekÅ”niekiem vajadzētu izplatÄ«t puvi uz Habrova posteņiem? Dievs to zina. Tomēr militāristi ir ne tikai mÅ«su valstÄ«. KurÅ” viņus sapratÄ«s, rusofobi?!

4. versija. IepriekÅ” minēto faktoru kombinētā ietekme.

Diezgan iedomājami.

Lai kā arÄ« bÅ«tu, mÄ«nusiem izdodas samazināt skatÄ«jumu skaitu. Neesmu iepazinies ar noteikumiem par Habrova ierakstu celÅ”anu topā, pat nezinu, vai Å”ie algoritmi ir publiskoti vai nē, bet man tas ir skaidrs: agrs mÄ«nuss neļauj izstumtajiem ierakstiem sasniegt virsotni. precÄ«zāk, tas aizkavē nokļūŔanu, kas savukārt bÅ«tiski, brīžiem samazina skatÄ«jumu skaitu.

Cik es saprotu, nav efektÄ«vu veidu, kā cÄ«nÄ«ties ar Å”o ļaunumu. VienÄ«gais veids ir personiskā balsoÅ”ana. Tikai Å”ajā gadÄ«jumā jÅ«s varat noteikt, kuri profili periodiski izseko un atskaitot jaunākās ziņas. Tomēr par Habrē nav personÄ«ga balsojuma (pareizāk sakot, tas netiek publiskots).

Bet ne viss ir tik vienkārŔi.

Kā jau teicu, preparētais materiāls tika publicēts pa daļām. Pēc otrās daļas publicÄ“Å”anas gaidÄ«ju lÄ«dzÄ«gu ainu: ar sākotnējo izlaidi mÄ«nusā un nākoÅ”o plusā. Tomēr efekts izrādÄ«jās daudz izlÄ«dzinātāks: stabs nepārvērsās par mÄ«nusu.

Līdz brīdim, kad tika publicēta otrā daļa, kļūda bija novērsta, tāpēc dati tiek sniegti dienā:

Par habrostatistikas dīvainībām

Nezinu, no kurienes nogludināŔana. VarbÅ«t tāpēc, ka tas tika publicēts sestdien (sestdienās negatÄ«vie balsojumi nedarbojas?) vai arÄ« tāpēc, ka ar Å”o beidzas iepriekÅ” publicētais materiāls.

Tomēr mÄ«nusu sadalÄ«jums joprojām ir nevienmērÄ«gs: visi mÄ«nusi rodas reÄ£istrācijas perioda pirmajā pusē, un mÄ«nusi beidzas daudz agrāk nekā plus. Tajā paŔā laikā skatÄ«jumi tiek sadalÄ«ti pa periodu tieÅ”i tāpat kā iepriekŔējo reizi - vienmērÄ«gi:

Par habrostatistikas dīvainībām

Raidījums, kas noticis ap trijiem pēcpusdienā, nav klasificēts materiāls. Mans internets tikko uz stundu pazuda. Lietderība nevarēja izveidot savienojumu ar vietni.

Par habrostatistikas dīvainībām

Viss pārējais ir pilnīgi standarta.

Grāmatzīmes:

Par habrostatistikas dīvainībām

Komentāri: tāpat kā pagājuÅ”ajā reizē, aktivitātes periodi mijas ar klusuma periodiem.

Par habrostatistikas dīvainībām

Karma. Tika reģistrēts pāris vienību pieaugums - protams, ne vienlaicīgi:

Par habrostatistikas dīvainībām

Un abonenti. Kopējais skaits palika nemainÄ«gs (acÄ«mredzot interesenti pierakstÄ«jās, kad tika publicēta pirmā daļa). Tikai ap pulksten vieniem pēcpusdienā bija atseviŔķas svārstÄ«bas: kāds atteicās no abonementa - iespējams, kļūdas pēc -, bet nekavējoties reÄ£istrējās vēlreiz. Ja tā bija cita persona, notika kompensācija: kopējais abonentu skaits nemainÄ«jās.

Par habrostatistikas dīvainībām

Tādējādi ziņu metrika darbojas skaidri un paredzami. Visi rādÄ«tāji, izņemot mÄ«nusus. Tā kā es tam neredzu acÄ«mredzamu iemeslu, man Ŕķiet, ka mÄ«nusa maksimums ir vismaz dÄ«vains.

Dīvainība 2.
Dažreiz skatījumu skaits samazinās (kas, protams, nav iespējams), bet drīz atgriežas normālā stāvoklī.

Es to izsekoju nejauÅ”i, atkļūdojot programmu, kad vēl nebija pievienota eksporta-importÄ“Å”anas funkcija, tāpēc grafikā trÅ«kst atbilstoŔā lÄ«kloča. JÅ«s varat pieņemt manu vārdu - Å”is efekts tika novērots divas reizes. Vairāki tÅ«kstoÅ”i skatÄ«jumu, pēkŔņi skatÄ«jumu skaits samazinās par pāris simtiem, pēc 10-20 minÅ«tēm tiek atjaunots iepriekŔējā lÄ«menÄ« (neņemot vērā dabisko pieaugumu).

Tas ir pavisam vienkārÅ”i: kļūda vietnē. Un nav par ko domāt.

Dīvainība 3.
Tas man Ŕķita daudz dÄ«vaināks par voluntāristisko pirmo un tehnisko otro efektu. Plusi nenotiek atseviŔķi, ar vienmērÄ«gu sadalÄ«jumu pa periodu, bet blokos. Bet pievienoÅ”ana nav komentārs, kad pēc jautājuma dabiski seko atbilde, tie ir individuāls akts!

SÄ«kāk apskatiet iepriekÅ” publicētos rezultātu grafikus: bloki ir pamanāmi.

ZinoÅ”i cilvēki man pamāja ar galvu par Puasona sadalÄ«jumu, bet es pats nespēju aprēķināt varbÅ«tÄ«bu. Ja varat, veiciet matemātiku. Man jau tagad ir skaidrs, ka dubultplusu skaits krietni pārsniedz normu.

Å eit ir digitālie dati par ziņojuma pirmās daļas priekÅ”rocÄ«bām. Grafikā parādÄ«ts plusu skaits vienvietÄ«gām, dubultām un trÄ«skārŔām pozÄ«cijām kopējā pieŔķirto vērtējumu skaitā. Kā minēts iepriekÅ”, mērÄ«jumu intervāls ir 10 minÅ«tes.

Par habrostatistikas dīvainībām

No 30 dūrieniem 84 kamerās divas Ŕūnas tika iedurtas trīs reizes. Nu, es nezinu, cik tas atbilst varbūtības teorijai...

Ieraksta otrās daļas dati (tā kā mērÄ«Å”anas periods ir garāks, salÄ«dzināmÄ«bas labad saÄ«sinu atbilstoÅ”i pirmās daļas ilgumam):

Par habrostatistikas dīvainībām

Starp citu, Å”eit viens no vienÄ«gajiem plusiem laika ziņā ir blakus trÄ«skārÅ”ajam, tas ir, kādās 20 minÅ«tēs notika plusu kāpums (29% no to kopskaita bija plusi). Un tas nenotika pirmajās publicÄ“Å”anas minÅ«tēs.

AttiecÄ«bas starp vienas, dubultās un trÄ«skārŔās pozÄ«cijas ir aptuveni tādas paÅ”as kā pirmajā daļā. Un vērtējumu Ä«patsvara samazināŔanās mērÄ«jumos skaidrojama ar to, ka vērtējumi tika sniegti retāk. MērÄ«jumi tika veikti, bet priekÅ”rocÄ«bas netika reÄ£istrētas.

Es nevaru nekādi izskaidrot Å”o bloka plus efektu, tas ir, nē. AttiecÄ«bā uz mÄ«nusiem Ŕāda ā€œblokainaā€ uzvedÄ«ba, Ŕķiet, nav raksturÄ«ga.

Vai labestības izstarotāji sūta ieteikumus pa partijām, ieslēdzot un izslēdzot? Hehehehe...

PS
Ja kāds vēlas analizēt ziņu statistiku, izmantojot progresÄ«vākas metodes vai pārbaudÄ«t aritmētiku, faili ar avota datiem ir Å”eit:
yadi.sk/d/iN4SL6tzsGEQxw

Es neuzstāju uz savām Å”aubām - iespējams, es kļūdos, jo Ä«paÅ”i tāpēc, ka statistika ir drÅ«ma. Ceru, ka raduÅ”os neskaidrÄ«bu skaidros profesionālu statistiÄ·u, psihologu un citu ieinteresēto lietotāju komentāri.

Paldies par uzmanību.

Avots: www.habr.com

Pievieno komentāru