Circa e stranezze di abrostatistica

Aghju nutatu un cumpurtamentu stranu in i valutazioni prima, ma recentemente a stranazza hè diventata troppu evidenti. E aghju decisu di investigà u prublema cù i metudi scientifichi dispunibili per mè, à dì: per analizà a dinamica di più-minus. L'avete imaginatu di colpu ?

Sò sempre un programatore, ma possu fà cose assai basi. Allora aghju codificatu una utilità simplice chì recullà statistiche da i pannelli di u postu di Khabrov: pros, cons, views, bookmarks, etc.

Circa e stranezze di abrostatistica

E statistiche sò affissate in grafici, dopu avè studiatu chì avemu pussutu scopre un paru di sorprese più, più chjuchi. Ma prima cosa prima.

Stranezza 1.
Hè quì chì a mo ricerca statistica hà iniziatu veramente.

Mi pareva stranu chì in e prime ore dopu à a publicazione di alcuni di i mo posti sò andati bruscamente negativu, poi andonu à cero è eventualmente guadagnau u plus previstu. Perchè hè accadutu?

Eru ghjustu à pubblicà un altru post - in dui parti. Aghju decisu di sottumettellu à l'analisi statistiche.

Publicatu a prima parte. À u listessu tempu, aghju lanciatu l'utilità è cuminciaru à aspittà per u risultatu. Sfurtunatamente, di notte - mentre dorme - u prugramma hà cessatu di cullà l'infurmazioni per via di un bug. A matina dopu aghju currettu l'errore, ma l'statìstichi sò stati per menu di un ghjornu. Tuttavia, i tendenzi sò ancu evidenti per u tempu travagliatu.

I dati sò furniti per i primi 14 ore da u mumentu di a publicazione, l'intervallu trà e misure hè di 10 minuti.

Circa e stranezze di abrostatistica

L'ochji ùn anu micca ingannatu: a maiò parte di i minus si trovanu in a prima ora di l'esistenza di u postu. À u principiu, u postu hè andatu in territoriu negativu, dopu si ritruvà. Eccu i numeri utilizati per trace u graficu:

Circa e stranezze di abrostatistica

E questu malgradu u fattu chì e vedute aumentanu liscia!

Circa e stranezze di abrostatistica

I passi chì partenu da i valori di millesimi sò spiegati da u fattu chì l'abbreviazioni cumincianu in u pannellu di Khabrov: ùn ci hè nudda parte per ottene u numeru esatta di vista (probabilmente puderia esse pigliatu da servizii di terzu, ma ùn l'aghju micca utilizatu). ).

Ùn sò micca un espertu in statistiche, ma una tale distribuzione di minus hè anormale, finu à ch'e aghju capitu ?!

Fighjate, i marcati sò distribuiti più o menu uniformemente in u periodu di registrazione:

Circa e stranezze di abrostatistica

I cumenti sò ancu distribuiti uniformemente:

Circa e stranezze di abrostatistica

Ci sò scoppi di l'attività è di passività, ma sò ancu distribuiti annantu à u periodu: cummentarii o fades o riprende.

U stessu cù l'abbonati - ci hè un ligeru aumentu uniforme:

Circa e stranezze di abrostatistica

Karma ùn hà micca cambiatu durante u periodu di rapportu - ùn sò micca citatu. È a qualificazione hè calculata da Habr, ùn ci hè nunda di u listinu.

Tutti l'indicatori cambianu in proporzione à u nùmeru di vista, è solu cù i minus hè qualcosa di male: l'esplosione di còllera si trova in a prima ora da u principiu di a publicazione. A listessa cosa hè accaduta cù i mo posti precedenti. Ma s'ellu prima sò stati, per dì cusì, impressioni persunali, avà sò cunfirmati da a registrazione.

In a mo opinione puramente noob, una tale distribuzione significa: ci sò parechji utilizatori nantu à u situ chì apposta vedenu l'ultime publicazioni publicate è disprezzanu alcuni di i posti - basatu annantu à una necessità cunnisciuta solu da elli. Scrivu "alcuni di i posti" perchè aghju nutatu questu effettu micca solu in i mo publicazioni. In tutti i casi, l'effettu hè pronunzianu, altrimente ùn aghju micca solu ùn avè micca attentatu.

Aghju quattru versioni di perchè questu succede.

Versione 1. Perversione mentale. I malati vigilanu deliberatamente l'autori chì trovanu sgradevoli è li sprezzanu, cù u scopu di dannu.

Ùn credu micca in questa versione.

Versione 2. Effettu psicologicu. Qualessu - ùn sò micca. Ebbè, perchè i lettori prima unanimu minus u post, dopu micca menu unanimità upvote? Sò minus cum'è non-temàticu, ma più dopu à i cunnisciuti di bellezza si trovanu in a maiuranza? Ùn a sò micca.

Se ci sò psiculoghi trà i lettori, ch'elli dicianu a so voce.

Versione 3. I servitori agiscenu. Perchè i so patroni duveranu sparghje a putrefazione nantu à i posti di Khabrov? Diu sà. Tuttavia, ci sò militari micca solu in u nostru paese. Quale li capirà, russofobi ?!

Versione 4. Effetti cumminati di i fatturi prima citati.

Abbastanza imaginable.

Sia com'è, i minusers riescenu à riduce u numeru di vista. Ùn sò micca familiarizatu cù e regule per portà i posti di Khabrov à a cima, ùn sò mancu sapè se questi algoritmi sò stati fatti publichi o micca, ma hè ovvi per mè: u primu minus ùn permette micca i posti ostracizzati per ghjunghje in cima - più precisamente, ritarda l'arrivu, chì à u turnu significativu, in i tempi, reduce u nùmeru di vista.

Quantu aghju capitu, ùn ci sò modi efficaci per cumbatte stu male. L'unicu modu hè u votu persunale. Solu in questu casu pudete stabilisce quale profili sò tracciati periodicamente è minus l'ultimi posti. Tuttavia, ùn ci hè votu persunale nant'à Habré (o piuttostu, ùn hè micca fattu publicu).

Ma tuttu ùn hè cusì simplice.

Comu dissi, u materiale dissecatu hè statu publicatu in parte. Dopu a publicazione di a seconda parte, aghju aspittatu una stampa simili: cù a pruduzzione iniziale in u minus è u sussegwente in u plus. In ogni casu, l'effettu hè diventatu assai più lisciatu: u postu ùn hè micca diventatu un minus.

Quandu a seconda parte hè stata publicata, u bug hè statu riparatu, cusì i dati sò datu per ghjornu:

Circa e stranezze di abrostatistica

Ùn sò micca da induve vene u lisciamentu. Forse perchè hè statu publicatu u sabbatu (i downvotes ùn funzionanu micca u sabbatu?) O perchè questu hè a fine di u materiale publicatu prima.

In ogni casu, a distribuzione di minus hè sempre irregulare: tutti i minus si trovanu in a prima mità di u periodu di registrazione, è minus finisci assai prima di più. À u listessu tempu, i punti di vista sò distribuiti in u periodu esattamente cum'è l'ultima volta - in modu uniforme:

Circa e stranezze di abrostatistica

U spike chì hè accadutu versu trè dopu meziornu ùn hè micca materiale classificatu. U mo Internet hè solu per una ora. L'utilità ùn pudia micca cunnette à u situ.

Circa e stranezze di abrostatistica

Tuttu u restu hè cumplettamente standard.

Segnalibri:

Circa e stranezze di abrostatistica

Cumenti : cum'è l'ultima volta, i periodi di attività si alternanu cù i periodi di silenziu.

Circa e stranezze di abrostatistica

Karma. Un aumentu di un paru di unità hè statu registratu - sicuru, micca simultaneamente:

Circa e stranezze di abrostatistica

E abbonati. U numeru tutale ùn hè micca cambiatu (apparentemente, quelli chì sò interessati anu firmatu quandu a prima parte hè stata publicata). Versu una ora dopu meziornu ci hè stata una sola fluttuazione : qualcunu s'hè annullatu - forse per sbagliu - ma subitu s'hè firmatu di novu. S'ellu era una persona diversa, a compensazione hè accaduta: u numeru tutale di abbonati ùn hà micca cambiatu.

Circa e stranezze di abrostatistica

Dunque, e metriche post si cumportanu in modu chjaru è prevedibile. Tutti l'indicatori, fora di i minus. Siccomu ùn vecu micca una ragione ovvia per questu, mi pare chì u minus piccu hè almenu stranu.

Stranezza 2.
Calchì volta u numeru di vista diminuite (chì, sicuru, hè impussibile), ma prestu torna à a normale.

L'aghju seguitu per accidenti, mentre debugging u prugramma, quandu a funzione d'esportazione-importazione ùn era ancu stata attaccata, cusì u zigzag currispundente manca in u graficu. Pudete piglià a mo parolla per questu - questu effettu hè statu osservatu duie volte. Parechje milla di vista, di colpu u numeru di veduti diminuite da un paru di centu, dopu à 10-20 minuti hè restituitu à u so livellu previ (senza piglià in contu l'aumentu naturali).

Questu hè abbastanza simplice: un bug in u situ. È ùn ci hè nunda à pensà.

Stranezza 3.
Questu hè ciò chì mi pareva assai più stranu di l'effetti voluntaristici di u primu è di a seconda tecnica. Pluses ùn succede micca solu, cù una distribuzione uniforme nantu à u periodu, ma in blocchi. Ma l'aghjunghje ùn hè micca un cummentariu, quandu una quistione hè naturalmente seguita da una risposta, sò un attu individuale!

Fighjate più attente à i grafici di risultati publicati sopra: i blocchi sò notevuli.

E persone cunnisciute mi annunziu nantu à a distribuzione di Poisson, ma ùn sò micca capaci di calculà a probabilità per mè stessu. Sè vo site capaci, fate a matematica. Hè digià ovviamente per mè chì u nùmeru di doppiu pluses supera assai a norma.

Eccu i dati digitale nantu à i vantaghji di a prima parte di u postu. U graficu mostra u numeru di pluses per pusizioni singuli, doppie è triple in u numeru tutale di qualificazioni datu. Comu diciatu prima, l'intervallu di misurazione hè di 10 minuti.

Circa e stranezze di abrostatistica

Di i 30 pokes in 84 cells, dui celluli sò stati picchi trè volte. Ebbè, ùn sò micca quantu questu currisponde à a teoria di probabilità ...

Dati per a seconda parte di u post (siccomu u periodu di misurazione hè più longu, l'aghju accurtatu secondu a durata di a prima parte, per a comparabilità):

Circa e stranezze di abrostatistica

In modu, quì unu di i più unichi hè adiacente in u tempu à u triplicatu, vale à dì, in qualchi minuti 20 ci hè statu un surge in pluses (29% di u so numeru tutale eranu pluses). È questu ùn hè micca successu in i primi minuti di publicazione.

A relazione trà e pusizioni singuli, doppie è triple hè apprussimatamente uguale à a prima parte. È a diminuzione di a parte di e valutazioni in e misurazioni hè spiegata da u fattu chì e valutazioni sò datu menu freti. E misurazioni sò state pigliate, ma ùn sò micca stati registrati vantaghji.

Ùn possu micca spiegà stu bloccu plus effettu in ogni modu, vale à dì micca in tuttu. Per cons, tali cumpurtamentu "bloccu" ùn pare micca esse tipicu.

Emettitori di bontà mandanu suggerimenti in batch, accendendu è spegnendu? Hehehe...

PS
Se qualchissia vulete analizà e statistiche di post utilizendu metudi più avanzati o cuntrollà l'aritmetica, i schedari cù i dati fonte sò quì:
yadi.sk/d/iN4SL6tzsGEQxw

Ùn insistiu micca nantu à i mo dubbii - forsi sò sbagliatu, soprattuttu chì e statistiche sò sbulicate. Spergu chì i cumenti da i statistici prufessiunali, i psicologi è altri utilizatori interessate clarificà a cunfusione chì hè stata.

ti ringraziu per u vostru attinzioni.

Source: www.habr.com

Add a comment