Oer de eigenaardichheden fan habrostatistyk

Ik haw frjemd gedrach yn wurdearrings earder opmurken, mar koartlyn is de frjemdens te dúdlik wurden. En ik besleat it probleem te ûndersykjen mei de wittenskiplike metoaden dy't my beskikber binne, nammentlik: de dynamyk fan plus-minus analysearje. Hawwe jo jo ynienen foarsteld?

Ik bin noch in programmeur, mar ik kin dwaan hiel basis dingen. Dat ik kodearre in ienfâldich hulpprogramma dat statistiken sammelt fan 'e panielen fan' e Khabrov-post: foar-, neidielen, werjeften, blêdwizers, ensfh.

Oer de eigenaardichheden fan habrostatistyk

De statistiken wurde werjûn yn grafiken, nei it bestudearjen wêrfan wy in pear mear ferrassingen koene ûntdekke, lytsere. Mar earst dingen earst.

Nuverheid 1.
Dit is wêr't myn statistyske ûndersyk eins begon.

It like my frjemd dat se yn 'e earste oeren nei de publikaasje fan guon fan myn berjochten skerp negatyf giene, doe nei nul gongen en úteinlik it ferwachte plus fertsjinne. Wêrom is it bard?

Ik wie krekt op it punt om in oare post te publisearjen - yn twa dielen. Ik besleat him te ûnderwurpen oan statistyske analyze.

Publisearre it earste diel. Tagelyk lansearre ik it hulpprogramma en begon te wachtsjen op it resultaat. Spitigernôch stoppe it programma nachts - wylst ik sliepte - it sammeljen fan ynformaasje fanwegen in brek. De oare moarns haw ik de flater korrizjearre, mar de statistiken die bliken foar minder dan in dei te wêzen. De trends binne lykwols ek dúdlik foar de wurktiid.

De gegevens wurde levere foar de earste 14 oeren fan it momint fan publikaasje, it ynterval tusken mjittingen is 10 minuten.

Oer de eigenaardichheden fan habrostatistyk

De eagen ferrifelen ús net: de measte minussen komme yn it earste oere fan it bestean fan de post. Earst gie de post yn negatyf grûngebiet, doe herstelde it. Hjir binne de nûmers dy't brûkt wurde om de grafyk te plotten:

Oer de eigenaardichheden fan habrostatistyk

En dit nettsjinsteande it feit dat de werjeften soepel tanimme!

Oer de eigenaardichheden fan habrostatistyk

De stappen begjinnend fan tûzenste wearden wurde ferklearre troch it feit dat ôfkoartings begjinne yn it Khabrov-paniel: d'r is nearne om it krekte oantal werjeften te krijen (wierskynlik koe it wurde nommen fan tsjinsten fan tredden, mar ik haw se net brûkt ).

Ik bin gjin ekspert yn statistiken, mar sa'n ferdieling fan minussen is abnormaal, sa fier as ik begryp?!

Sjoch, de blêdwizers binne min of mear gelyk ferdield oer de registraasjeperioade:

Oer de eigenaardichheden fan habrostatistyk

Opmerkings wurde ek lykwichtich ferdield:

Oer de eigenaardichheden fan habrostatistyk

Der binne barsten fan aktiviteit en passiviteit, mar se wurde ek ferdield oer de perioade: kommentaar of ferdwynt of ferfetsje.

Itselde mei abonnees - d'r is in unifoarme lichte ferheging:

Oer de eigenaardichheden fan habrostatistyk

Karma is net feroare yn 'e rapportaazjeperioade - ik sit it net oan. En de wurdearring wurdt berekkene troch Habr, it hat gjin punt om it op te listjen.

Alle yndikatoaren feroarje yn ferhâlding mei it oantal werjeften, en allinich mei de minussen is wat mis: de útbarsting fan lilkens komt yn 'e earste oere fan it begjin fan' e publikaasje. Itselde barde mei myn eardere berjochten. Mar as dat earder, om sa te sizzen, persoanlike yndrukken wiene, no wurde se befêstige troch registraasje.

Yn myn suver noob miening betsjut sa'n ferdieling: d'r binne ferskate brûkers op 'e side dy't doelbewust de lêste publisearre berjochten besjen en guon fan 'e berjochten downvote - op basis fan in need dy't allinich bekend is. Ik skriuw "guon fan 'e berjochten" om't ik dit effekt net allinich yn myn publikaasjes opmurken. Yn alle gefallen wurdt it effekt útsprutsen, oars hie ik der gewoan gjin omtinken oan jûn.

Ik haw fjouwer ferzjes fan wêrom dit bart.

Ferzje 1. Mentale perverzje. Sike minsken sjogge bewust oer auteurs dy't se onaangenaam fine en stimme har ôf, mei it doel harren skea te dwaan.

Ik leau net yn dizze ferzje.

Ferzje 2. Psychologysk effekt. Hokker - ik wit it net. No, wêrom litte lêzers de post earst unanym minusje, en dan net minder unanym stimme? Binne se min as net-tematyske, mar plus nei kenners fan skientme fine harsels yn de mearderheid? Ik wit net.

As der psychologen ûnder de lêzers binne, lit se har sizze.

Ferzje 3. De feinten dogge hannelje. Wêrom soene har bazen rot ferspriede op Khabrov's berjochten? God wit. Lykwols, der binne soldaten net allinnich yn ús lân. Wa sil har begripe, Russophobes?!

Ferzje 4. Kombinearre effekten fan de earder neamde faktoaren.

Hiel foarstelber.

Hoe dan ek, minusers slagje it oantal werjeften te ferminderjen. Ik bin net bekend mei de regels om de berjochten fan Khabrov nei de top te bringen, ik wit net iens oft dizze algoritmen iepenbier makke binne of net, mar it is foar my fanselssprekkend: betiid minus lit net útstoarne berjochten de top berikke - krekter, it fertraget krije dêr, dy't op syn beurt gâns, yn tiden, ferleget it oantal views.

Sa fier as ik begryp, d'r binne gjin effektive manieren om dit kwea te bestriden. De ienige manier is persoanlik stimmen. Allinich yn dit gefal kinne jo fêststelle hokker profilen periodyk folgje en minus lêste berjochten. Der is lykwols gjin persoanlik stimmen oer Habré (of leaver, it wurdt net iepenbier makke).

Mar net alles is sa ienfâldich.

Lykas ik sei, it dissektearre materiaal waard yn dielen publisearre. Nei de publikaasje fan it twadde diel ferwachte ik in ferlykber byld: mei de earste útfier yn 'e minus en de folgjende yn' e plus. It effekt blykte lykwols folle glêdder te wêzen: de post feroare net yn in minus.

Tsjin de tiid dat it twadde diel publisearre waard, wie de brek reparearre, sadat de gegevens per dei wurde jûn:

Oer de eigenaardichheden fan habrostatistyk

Ik wit net wêr't de glêdens wei kaam. Miskien om't it op sneon publisearre is (downvotes wurkje sneon net?) of om't dit it ein is fan earder publisearre materiaal.

De ferdieling fan minussen is lykwols noch ûngelyk: alle minussen komme yn 'e earste helte fan' e registraasjeperioade, en minus einiget folle earder as plus. Tagelyk wurde werjeften ferdield oer de perioade krekt as de lêste kear - lykwichtich:

Oer de eigenaardichheden fan habrostatistyk

De pyk dy't om trije oere middeis barde is gjin klassifisearre materiaal. Myn ynternet gie krekt in oere út. It hulpprogramma koe gjin ferbining meitsje mei de side.

Oer de eigenaardichheden fan habrostatistyk

Al it oare is folslein standert.

Blêdwizers:

Oer de eigenaardichheden fan habrostatistyk

Opmerkings: lykas de lêste kear wikselje perioaden fan aktiviteit ôf mei perioaden fan stilte.

Oer de eigenaardichheden fan habrostatistyk

Karma. In ferheging fan in pear ienheden waard opnommen - fansels, net tagelyk:

Oer de eigenaardichheden fan habrostatistyk

En abonnees. It totale oantal bleau ûnferoare (blykber hawwe belangstellenden har oanmeld doe't it earste diel publisearre waard). Krekt om ien oere middeis wie der in inkelde fluktuaasje: ien hat him - miskien by fersin - útskreaun, mar hat him daliks wer oanmeld. As it in oare persoan wie, barde kompensaasje: it totale oantal abonnees feroare net.

Oer de eigenaardichheden fan habrostatistyk

Dat, post-metriken gedrage har op in dúdlike en foarsisbere manier. Alle yndikatoaren, útsein de minussen. Om't ik hjir gjin dúdlike reden foar sjoch, fyn ik de minuspeak op syn minst nuver.

Nuverheid 2.
Soms nimt it oantal werjeften ôf (wat fansels ûnmooglik is), mar komt gau werom nei normaal.

Ik haw it by ûngelok folge, wylst it programma debuggen, doe't de eksport-ymportfunksje noch net taheakke wie, sadat de oerienkommende zigzag op 'e grafyk ûntbrekt. Jo kinne myn wurd foar it nimme - dit effekt waard twa kear waarnommen. Ferskate tûzen werjeften, ynienen nimt it oantal werjeften mei in pear hûndert ôf, nei 10-20 minuten wurdt it werombrocht nei it foarige nivo (sûnder rekken te hâlden mei de natuerlike ferheging).

Dit is frij simpel: in brek op 'e side. En der is neat te tinken oer.

Nuverheid 3.
Dit is wat my folle frjemder like as de frijwillige earste en technyske twadde effekten. Plussen bart net allinnich, mei in unifoarme ferdieling oer de perioade, mar yn blokken. Mar tafoegjen is gjin opmerking, as in fraach natuerlik folge wurdt troch in antwurd, binne se in yndividuele hanneling!

Besjoch de hjirboppe publisearre resultaatgrafiken fan tichterby: de blokken binne merkber.

Kennisfolle minsken knikten my oer de Poisson-ferdieling, mar ik kin de kâns net sels berekkenje. As jo ​​​​kinne, doch de wiskunde. It is my al dúdlik dat it oantal dûbele plussen fier boppe de noarm komt.

Hjir binne de digitale gegevens oer de foardielen fan it earste diel fan 'e post. De grafyk toant it oantal plussen foar inkele, dûbele en triple posysjes yn it totale oantal jûn wurdearrings. Lykas earder neamd, is de mjitting ynterval 10 minuten.

Oer de eigenaardichheden fan habrostatistyk

Fan 'e 30 pokes yn 84 sellen waarden twa sellen trije kear pokt. No, ik wit net hoefolle dit oerienkomt mei kânsteory ...

Gegevens foar it twadde diel fan 'e post (om't de mjittingsperioade langer is, ferkoartje ik it neffens de doer fan it earste diel, foar fergelykberens):

Oer de eigenaardichheden fan habrostatistyk

Trouwens, hjir is ien fan 'e inkele plussen yn' e tiid neist de trijefâldige, dat is, yn guon 20 minuten wie d'r in tanimming fan plussen (29% fan har totale oantal wiene plussen). En dit barde net yn 'e earste minuten fan publikaasje.

De relaasje tusken inkele, dûbele en trije posysjes is likernôch itselde as foar it earste diel. En de ôfname fan it oanpart fan wurdearrings yn mjittingen wurdt ferklearre troch it feit dat wurdearrings minder faak jûn waarden. Mjittingen waarden nommen, mar gjin foardielen waarden opnommen.

Ik kin dit blok plus effekt op ien of oare manier net ferklearje, dat is hielendal net. Foar neidielen liket sa'n "blokich" gedrach net typysk te wêzen.

Stjoer útstjoerders fan goedens suggestjes yn batches, yn- en útskeakelje? Hehehehe...

PS
As immen poststatistiken analysearje wol mei mear avansearre metoaden of de arithmetyk kontrolearje, dan binne de bestannen mei de boarnegegevens hjir:
yadi.sk/d/iN4SL6tzsGEQxw

Ik stean net op myn twifels - miskien bin ik ferkeard, foaral om't de statistiken somber binne. Ik hoopje dat opmerkings fan profesjonele statistiken, psychologen en oare ynteressearre brûkers de betizing dy't ûntstien is, sille ferdúdlikje.

Tige tank foar jo oandacht.

Boarne: www.habr.com

Add a comment