Tungkol sa mga kakaiba ng habrostatistics

Napansin ko ang kakaibang pag-uugali sa mga rating noon, ngunit kamakailan lamang ay naging masyadong halata ang pagiging kakaiba. At napagpasyahan kong siyasatin ang problema gamit ang mga pang-agham na pamamaraan na magagamit ko, katulad: upang pag-aralan ang dinamika ng plus-minus. Naisip mo ba bigla?

Programmer pa rin ako, ngunit nakakagawa ako ng mga pangunahing bagay. Kaya nag-code ako ng isang simpleng utility na nangongolekta ng mga istatistika mula sa mga panel ng Khabrov post: mga kalamangan, kahinaan, view, bookmark, atbp.

Tungkol sa mga kakaiba ng habrostatistics

Ang mga istatistika ay ipinapakita sa mga graph, pagkatapos pag-aralan kung saan kami ay nakadiskubre ng ilang higit pang mga sorpresa, mas maliit. Ngunit una sa lahat.

Kakaiba 1.
Dito talaga nagsimula ang aking statistical research.

Tila kakaiba sa akin na sa mga unang oras pagkatapos ng paglalathala ng ilan sa aking mga post ay bigla silang naging negatibo, pagkatapos ay naging zero at kalaunan ay nakakuha ng inaasahang plus. Bakit nangyari?

Mag-publish pa lang ako ng isa pang post - sa dalawang bahagi. Nagpasya akong isailalim siya sa pagsusuri sa istatistika.

Nai-publish ang unang bahagi. Kasabay nito, inilunsad ko ang utility at nagsimulang maghintay para sa resulta. Sa kasamaang palad, sa gabi - habang natutulog ako - tumigil ang programa sa pagkolekta ng impormasyon dahil sa isang bug. Kinaumagahan ay itinama ko ang error, ngunit ang mga istatistika ay naging wala pang isang araw. Gayunpaman, ang mga uso ay halata din para sa oras na nagtrabaho.

Ang data ay ibinigay para sa unang 14 na oras mula sa sandali ng paglalathala, ang pagitan sa pagitan ng mga sukat ay 10 minuto.

Tungkol sa mga kakaiba ng habrostatistics

Hindi kami dinaya ng mga mata: karamihan sa mga minus ay nangyayari sa unang oras ng pagkakaroon ng post. Sa una ang post ay napunta sa negatibong teritoryo, pagkatapos ay nakabawi ito. Narito ang mga numerong ginamit upang i-plot ang graph:

Tungkol sa mga kakaiba ng habrostatistics

At ito sa kabila ng katotohanan na ang mga view ay dumarami nang maayos!

Tungkol sa mga kakaiba ng habrostatistics

Ang mga hakbang na nagsisimula sa ika-libong halaga ay ipinaliwanag sa pamamagitan ng katotohanan na ang mga pagdadaglat ay nagsisimula sa panel ng Khabrov: wala kahit saan upang makuha ang eksaktong bilang ng mga view (marahil ito ay maaaring kinuha mula sa mga serbisyo ng third-party, ngunit hindi ko ginamit ang mga ito ).

Hindi ako eksperto sa mga istatistika, ngunit ang gayong pamamahagi ng mga minus ay abnormal, sa pagkakaintindi ko?!

Tingnan, ang mga bookmark ay ipinamamahagi nang higit pa o hindi gaanong pantay-pantay sa panahon ng pagpaparehistro:

Tungkol sa mga kakaiba ng habrostatistics

Ang mga komento ay pantay na ipinamahagi:

Tungkol sa mga kakaiba ng habrostatistics

May mga pagsabog ng aktibidad at pagiging walang kabuluhan, ngunit ipinamamahagi din ang mga ito sa paglipas ng panahon: ang pagkokomento ay nawawala o nagpapatuloy.

Ang parehong sa mga subscriber - mayroong isang pare-parehong bahagyang pagtaas:

Tungkol sa mga kakaiba ng habrostatistics

Hindi nagbago ang Karma sa panahon ng pag-uulat - hindi ko ito binabanggit. At ang rating ay kalkulado ng Habr, walang saysay na ilista ito.

Ang lahat ng mga tagapagpahiwatig ay nagbabago sa proporsyon sa bilang ng mga view, at tanging sa mga minus ay isang bagay na mali: ang pagsabog ng galit ay nangyayari sa unang oras mula sa simula ng publikasyon. Ganun din ang nangyari sa mga nauna kong post. Ngunit kung mas maaga ang mga ito ay, wika nga, mga personal na impression, ngayon sila ay nakumpirma sa pamamagitan ng pagpaparehistro.

Sa aking purong noob na opinyon, ang ganitong pamamahagi ay nangangahulugang: mayroong ilang mga gumagamit sa site na sinasadyang tingnan ang mga pinakabagong nai-publish na mga post at i-downvote ang ilan sa mga post - batay sa isang pangangailangan na alam lamang nila. Sumulat ako ng "ilan sa mga post" dahil napansin ko ang epektong ito hindi lamang sa aking mga publikasyon. Sa lahat ng mga kaso, ang epekto ay binibigkas, kung hindi man ay hindi ko ito binigyang pansin.

Mayroon akong apat na bersyon kung bakit ito nangyayari.

Bahagi 1. Kabuktutan ng kaisipan. Ang mga taong may sakit ay sadyang nagbabantay sa mga may-akda na nakita nilang hindi kasiya-siya at binabawasan sila ng boto, na may layuning saktan sila.

Hindi ako naniniwala sa bersyong ito.

Bahagi 2. Sikolohikal na epekto. Alin - hindi ko alam. Buweno, bakit unanimously binabawasan ng mga mambabasa ang post, pagkatapos ay hindi bababa sa nagkakaisa na i-upvote ito? Ang mga ito ba ay minus bilang non-thematic, ngunit pagkatapos ay natagpuan ng mga connoisseurs ng kagandahan ang kanilang sarili sa karamihan? Hindi ko alam.

Kung may mga psychologist sa mga mambabasa, hayaan silang magsalita.

Bahagi 3. Ang mga katulong ay kumikilos. Bakit dapat magkalat ng bulok ang kanilang mga amo sa mga post ni Khabrov? God knows. Gayunpaman, may mga servicemen hindi lamang sa ating bansa. Sino ang makakaintindi sa kanila, Russophobes?!

Bahagi 4. Pinagsamang epekto ng mga naunang nabanggit na salik.

Medyo maiisip.

Magkagayunman, pinamamahalaan ng mga minus na bawasan ang bilang ng mga view. Hindi ako pamilyar sa mga patakaran para sa pagdadala ng mga post ni Khabrov sa tuktok, hindi ko alam kung ang mga algorithm na ito ay ginawang pampubliko o hindi, ngunit ito ay malinaw sa akin: ang maagang minus ay hindi pinapayagan ang mga ostracized na mga post na maabot ang tuktok - mas tiyak, naaantala nito ang pagpunta doon, na kung minsan naman ay makabuluhang binabawasan ang bilang ng mga view.

Sa pagkakaintindi ko, walang mabisang paraan para labanan ang kasamaang ito. Ang tanging paraan ay personal na pagboto. Sa kasong ito lamang maaari mong itatag kung aling mga profile ang pana-panahong sinusubaybayan at binabawasan ang mga pinakabagong post. Gayunpaman, walang personal na pagboto sa HabrΓ© (o sa halip, hindi ito ginawang pampubliko).

Ngunit hindi ito ganoon kadali.

Tulad ng sinabi ko, ang pinaghiwa-hiwalay na materyal ay nai-publish sa mga bahagi. Matapos ang paglalathala ng ikalawang bahagi, inaasahan ko ang isang katulad na larawan: na may paunang output sa minus at ang kasunod na isa sa plus. Gayunpaman, ang epekto ay naging mas makinis: ang post ay hindi naging minus.

Sa oras na nai-publish ang ikalawang bahagi, naayos na ang bug, kaya ang data ay ibinigay bawat araw:

Tungkol sa mga kakaiba ng habrostatistics

Hindi ko alam kung saan nanggaling ang pagpapakinis. Marahil dahil na-publish ito noong Sabado (hindi gumagana ang mga downvote tuwing Sabado?) o dahil ito ang katapusan ng naunang nai-publish na materyal.

Gayunpaman, ang pamamahagi ng mga minus ay hindi pa rin pantay: lahat ng mga minus ay nangyayari sa unang kalahati ng panahon ng pagpaparehistro, at ang minus ay nagtatapos nang mas maaga kaysa sa plus. Kasabay nito, ang mga view ay ibinahagi sa buong panahon nang eksakto tulad ng huling oras - pantay-pantay:

Tungkol sa mga kakaiba ng habrostatistics

Ang spike na nangyari bandang alas-tres ng hapon ay hindi classified material. Isang oras lang nawala ang internet ko. Hindi makakonekta ang utility sa site.

Tungkol sa mga kakaiba ng habrostatistics

Ang lahat ng iba pa ay ganap na pamantayan.

Mga Bookmark:

Tungkol sa mga kakaiba ng habrostatistics

Mga komento: tulad ng huling pagkakataon, ang mga panahon ng aktibidad ay kahalili ng mga panahon ng katahimikan.

Tungkol sa mga kakaiba ng habrostatistics

Karma. Ang isang pagtaas ng isang pares ng mga yunit ay naitala - siyempre, hindi sabay-sabay:

Tungkol sa mga kakaiba ng habrostatistics

At mga subscriber. Ang kabuuang bilang ay nanatiling hindi nagbabago (malamang, nag-sign up ang mga interesado noong nai-publish ang unang bahagi). Bandang ala-una pa lang ng hapon ay may nag-iisang pagbabagu-bago: may nag-unsubscribe - marahil ay nagkamali - ngunit agad na nag-sign up muli. Kung ibang tao ito, nagkaroon ng kabayaran: hindi nagbago ang kabuuang bilang ng mga subscriber.

Tungkol sa mga kakaiba ng habrostatistics

Kaya, ang mga sukatan ng post ay kumikilos sa isang malinaw at nahuhulaang paraan. Lahat ng mga tagapagpahiwatig, maliban sa mga minus. Dahil wala akong nakikitang malinaw na dahilan para dito, nakikita kong kakaiba ang minus peak.

Kakaiba 2.
Minsan ang bilang ng mga view ay bumababa (na, siyempre, ay imposible), ngunit sa lalong madaling panahon ay bumalik sa normal.

Nasubaybayan ko ito nang hindi sinasadya, habang nagde-debug sa programa, noong hindi pa nakakabit ang export-import function, kaya nawawala ang kaukulang zigzag sa graph. Maaari mong kunin ang aking salita para dito - ang epektong ito ay naobserbahan nang dalawang beses. Ilang libong mga view, biglang bumaba ang bilang ng mga view ng ilang daan, pagkatapos ng 10-20 minuto ito ay naibalik sa dati nitong antas (nang hindi isinasaalang-alang ang natural na pagtaas).

Ito ay medyo simple: isang bug sa site. At walang dapat isipin.

Kakaiba 3.
Ito ang tila mas estranghero sa akin kaysa sa boluntaryong una at teknikal na pangalawang epekto. Ang mga plus ay hindi nangyayari nang isa-isa, na may pare-parehong pamamahagi sa panahon, ngunit sa mga bloke. Ngunit ang pagdaragdag ay hindi isang komento, kapag ang isang tanong ay natural na sinusundan ng isang sagot, sila ay isang indibidwal na pagkilos!

Tingnang mabuti ang mga graph ng resulta na inilathala sa itaas: ang mga bloke ay kapansin-pansin.

Ang mga taong may kaalaman ay tumango sa akin tungkol sa pamamahagi ng Poisson, ngunit hindi ko kayang kalkulahin ang posibilidad sa aking sarili. Kung kaya mo, gawin mo ang matematika. Malinaw na sa akin na ang bilang ng mga dobleng plus ay higit na lumampas sa pamantayan.

Narito ang mga digital na data sa mga pakinabang ng unang bahagi ng post. Ipinapakita ng graph ang bilang ng mga plus para sa single, double at triple na posisyon sa kabuuang bilang ng mga rating na ibinigay. Tulad ng nabanggit kanina, ang agwat ng pagsukat ay 10 minuto.

Tungkol sa mga kakaiba ng habrostatistics

Sa 30 pokes sa 84 na mga cell, dalawang mga cell ay poked tatlong beses. Well, hindi ko alam kung magkano ito tumutugma sa probability theory...

Data para sa ikalawang bahagi ng post (dahil mas mahaba ang panahon ng pagsukat, paikliin ko ito ayon sa tagal ng unang bahagi, para sa maihahambing):

Tungkol sa mga kakaiba ng habrostatistics

Sa pamamagitan ng paraan, narito ang isa sa mga nag-iisang plus ay katabi ng oras sa triple na isa, iyon ay, sa mga 20 minuto ay nagkaroon ng pag-akyat sa mga plus (29% ng kanilang kabuuang bilang ay mga plus). At hindi ito nangyari sa mga unang minuto ng publikasyon.

Ang ugnayan sa pagitan ng single, double at triple na posisyon ay humigit-kumulang pareho sa unang bahagi. At ang pagbaba sa bahagi ng mga rating sa mga sukat ay ipinaliwanag ng katotohanan na ang mga rating ay binibigyan ng mas madalas. Ang mga sukat ay kinuha, ngunit walang mga pakinabang na naitala.

Hindi ko maipaliwanag ang block plus effect na ito sa anumang paraan, iyon ay, hindi sa lahat. Para sa mga kahinaan, ang gayong "blocky" na pag-uugali ay tila hindi pangkaraniwan.

Ang mga nagpapalabas ba ng kabutihan ay nagpapadala ng mga mungkahi sa mga batch, pag-on at pag-off? Hehehehe...

PS
Kung sinuman ang gustong suriin ang mga istatistika ng post gamit ang mga mas advanced na pamamaraan o suriin ang arithmetic, ang mga file na may source data ay narito:
yadi.sk/d/iN4SL6tzsGEQxw

Hindi ko ipinipilit ang aking mga pagdududa - marahil ay mali ako, lalo na't ang mga istatistika ay madilim. Umaasa ako na ang mga komento mula sa mga propesyonal na istatistika, psychologist at iba pang interesadong mga gumagamit ay linawin ang pagkalito na lumitaw.

Salamat sa iyo para sa iyong pansin.

Pinagmulan: www.habr.com

Magdagdag ng komento