Habroistatistiğin tuhaflıkları hakkında

Daha önce reytinglerde tuhaf davranışlar fark etmiştim ama son zamanlarda bu tuhaflık çok bariz hale geldi. Ve sorunu benim için mevcut olan bilimsel yöntemleri kullanarak araştırmaya karar verdim: artı-eksi dinamiklerini analiz etmek. Aniden hayal ettin mi?

Hâlâ programcıyım ama çok temel şeyleri yapabiliyorum. Bu yüzden Khabrov gönderisinin panellerinden istatistik toplayan basit bir yardımcı program kodladım: artılar, eksiler, görüşler, yer imleri vb.

Habroistatistiğin tuhaflıkları hakkında

İstatistikler grafikler halinde gösteriliyor, inceledikten sonra daha küçük birkaç sürpriz daha keşfedebildik. Ama önce ilk şeyler.

Gariplik 1.
İstatistiksel araştırmamın başladığı yer burası.

Bazı yazılarımın yayınlanmasından sonraki ilk saatlerde keskin bir şekilde olumsuza gitmeleri, ardından sıfıra inmeleri ve sonunda beklenen artıyı kazanmaları bana tuhaf geldi. Neden oldu?

Tam da iki bölüm halinde başka bir yazı yayınlamak üzereydim. Onu istatistiksel analize tabi tutmaya karar verdim.

İlk bölümünü yayınladık. Aynı zamanda yardımcı programı başlattım ve sonucu beklemeye başladım. Ne yazık ki geceleri - ben uyurken - program bir hata nedeniyle bilgi toplamayı durdurdu. Ertesi sabah hatayı düzelttim, ancak istatistiklerin bir günden daha kısa bir süre için olduğu ortaya çıktı. Ancak çalışılan süreye ilişkin eğilimler de ortadadır.

Veriler yayınlandığı andan itibaren ilk 14 saat için sağlanır, ölçümler arasındaki aralık 10 dakikadır.

Habroistatistiğin tuhaflıkları hakkında

Gözler bizi yanıltmadı: Eksilerin çoğu, gönderinin yayınlandığı ilk saatte meydana geliyor. Gönderi ilk başta olumsuz bölgeye girdi, sonra toparlandı. Grafiği çizmek için kullanılan sayılar şunlardır:

Habroistatistiğin tuhaflıkları hakkında

Ve bu, görüşlerin sorunsuz bir şekilde artmasına rağmen!

Habroistatistiğin tuhaflıkları hakkında

Bininci değerden başlayan adımlar, kısaltmaların Khabrov panelinde başlamasıyla açıklanıyor: tam görüntüleme sayısını alabilecek hiçbir yer yok (muhtemelen üçüncü taraf hizmetlerden alınmış olabilir, ancak ben bunları kullanmadım) ).

İstatistik konusunda uzman değilim ama anladığım kadarıyla böyle bir eksi dağılımı anormal mi?

Bakın, yer imleri kayıt dönemi boyunca aşağı yukarı eşit bir şekilde dağıtılıyor:

Habroistatistiğin tuhaflıkları hakkında

Yorumlar da eşit olarak dağıtılır:

Habroistatistiğin tuhaflıkları hakkında

Faaliyet ve pasiflik patlamaları var, ancak bunlar aynı zamanda dönem boyunca da dağıtılıyor: yorum yapma ya kayboluyor ya da devam ediyor.

Aboneler için de durum aynı; tek tip hafif bir artış var:

Habroistatistiğin tuhaflıkları hakkında

Karma raporlama döneminde değişmedi - bundan alıntı yapmıyorum. Ve derecelendirme Habr tarafından hesaplanıyor, bunu listelemenin bir anlamı yok.

Tüm göstergeler izlenme sayısıyla orantılı olarak değişir ve yalnızca eksilerde bir sorun vardır: Öfke patlaması, yayının başlangıcından itibaren ilk saat içinde meydana gelir. Daha önceki yazılarımda da aynı durum yaşandı. Ancak daha önce bunlar tabiri caizse kişisel izlenimlerdi, şimdi kayıtla onaylanıyorlar.

Tamamen acemi görüşüme göre, böyle bir dağıtım şu anlama gelir: Sitede, yalnızca kendilerinin bildiği bir ihtiyaca dayanarak, en son yayınlanan gönderileri bilinçli olarak görüntüleyen ve bazı gönderilere olumsuz oy veren birkaç kullanıcı vardır. Bu etkiyi sadece yayınlarımda fark etmediğim için “bazı yazıları” yazıyorum. Her durumda, etki belirgindir, aksi takdirde buna dikkat etmezdim.

Bunun neden olduğuna dair dört versiyonum var.

Versiyon 1. Zihinsel sapkınlık. Hasta insanlar, hoş olmayan buldukları yazarları kasıtlı olarak gözetler ve onlara zarar verme amacıyla olumsuz oy verirler.

Bu versiyona inanmıyorum.

Versiyon 2. Psikolojik etki. Hangisi - bilmiyorum. Peki, neden okuyucular gönderiyi önce oybirliğiyle eksiliyor, sonra da oybirliğiyle olumlu oy veriyor? Tematik olmayanlar kadar eksi mi, ama güzellik uzmanları kendilerini çoğunlukta bulduktan sonra artı mı? Bilmiyorum.

Okuyucular arasında psikologlar varsa bırakın onlar da söz söylesin.

Versiyon 3. Hizmetçiler harekete geçiyor. Patronları neden Khabrov'un gönderilerine çürük saçsın ki? Tanrı bilir. Ancak sadece ülkemizde asker yok. Onları kim anlayacak, Rusofoblar?!

Versiyon 4. Daha önce bahsedilen faktörlerin birleşik etkileri.

Oldukça hayal edilebilir.

Öyle olsa bile, eksi kullanıcılar görüntüleme sayısını azaltmayı başarıyor. Khabrov'un gönderilerini zirveye çıkarma kurallarına aşina değilim, bu algoritmaların kamuya açıklanıp açıklanmadığını bile bilmiyorum, ancak benim için açık: Erken eksi, dışlanmış gönderilerin zirveye çıkmasına izin vermiyor - daha doğrusu, oraya ulaşmayı geciktirir ve bu da zaman zaman görüntüleme sayısını önemli ölçüde azaltır.

Anladığım kadarıyla bu kötülükle mücadele etmenin etkili bir yolu yok. Tek yol kişisel oylamadır. Ancak bu durumda hangi profillerin periyodik olarak takip edildiğini ve en son gönderilerin çıkarıldığını belirleyebilirsiniz. Ancak Habré hakkında kişisel bir oylama yapılmamaktadır (ya da daha doğrusu kamuya açıklanmamaktadır).

Ama bütün o kadar basit değil.

Söylediğim gibi, parçalara ayrılan materyal parçalar halinde yayınlandı. İkinci bölümün yayınlanmasından sonra benzer bir tablo bekliyordum: ilk çıktı eksi ve sonraki çıktı artı. Ancak etkinin çok daha düzgün olduğu ortaya çıktı: gönderi eksiye dönüşmedi.

İkinci bölüm yayınlandığında hata giderilmiş olduğundan veriler günlük olarak verilmektedir:

Habroistatistiğin tuhaflıkları hakkında

Düzleştirmenin nereden geldiğini bilmiyorum. Belki Cumartesi günü yayımlandığı için (olumsuz oylar cumartesi günleri işe yaramıyor?) ya da bunun daha önce yayınlanmış materyalin sonu olması nedeniyle.

Ancak eksilerin dağılımı hala dengesiz: tüm eksiler kayıt döneminin ilk yarısında ortaya çıkıyor ve eksi, artıdan çok daha erken bitiyor. Aynı zamanda, görüşler döneme tam olarak son seferde olduğu gibi eşit olarak dağıtılır:

Habroistatistiğin tuhaflıkları hakkında

Öğleden sonra saat üçte meydana gelen ani artış gizli materyal değil. İnternetim bir saatliğine kesildi. Yardımcı program siteye bağlanamadı.

Habroistatistiğin tuhaflıkları hakkında

Geri kalan her şey tamamen standarttır.

Yer imleri:

Habroistatistiğin tuhaflıkları hakkında

Yorumlar: Geçen seferki gibi, faaliyet dönemleri sessizlik dönemleriyle değişiyor.

Habroistatistiğin tuhaflıkları hakkında

Karma. Birkaç ünitelik bir artış kaydedildi - elbette eşzamanlı değil:

Habroistatistiğin tuhaflıkları hakkında

Ve aboneler. Toplam sayı değişmedi (görünüşe göre ilgilenenler ilk bölüm yayınlandığında kaydolmuşlardı). Öğleden sonra saat bir civarında tek bir dalgalanma oldu: Birisi -belki de yanlışlıkla- aboneliğini iptal etti ama hemen yeniden kaydoldu. Farklı bir kişi olsaydı tazminat oluştu: toplam abone sayısı değişmedi.

Habroistatistiğin tuhaflıkları hakkında

Dolayısıyla post metrikler açık ve öngörülebilir bir şekilde davranır. Eksiler hariç tüm göstergeler. Bunun için bariz bir neden göremediğim için eksi tepe noktasını en azından tuhaf buluyorum.

Gariplik 2.
Bazen izlenme sayısı azalır (ki bu elbette imkansızdır), ancak kısa süre sonra normale döner.

Programda hata ayıklarken, dışa aktarma-içe aktarma işlevi henüz eklenmediğinde tesadüfen izledim, bu nedenle grafikte karşılık gelen zikzak eksik. Sözüme güvenebilirsiniz; bu etki iki kez gözlemlendi. Birkaç bin izlenme, birdenbire izlenme sayısı birkaç yüz azalıyor, 10-20 dakika sonra eski seviyesine geri dönüyor (doğal artış hesaba katılmadan).

Bu oldukça basit: sitedeki bir hata. Ve düşünecek hiçbir şey yok.

Gariplik 3.
Bu bana iradi birinci ve teknik ikinci etkilerden çok daha tuhaf görünen şeydi. Artılar tek başına, dönem boyunca eşit bir dağılımla değil, bloklar halinde gerçekleşir. Ancak eklemek bir yorum değildir, bir sorunun ardından doğal olarak bir yanıt geldiğinde, bu bireysel bir eylemdir!

Yukarıda yayınlanan sonuç grafiklerine daha yakından bakın: bloklar dikkat çekicidir.

Bilgili insanlar Poisson dağılımı konusunda bana kafa salladılar, ancak olasılığı kendi başıma hesaplayamıyorum. Gücünüz yetiyorsa matematik yapın. Çifte artı sayısının normu çok aştığı benim için zaten açık.

İşte yazının ilk bölümünde avantajlara ilişkin dijital veriler. Grafik, verilen toplam derecelendirme sayısındaki tekli, ikili ve üçlü konumlara atfedilebilen artıların sayısını göstermektedir. Daha önce de belirtildiği gibi ölçüm aralığı 10 dakikadır.

Habroistatistiğin tuhaflıkları hakkında

30 hücredeki 84 dürtmeden iki hücre üç kez dürtüldü. Bunun olasılık teorisine ne kadar karşılık geldiğini bilmiyorum...

Yazının ikinci kısmına ait veriler (ölçüm süresi daha uzun olduğu için karşılaştırılabilirlik açısından ilk kısmın süresine göre kısaltıyorum):

Habroistatistiğin tuhaflıkları hakkında

Bu arada, burada tekli artılardan biri zaman açısından üçlü olana bitişik, yani yaklaşık 20 dakika içinde artılarda bir artış oldu (toplam sayının %29'u artılardı). Ve bu yayının ilk dakikalarında olmadı.

Tekli, ikili ve üçlü konumlar arasındaki ilişki yaklaşık olarak birinci kısımdakiyle aynıdır. Ölçümlerde derecelendirme payının azalması ise derecelendirmelerin daha az verilmesiyle açıklanıyor. Ölçümler yapıldı ancak herhangi bir avantaj kaydedilmedi.

Bu blok artı etkisini hiçbir şekilde, yani hiç açıklayamam. Eksileri açısından, bu tür "bloklu" davranışlar tipik görünmüyor.

İyilik yayanlar toplu olarak öneri gönderiyor, açılıp kapanıyor mu? Hehehehe...

PS
Gönderi istatistiklerini daha gelişmiş yöntemler kullanarak analiz etmek veya aritmetiği kontrol etmek isteyen biri varsa, kaynak verileri içeren dosyalar burada:
yadi.sk/d/iN4SL6tzsGEQxw

Şüphelerimde ısrar etmiyorum - belki de yanılıyorum, özellikle de istatistikler kasvetli olduğu için. Profesyonel istatistikçilerin, psikologların ve diğer ilgili kullanıcıların yorumlarının ortaya çıkan kafa karışıklığını açıklığa kavuşturacağını umuyorum.

İlginiz için teşekkür ederiz.

Kaynak: habr.com

Yorum ekle