Bir makalenin altındaki yorum sayısı hızla 1000'e yaklaşıyorsa, emin olun, yazarın belirttiği konu ne olursa olsun içeride bir çekişme yaşanıyor: Politikanın parlama noktaları, her konuda koltuk uzmanlarıyla çevrili, avatarlarla uzaktan psikiyatrik tanılar. ve yakıcılığı ksenomorfların kanını aşan kişisel, alaycı saldırılara maruz kalan takma ad ve elbette bu gibi durumlarda zorunlu yemek, mevkidaşınızın sizinle yalnızca ücret karşılığında veya görev dışında tartıştığı karşılıklı suçlamalardır. Görünüşe göre bu tehlikeli ve zor ve ilk bakışta görünmüyor gibi görünüyor ve yolda otuz gümüş parçası yatmıyor.
Bu durumun komik tarafı şu ki
Hadi bir tanesini alalım
Gerçek bir kişi, abonelik konusunda profesyonel yorumcuya herhangi bir itirazda bulunamayacaktır...
Kullanıcı (falan kişi) yorumlara gerçekçi olmayan miktarda zaman harcıyor...
Üstelik etkinliği, genellikle sıradan bir kullanıcının karakteristik özelliği olan kalıplara sahip değildir....ps ama bu bana bu tür yorumcular için bir ayrıştırıcı-analizör yazma fikrini verdi) Saate göre aktivite göstergesi, günlük zaman miktarı, haftalık vb. Bir makale için iyi bir konu)
Tamam, dur. Ne tür kalıplar "genellikle ortalama kullanıcının doğasında vardır"? Bu başlıktaki bu cümlenin yazarı ne yazık ki zaten yazıya geçirilmiş, bu yüzden rastgele gitmeniz gerekecek.
Açık gözlerinizin önüne koymak istediğim soru şudur: Sıradan yorumcuları profesyonel yorumculardan ayıran resmi bir sınıflandırıcı oluşturmak için istatistiksel yöntemler kullanarak en azından aynı kalıpları güvenilir bir şekilde tanımlamak mümkün müdür? Hayal edin: "Habra-botometer'a göre, Kremlinbot olma ihtimaliniz %76." Bu birbirlerine karmik baskınlardan çok daha havalı olacak.
Ne yazık ki yeteneklerim böyle bir sorunu çözmek için hangi yöne yöneleceğimi bile önermeye yetmiyor. Bununla birlikte, dün gece küçük bir ilkel ayrıştırıcıyı bir araya getirdim ve bu (neyse ki yorum içeren sayfalar yetkisiz ziyaretçilere bile açık) şu ana kadar iki şey yapıyor - a) belirli bir kullanıcı adından tüm yorumlarının istatistiklerini topluyor (şimdilik sadece zaman damgası) ) ve onu MySQL veritabanına ekler; b) bu veri tabanından alınan yorum gönderme olaylarını işaretleyerek bir zaman diyagramı çizer. Herhangi bir karmaşık analiz olmasa bile oldukça komik olduğu ortaya çıktı. Yorum çizelgem böyle görünüyor. Açıklamalar aşağıdadır. Ayrı bir pencerede %100 veya daha büyük bir ölçekte görüntülemek en iyisidir.
Yatay eksen zamandır, her piksel bir dakikaya, gri bölümlerin değeri bir saate, yatay çizginin tamamı bir güne eşittir. Günler dikey eksende aşağıdan yukarıya doğru ilerler, üzerindeki bölme değeri 365 gündür.
Diyagramımda özellikle ilginç bir şey yok. 7-8 saat uyumayı sevdiğim, sıklıkla gece yarısından sonra yattığım ve bazen saatlerce süren yorum maratonları yaptığım, geçen yılki aktivitenin önceki beş yıla göre daha fazla veya ona eşit olduğu görülüyor. .
Ya da işte bir yoldaş
Tipik bir habra yorumcusunun aktivite şeması şuna benzer (bu
Avrupa gecesinde sol tarafta belirgin bir "uykulu çukur" ve gündüz saatlerinde, belki altı ay arayla, rahat bir yorum.
Ancak tüm diyagramlar o kadar sıkıcı değil! Mesela şuna ne dersiniz:
Görünüşe göre meslektaşımız iki yıldan biraz fazla bir süre içinde biyoritimlerini Orta Atlantik Sırtı'nın altında bir yerde, eşit ve kademeli olarak Avrupa gecesinden uyuyacak şekilde yeniden eğitmiş ve ardından Portekiz kıyılarına dönmek için iki yıl daha harcamış. Yürüdün mü? Yüzmek mi? Mantıklı açıklamalar getiremiyorum... Uyanık kaldığım ilk üç saat makineli tüfek gibi yorumlar havada uçuşuyor ama günün sonunda öyle, saat başı bir bakıyorum ne oluyor diye orada ve bu kadar.
Bu arada, öyleydi
Ve işte başka bir bilmece:
Meslektaşı tek bir yorum yapmadan dört buçuk yıl dayandı - görünüşe göre gizli manastırlarda bir yerlerde günlerce nasıl uyanık kalacağı konusunda eğitim alıyordu, "uykulu çukur" da kaç yorumun yayınlandığına bakılırsa.
Ancak burada en ilgi çekici olan 16. saatteki anomali olup, üç yıldan fazla süren ve son bir yılda yavaş yavaş kaybolan anomalidir. Sigara molası? Köpeği gezdirmek? Hafif koşu? Bir Khabrov sakinini, bir iş gününün ortasında, bu kadar günlük bir önceden belirlemeyle yorum akışından başka ne koparabilir? Ben pasaklı ve tembel bir insanım, saygı duyulanların nasıl bir öz disipline sahip olduğunu hayal edemiyorum.
Son olarak üzerinde düşünülmesi gereken son bir diyagram:
Üzerinde açıkça tanımlanmış bir "uykulu oyuk" yoktur. Öğleden sonra gönderilen yorumların sayısında, daha önce gönderilenlere kıyasla gözle görülür fazlalığı ancak bir kişi fark edebiliyor.
Tüm Komsomol titizliğimle saygıdeğer kişileri davet ediyorum.
Ve son olarak, sinsi bir soru: Birisi tüm bunlarla bu kadar ilgilenip ayrıştırıcı kodunu geliştirmek, bir veritabanı dökümü almak veya ona erişim sağlamak isteyebilir mi? Veri madenciliği ve veri görselleştirme yöntemlerine ilişkin bilgim, genel bilgi birikimini pek aşmaz. Bu basit diyagramlardan daha akıllıca ve daha ilginç bir şey düşünemiyorum. İlgilenen varsa bana telgraftan yazsın (takma ad profilde).
Teşekkürler!
GÜNCELLEME. Onu gönderdi
Kaynak: habr.com