Şehir uykuya dalar, Khabrovitler uyanır.

Bir makalenin altındaki yorum sayısı hızla 1000'e yaklaşıyorsa, emin olun, yazarın belirttiği konu ne olursa olsun içeride bir çekişme yaşanıyor: Politikanın parlama noktaları, her konuda koltuk uzmanlarıyla çevrili, avatarlarla uzaktan psikiyatrik tanılar. ve yakıcılığı ksenomorfların kanını aşan kişisel, alaycı saldırılara maruz kalan takma ad ve elbette bu gibi durumlarda zorunlu yemek, mevkidaşınızın sizinle yalnızca ücret karşılığında veya görev dışında tartıştığı karşılıklı suçlamalardır. Görünüşe göre bu tehlikeli ve zor ve ilk bakışta görünmüyor gibi görünüyor ve yolda otuz gümüş parçası yatmıyor.

Bu durumun komik tarafı şu kiinsanların bu sendromdan derinden etkilendiğini internette-biri-yanlış, çoğu zaman çok fazla zaman ve sinir harcarlar tamamen ücretsiz Aynı derecede şaşkın bir başka kişiye tamamen aynı şeyi yaptığını kanıtlayın para karşılığında veya sipariş üzerine. Burada mantık mı arıyorsunuz? O gitti. İnternet bu bebeğim.

Hadi bir tanesini alalım nispeten taze bok Gitlab'da iddia edilen bölgesel ayrımcılık hakkında. Makalenin yayınlanmasının üzerinden 4 gün geçti ve elbette tartışma başlangıçta belirtilen konudan çok uzaklaştı. Aşağıdaki ifadeler duyulur:

Gerçek bir kişi, abonelik konusunda profesyonel yorumcuya herhangi bir itirazda bulunamayacaktır...

Kullanıcı (falan kişi) yorumlara gerçekçi olmayan miktarda zaman harcıyor...
Üstelik etkinliği, genellikle sıradan bir kullanıcının karakteristik özelliği olan kalıplara sahip değildir....

ps ama bu bana bu tür yorumcular için bir ayrıştırıcı-analizör yazma fikrini verdi) Saate göre aktivite göstergesi, günlük zaman miktarı, haftalık vb. Bir makale için iyi bir konu)

Tamam, dur. Ne tür kalıplar "genellikle ortalama kullanıcının doğasında vardır"? Bu başlıktaki bu cümlenin yazarı ne yazık ki zaten yazıya geçirilmiş, bu yüzden rastgele gitmeniz gerekecek.

Açık gözlerinizin önüne koymak istediğim soru şudur: Sıradan yorumcuları profesyonel yorumculardan ayıran resmi bir sınıflandırıcı oluşturmak için istatistiksel yöntemler kullanarak en azından aynı kalıpları güvenilir bir şekilde tanımlamak mümkün müdür? Hayal edin: "Habra-botometer'a göre, Kremlinbot olma ihtimaliniz %76." Bu birbirlerine karmik baskınlardan çok daha havalı olacak.
Ne yazık ki yeteneklerim böyle bir sorunu çözmek için hangi yöne yöneleceğimi bile önermeye yetmiyor. Bununla birlikte, dün gece küçük bir ilkel ayrıştırıcıyı bir araya getirdim ve bu (neyse ki yorum içeren sayfalar yetkisiz ziyaretçilere bile açık) şu ana kadar iki şey yapıyor - a) belirli bir kullanıcı adından tüm yorumlarının istatistiklerini topluyor (şimdilik sadece zaman damgası) ) ve onu MySQL veritabanına ekler; b) bu ​​veri tabanından alınan yorum gönderme olaylarını işaretleyerek bir zaman diyagramı çizer. Herhangi bir karmaşık analiz olmasa bile oldukça komik olduğu ortaya çıktı. Yorum çizelgem böyle görünüyor. Açıklamalar aşağıdadır. Ayrı bir pencerede %100 veya daha büyük bir ölçekte görüntülemek en iyisidir.

Şehir uykuya dalar, Khabrovitler uyanır.

Yatay eksen zamandır, her piksel bir dakikaya, gri bölümlerin değeri bir saate, yatay çizginin tamamı bir güne eşittir. Günler dikey eksende aşağıdan yukarıya doğru ilerler, üzerindeki bölme değeri 365 gündür.

Diyagramımda özellikle ilginç bir şey yok. 7-8 saat uyumayı sevdiğim, sıklıkla gece yarısından sonra yattığım ve bazen saatlerce süren yorum maratonları yaptığım, geçen yılki aktivitenin önceki beş yıla göre daha fazla veya ona eşit olduğu görülüyor. .
Ya da işte bir yoldaş kertenkele Üç buçuk yıl boyunca susma yeminimi tuttum ve sonra bozuldu...

Şehir uykuya dalar, Khabrovitler uyanır.

Tipik bir habra yorumcusunun aktivite şeması şuna benzer (bu QtRoS)

Şehir uykuya dalar, Khabrovitler uyanır.

Avrupa gecesinde sol tarafta belirgin bir "uykulu çukur" ve gündüz saatlerinde, belki altı ay arayla, rahat bir yorum.

Ancak tüm diyagramlar o kadar sıkıcı değil! Mesela şuna ne dersiniz:

Şehir uykuya dalar, Khabrovitler uyanır.

Görünüşe göre meslektaşımız iki yıldan biraz fazla bir süre içinde biyoritimlerini Orta Atlantik Sırtı'nın altında bir yerde, eşit ve kademeli olarak Avrupa gecesinden uyuyacak şekilde yeniden eğitmiş ve ardından Portekiz kıyılarına dönmek için iki yıl daha harcamış. Yürüdün mü? Yüzmek mi? Mantıklı açıklamalar getiremiyorum... Uyanık kaldığım ilk üç saat makineli tüfek gibi yorumlar havada uçuşuyor ama günün sonunda öyle, saat başı bir bakıyorum ne oluyor diye orada ve bu kadar.

Bu arada, öyleydi 0xd34df00d.

Ve işte başka bir bilmece:

Şehir uykuya dalar, Khabrovitler uyanır.

Meslektaşı tek bir yorum yapmadan dört buçuk yıl dayandı - görünüşe göre gizli manastırlarda bir yerlerde günlerce nasıl uyanık kalacağı konusunda eğitim alıyordu, "uykulu çukur" da kaç yorumun yayınlandığına bakılırsa.

Ancak burada en ilgi çekici olan 16. saatteki anomali olup, üç yıldan fazla süren ve son bir yılda yavaş yavaş kaybolan anomalidir. Sigara molası? Köpeği gezdirmek? Hafif koşu? Bir Khabrov sakinini, bir iş gününün ortasında, bu kadar günlük bir önceden belirlemeyle yorum akışından başka ne koparabilir? Ben pasaklı ve tembel bir insanım, saygı duyulanların nasıl bir öz disipline sahip olduğunu hayal edemiyorum. kim.

Son olarak üzerinde düşünülmesi gereken son bir diyagram:

Şehir uykuya dalar, Khabrovitler uyanır.

Üzerinde açıkça tanımlanmış bir "uykulu oyuk" yoktur. Öğleden sonra gönderilen yorumların sayısında, daha önce gönderilenlere kıyasla gözle görülür fazlalığı ancak bir kişi fark edebiliyor.

Tüm Komsomol titizliğimle saygıdeğer kişileri davet ediyorum. Myrz Partinin önünde kendinizi silahsızlandırın ve hesabınızı kaç büyükanne ve büyükbabanın, torunun, böceklerin ve farelerin yönettiğini dürüstçe itiraf edin ve yorum yazın.

Ve son olarak, sinsi bir soru: Birisi tüm bunlarla bu kadar ilgilenip ayrıştırıcı kodunu geliştirmek, bir veritabanı dökümü almak veya ona erişim sağlamak isteyebilir mi? Veri madenciliği ve veri görselleştirme yöntemlerine ilişkin bilgim, genel bilgi birikimini pek aşmaz. Bu basit diyagramlardan daha akıllıca ve daha ilginç bir şey düşünemiyorum. İlgilenen varsa bana telgraftan yazsın (takma ad profilde).

Teşekkürler!

GÜNCELLEME. Onu gönderdi GitHub'daki kaynaklar.

Kaynak: habr.com

Yorum ekle