Kutha dadi turu, warga Khabrovsk tangi

Yen jumlah komentar ing artikel kanthi cepet nyedhak 1000, yakin manawa preduli saka topik sing dicritakake dening penulis, ana squabble ing njero: titik nyala politik, diubengi dening pakar kursi ing kabeh masalah, diagnosa psikiatri ing kadohan dening avatar lan celukan, njupuk pribadi, serangan sarcastic, causticity kang ngluwihi getih xenomorphs, lan, mesthi, sajian wajib ing kasus kaya mengkono iku bebarengan accusations sing mitra rembugan karo sampeyan mung kanggo remunerasi utawa metu saka tugas. Kang, ketoke, mbebayani lan angel, lan ing kawitan marketing misale jek ora katon, lan telung puluh lembar perak ora lying ing dalan.

Sing lucu babagan kahanan iki yaikuwong sing kena pengaruh banget saka sindrom kasebut ing-internet-wong-salah, asring nglampahi kathah wektu lan syaraf kanggo pancen gratis mbuktekake marang wong liya sing padha gumun yen dheweke nindakake perkara sing padha kanggo dhuwit utawa supaya. Apa sampeyan nggoleki logika ing kene? Dheweke wis ora ana. Iku internet, bayi.

Ayo njupuk siji saka telek relatif seger babagan tuduhan diskriminasi wilayah ing Gitlab. 4 dina wis liwati wiwit publikasi artikel lan, mesthi, diskusi wis dawa wis pindhah adoh saka topik asli. Ukara ing ngisor iki muni:

Wong sing sejatine ora bakal bisa nentang apa-apa karo komentator profesional babagan langganan ...

Pangguna (dadi-dadi) mbuwang wektu sing ora nyata kanggo komentar...
Kajaba iku, aktivitase ora duwe pola sing biasane dadi karakteristik pangguna biasa....

ps nanging iki menehi kula idea kanggo nulis parser-analyzer kanggo komentator kuwi) Kanthi indikasi kegiatan saben jam, jumlah wektu saben dina, saben minggu, etc ... Topik apik kanggo artikel)

Oke, mandeg. Apa jenis pola "biasane gawan kanggo pangguna rata-rata"? Panyerat frasa iki ing thread kasebut, sayangé, wis ditranskripsi, dadi sampeyan kudu pindhah kanthi acak.

Pitakonan sing dakkarepake ing ngarepe mripat sing cetha yaiku ing ngisor iki: apa bisa, kanthi nggunakake metode statistik, paling ora bisa dipercaya ngenali pola sing padha supaya bisa nggawe klasifikasi resmi sing mbedakake kasual saka komentator profesional? Bayangake - "miturut Habra-botometer, sampeyan 76% kemungkinan dadi Kremlinbot." Iki bakal luwih adhem tinimbang serangan karma ing saben liyane.
Sayange, kompetensi saya ora cukup kanggo menehi saran arah sing kudu digali kanggo ngrampungake masalah kasebut. Nanging, wingi bengi aku disusupi bebarengan parser primitif cilik, kang (untung kaca karo komentar mbukak malah kanggo pengunjung ora sah) supaya adoh nindakake loro iku - a) ngumpulake statistik saka jeneng panganggo diwenehi kabeh komentar kang (saiki mung wektu -cap ) lan ditambahake menyang database MySQL; b) nggambar diagram wektu, menehi tandha ing acara kiriman komentar sing dijupuk saka database iki. Malah tanpa analisa sing canggih ternyata cukup lucu. Iki minangka grafik komentarku. Katrangan ing ngisor iki. Paling apik kanggo ndeleng ing jendhela sing kapisah kanthi skala 100% utawa luwih.

Kutha dadi turu, warga Khabrovsk tangi

Sumbu horisontal yaiku wektu, saben piksel padha karo siji menit, nilai divisi abu-abu padha karo siji jam, kabeh garis horisontal padha karo sedina. Dina pindhah saka ngisor menyang ndhuwur ing sadawane sumbu vertikal, nilai divisi ing iku 365 dina.

Ora ana sing menarik banget ing diagramku. Bisa dideleng yen aku seneng turu 7-8 jam, asring turu sawise tengah wengi, lan kadhangkala duwe maraton ngomentari pirang-pirang jam, lan kegiatan ing taun kepungkur luwih gedhe tinimbang utawa kira-kira padha karo limang taun kepungkur. .
Utawa kene kanca gecube Aku netepi sumpah bisu suwene telung setengah taun, banjur dadi ...

Kutha dadi turu, warga Khabrovsk tangi

Diagram aktivitas saka habracommentator khas katon kaya iki (iki QtRoS)

Kutha dadi turu, warga Khabrovsk tangi

"Kothong ngantuk" ing sisih kiwa ing endi wae ing wayah wengi Eropa lan komentar santai ing wayah awan, bisa uga istirahat setengah taun.

Nanging ora kabeh diagram dadi mboseni! Kepiye babagan iki, contone:

Kutha dadi turu, warga Khabrovsk tangi

Mung luwih saka rong taun, kolega kita ketoke retrained biorhythms kanggo turu saka wengi Eropah nang endi wae ing Mid-Atlantic Ridge, roto-roto lan mboko sithik, lan banjur nglampahi rong taun maneh kanggo bali menyang gisik Portugal. Apa sampeyan mlaku? nglangi? Aku ora bisa menehi katrangan sing masuk akal ... Kanggo telung jam pisanan tangi, komentar mabur kaya bedhil mesin, nanging pungkasane kaya ngono, saben jam sepisan aku ndeleng apa sing kedadeyan. ana lan iku.

Miturut cara, iku 0xd34df00d.

Lan iki teka-teki liyane:

Kutha dadi turu, warga Khabrovsk tangi

Kolega kasebut suwene patang taun setengah tanpa komentar siji - ketoke dheweke lagi latihan ing endi wae ing biara rahasia babagan carane tetep siyaga nganti pirang-pirang dina, miturut jumlah komentar sing dikirim ing "kothong ngantuk."

Nanging sing paling menarik ing kene yaiku anomali ing jam 16, sing luwih saka telung taun lan mboko sithik ilang ing taun kepungkur. Smoke break? Mlaku-mlaku asu? Jogging? Apa maneh bisa nyuwek warga Khabrov adoh saka feed komentar ing tengah dina apa karo predetermination saben dina? Aku iki wong slob lan kesed, aku ora bisa mbayangno disiplin diri sing dihormati. khim.

Pungkasan, siji diagram pungkasan sing kudu dipikirake:

Kutha dadi turu, warga Khabrovsk tangi

Ora ana sing jelas "kothong ngantuk" ing kabeh. Mung siji sing meh ora bisa ngerteni keluwihan sing katon ing jumlah komentar sing dikirim sawise awan tinimbang sing dikirim sadurunge.

Kanthi kabeh kaku Komsomol, aku njaluk sing dihormati MTyrz disarm dhewe ing ngarepe partai lan sajujure ngakoni carane akeh mbah, putu, kewan omo lan clurut aturan akun lan nulis komentar.

Lan pungkasanipun, pitakonan insidious - bisa wong dadi kasengsem ing kabeh iki sing padha arep kanggo berkembang kode parser utawa njaluk mbucal database utawa akses menyang, lan ing? Kawruhku dhewe babagan data mining lan metode visualisasi data meh ora ngluwihi erudition umum. Aku meh ora bisa mikir apa-apa sing luwih pinter lan luwih menarik tinimbang diagram prasaja iki. Yen ana sing kasengsem, nulis menyang telegram (julukan ing profil).

Matur suwun!

UPD. Dikirim iku sumber ing GitHub.

Source: www.habr.com

Add a comment