Горад засынае, прачынаюцца хабраўчане

Калі колькасць каментароў пад артыкулам імклівым дамкратам набліжаецца да 1000, будзьце ўпэўненыя - незалежна ад заяўленай аўтарам тэмы ўнутры бушуе срач: агмені ўзгарання палітоты, акружаныя канапавымі экспертамі па ўсіх пытаннях, псіхіятрычныя дыягназы на адлегласці па аватарцы і нікнейму, пераходы на асобы з'едлівасць якіх перавышае такую ​​ў крыві ксенаморфаў, і, вядома ж, абавязковая ў такіх выпадках страва - узаемныя абвінавачванні ў тым, што ваш візаві з вамі дыскутуе выключна за ўзнагароджанне або па абавязку службы. Якая, відаць, і небяспечная і цяжкая, і на першы погляд як быццам не бачная, а трыццаць срэбранікаў на дарозе не валяюцца.

Самае пацешнае ў такой сітуацыі гэта тое,што людзі, глыбока здзіўленыя сіндромам у-інтэрнэце-нехта-няправільны, часцяком марнуюць чортавую прорву часу і нерваў каб цалкам бясплатна даказаць іншаму такому ж здзіўленаму, што ўжо ён-то роўна гэта ж самае робіць за грошы ці па загадзе. Вы шукайце тут логіку? Яе няма. Гэта інтэрнэт, дзетка.

Возьмем адзін з адносна свежых срачей аб меркаванай тэрытарыяльнай дыскрымінацыі на Гітлабе. З моманту публікацыі артыкула прайшло 4 дні і, зразумела, абмеркаванне даўным даўно з'ехала ад першапачаткова заяўленай тэмы за трыдзевяць земляў. Гучаць такія фразы:

Рэальны чалавек не зможа нічога супрацьпаставіць прафесійнаму каментатару на падпісцы…

Карыстальнік (такі вось) марнуе проста нерэальную колькасць часу на каментары…
Пры гэтым яго актыўнасць не мае патэрнаў якія звычайна ўласцівыя звычайнаму карыстачу....

ps але гэта навяло мяне на думку напісаць парсер-аналізатар такіх каментатараў ) З паказаннем актыўнасці па гадзінах, колькасцю часу ў дзень, у тыдзень і да т.п… Добрая тэма для артыкула)

Так, стоп. А якія такія патэрны "звычайна ўласцівыя звычайнаму карыстачу"? Аўтара гэтай фразы ў той тэме, на жаль, ужо транклюкавалі, так што давядзецца ісці наўздагад.

Пытанне, якое я жадаю паставіць перад вашыя ясныя вочы, наступнае — ці магчыма наогул метадамі статыстыкі хоць колькі-небудзь надзейна вылучыць гэтыя самыя патэрны так, каб стварыць фармальны класіфікатар, які адрознівае каментатараў казуальных ад прафесійных? Уявіце сабе – «па дадзеных хабра-батометра вы з верагоднасцю 76% з'яўляецеся крамлеботам». Гэта будзе нашмат страмчэй кармічных рэйдаў сябар на сябра.
Нажаль, маіх кампетэнцый не хопіць на тое, каб нават выказаць здагадку, у які бок капаць для рашэння такой задачы. Тым не менш, за ўчорашні вечар я скалгасіў «на каленцы» невялікі прымітыўны парсер, які (балазе старонкі з каментарамі адкрыты нават для неаўтарызаваных наведвальнікаў) пакуль што робіць дзве рэчы — а) збірае ў зададзенага юзернейма статыстыку ўсіх яго каментароў (пакуль што проста time -stamp) і складае ў базу MySQL; б) малюе часовую дыяграму, адзначаючы на ​​ёй узятыя з гэтай базы падзеі адпраўкі каментара. Нават без нейкага мудрагелістага аналізу атрымалася даволі забаўна. Вось так выглядае дыяграма маіх каментароў. Тлумачэнні - пад ёй. Лепш за ўсё яе разглядаць у асобным акне на маштабе 100% і больш.

Горад засынае, прачынаюцца хабраўчане

Па гарызантальнай восі - час, кожны піксель роўны адной хвіліне, кошт шэрых дзяленняў роўная адной гадзіне, уся гарызантальная лінія роўная адным суткам. Суткі ідуць знізу ўверх уздоўж вертыкальнай восі, кошт дзялення на ёй - 365 сутак.

Нічога асабліва цікавага ў маёй дыяграме няма. Відаць, што я кахаю паспаць па 7-8 гадзін, часта кладуся за поўнач, і часам уладкоўваю шматгадзінныя марафоны каментавання, і што актыўнасць за апошні год перавышае або прыкладна роўная такой за папярэднія пяць гадоў.
Або вось таварыш gecube тры з паловай гады захоўваў абяцанне маўчання, а потым як прарвала…

Горад засынае, прачынаюцца хабраўчане

Дыяграма актыўнасці тыповага хабракаментатара выглядае прыблізна такім чынам (гэта QtRoS)

Горад засынае, прачынаюцца хабраўчане

Выразная «сонная лагчына» злева дзесьці ў еўрапейскай ночы і павольнае каментаванне падчас светлавога дня, магчыма з перапынкамі на паўгода.

Але не ўсе дыяграмы такія сумныя! Як вам, напрыклад, такое:

Горад засынае, прачынаюцца хабраўчане

За два з невялікім гады наш калега, відаць, перавучыў свае біярытмы спаць з еўрапейскай ночы кудысьці пад Сярэдзінна-Атлантычны хрыбет, прычым раўнамерна і паступова, а потым яшчэ два гады патраціў, каб вярнуцца да берагоў Партугаліі. Пешшу ішоў? Уплаў? Я не магу прыдумаць праўдападобных тлумачэнняў… Першыя тры гадзіны няспання каменты ляцяць як з кулямёта, а пад канец дня ўжо так, раз на гадзінку зазірнуў, што там робіцца ды і ўсё.

Гэта быў, дарэчы, 0xd34df00d.

А вось яшчэ загадка:

Горад засынае, прачынаюцца хабраўчане

Чатыры з паловай гады калега пратрымаўся без адзінага каментара - відаць трэніраваўся дзесьці ў таемных манастырах, як не спаць потым суткамі, мяркуючы па тым, колькі каментаў адпраўлена ў «соннай лагчыне».

Але вось самае тут цікавае — гэта анамалія а 16-й гадзіне, якая доўжыцца больш за тры гады і ў апошні год паступова згасае. Перакур? Выгульванне сабакі? Прабежка? Што яшчэ можа адарваць хабраўчаніна ад стужкі каментароў у разгар працоўнага дня з такой штодзённай перадвызначанасцю? Я раздзяўбай і гультай, не магу сабе ўявіць падобнай самадысцыпліны, якую можа сабе дазволіць паважаны khim.

Нарэшце, апошняя дыяграма для падумаць:

Горад засынае, прачынаюцца хабраўчане

На ёй наогул няма выразна выяўленай "соннай лагчыны". Толькі ледзь-ледзь адгадваецца бачнае перавышэнне колькасці каментаў, адпраўленых пасля поўдня над адпраўленымі да.

З усёй камсамольскай строгасцю заклікаю паважанага MTyrz раззброіцца перад партыяй і сапраўды прызнацца, колькі бабуль, дзядуляў, унучак, жучак і пах руляюць вашым акаўнтам і пішуць каментары.

І пад заслону падступнае пытанне - ці можа камусьці гэта ўсё быць цікава настолькі, што захочацца развіць код парсера ці атрымаць дамп базы або доступ ёй і гэтак далей? Мае ўласныя веды ў дата-майнінгу і ў метадах візуалізацыі дадзеных наўрад ці перавышаюць агульную эрудыцыю. Нешта разумнейшае і цікавейшае, чым гэтыя прасценькія дыяграмкі я ці наўрад прыдумаю. Калі нехта зацікавіўся, пішыце мне ў тэлеграм (нік у профілі).

Дзякуй за ўвагу!

UPD. Выклаў зыходнікі на GitHub.

Крыніца: habr.com

Дадаць каментар