Detektiv Habra: prijatelji so z NLP-ji

Detektiv Habra: prijatelji so z NLP-ji
Вы ведь знаете, что НЛО заботится о вас? Ну, во всяком случае, об этом регулярно напоминают в публикациях редакторского отдела Хабра — новостях на околополитические, околоскандальные и другие околотемы.

Давайте выясним, как часто редакторы используют эту стандартную «заглушку» и для каких именно публикаций? А также выполним и другие пожелания из комментариев к предыдущему Хабра-детективу о редакторах.

Итак, когда же у вас, Хабра-пользователи, возникают «противоречивые чувства», которые вы не можете сдержать и высказываете в комментариях? А самое главное — что их вызывает? Начнём наше новое расследование!

Motivacija

Когда вышла публикация Detektiv Habra: Skrivnost urednikov novic, она собрала разные предложения в комментариях. В том числе, и от одного из редакторов — denis-19. Пара цитат приведена ниже.

И еще — интересно узнать, сколько раз в публикациях редакторы поставили в конце

Минутка заботы от НЛО…

denis-19 od 15.12.2019.

Как же вы забыли вот про этот анализ:
https://habr.com/ru/post/475058/

Обязательно выложить графики выявленных редакторов в этом виде 🙂

alan008 od 16.12.2019.

И поскольку тема «заботы НЛО» достаточно интересна, я решил не откладывать её в долгий ящик, а сразу и использовать.

Любимая всеми заглушка

Если так случилось, что вы никогда не замечали эту магическую цитату, привлекающую к комментированию ещё большее количество людей, то выглядит она так:

Detektiv Habra: prijatelji so z NLP-jiTrenutek skrbi NLP-ja

To gradivo je lahko sporno, zato preden komentirate, si osvežite spomin na nekaj pomembnega:

Kako napisati komentar in preživeti — Не пишите оскорбительных комментариев, не переходите на личности.
— Воздержитесь от нецензурной лексики и токсичного поведения (даже в завуалированной форме).
— Для сообщения о комментариях, нарушающих правила сайта, используйте кнопку «Пожаловаться» (если доступна) или obrazec za povratne informacije.

Kaj storiti, če: minus karma | račun blokiran

Koda avtorjev Habr и habraetiquette
Polna različica pravil spletnega mesta

Обычно она встречается в публикациях о политике, законодательстве и всём том, что вызывает бурные и не всегда корректные обсуждения и последующее карма-нытьё.

Временные рамки и жертвы исследования

В статье опубликованы данные за 2019 год с 1 января по 28 декабря (совсем немного не дотянул до конца года, но в пред- и праздничное время обычно мало важных новостей).

Среди авторов публикаций такие городские легенды, как alizar и oznak, а также другие редакторы, их начальники и просто писатели новостей: denis-19, morda_elf, AnnieBronson, baragol, Leonid_R, k_karina и Travis_Macrif.

Статистика НЛО

За этот год перечисленные авторы вызывали НЛО 197 раз (Sl. 1). Это по 1 публикации каждые 1.85 дня. Достаточно высокая частота, чтобы их все пропустить.

Detektiv Habra: prijatelji so z NLP-ji

Рис. 1. Все публикации с НЛО. UTC

Подробности визуализации

Идея визуализации взята из публикации Mesto zaspi, prebivalci Habrovska se prebudijo DreamingKitten и слегка модифицирована для удобства.

Ось абсцисс показывает время суток от 00:00 до 23:59 с точностью до минуты. Ось ординат — день года от 1 января до 31 декабря с точностью до дня.

Каждая вертикальная черта определяет начало часа (01:00, 02:00 и т.д.), каждая горизонтальная черта определяет начало месяца (1 февраля, 1 марта и т.д.). Для удобства, каждая 3 черта по обеим осям выделена.

Цвет точки определяется рейтингом публикации, однако расширена относительно стандартных GWR для положительно, нейтрально и негативно оцененных.

Вначале я хотел использовать градацию рейтингов Хабра. Ту, которую можно увидеть исключительно для своих публикаций (>30, >10, >-1 и <-1), но и это счёл недостаточным. Подробности цветовой палитры под спойлером. Очевидно, она избыточна, но вносит некоторое разнообразие в изображение-результат не уменьшая информативность.

Barvna paleta

Ocena Цвет RGB
[151; +∞) 0, 255, 255
[101; 150] 0, 255, 191
[51; 100] 0, 255, 127
[31; 50] 0, 255, 0
[11; 30] 0, 191, 0
[1; 10] 0, 127, 0
[0] 127, 127, 0
[-10; -1] 127, 0, 0
[-30; -11] 191, 0, 0
(-∞; -30] 255, 0, 0

Поскольку абсолютные числа слишком неопределённы с точки зрения НЛО, давайте введём «коэффициент заботы», который определим как соотношение публикаций с плашкой о НЛО к общему количеству публикаций.

Для всех 9 авторов количество публикаций за год составило 2 615. Вот так (Sl. 2) их можно визуализировать во времени и в соответствии с рейтингом. Соответственно, коэффициент заботы равен 8.16%.

Detektiv Habra: prijatelji so z NLP-ji

Рис. 2. Все публикации. UTC

Кстати, если вас интересует, действительно ли так мало редакторских публикаций набирает отрицательный рейтинг, напоминаю. В отличии от комментариев, публикации можно скрывать в черновики. Потому статистика учитывает лишь то, что доступно на Хабре на данный момент.

Кто чаще всех вызывает НЛО?

Вы не поверите. Хотя нет, лично я в таком результате был уверен.

Не буду тянуть кота за то, за что не следует, и скажу сразу — это alizar. За этот год он воспользовался помощью НЛО 87 раз (Sl. 3). То есть в среднем — каждые 4.2 дня. При этом, всего он опубликовал 546 постов (Sl. 4), что даёт показатель заботы в 15.93%.

Detektiv Habra: prijatelji so z NLP-ji

Рис. 3. Публикации alizar с НЛО. UTC

Detektiv Habra: prijatelji so z NLP-ji

Рис. 4. Публикации alizar. UTC

Заметили, да? alizar обязательно отдыхает не меньше 6 часов в сутки (исключения достаточно редки).

Srebrna

Ожидаемо второе место достаётся oznak. И хотя он не сильно отстаёт с результатом в 80 НЛО-заглушек (в среднем каждые 4.56 дня, Sl. 5), общее количество публикаций за год у него достигает 757 (Sl. 6). В результате, показатель заботы о читателе всего 10.57%.

Detektiv Habra: prijatelji so z NLP-ji

Рис. 5. Публикации oznak с НЛО. UTC

Detektiv Habra: prijatelji so z NLP-ji

Рис. 6. Публикации oznak. UTC

Август явно был месяцем отпуска. Ну что ж, отдыхать всем нужно. О чём свидетельствует и ежедневные 6-7 часов отдыха от публикаций.

bron

На 3 месте в сегодняшнем забеге оказался один из инициаторов этой публикации — denis-19. Вызвав НЛО 25 раз (Sl. 7), он обеспечивает нас регулярной встречей с высшей Хабра-силой примерно раз в 2 недели (14.6 дней).

Detektiv Habra: prijatelji so z NLP-ji

Рис. 7. Публикации denis-19 с НЛО. UTC

Показатель заботы, учитывая 351 публикацию за год, составляет 7.21%. Тут стоит отметить, что писать новости он начал не вначале года. Потому, это значение — нижняя граница.

Detektiv Habra: prijatelji so z NLP-ji

Рис. 8. Публикации denis-19. UTC

Другие друзья НЛО

Если вы считали, то могли заметить, что на всех остальных авторов приходится всего 5 НЛО-сообщений за год. Из них 2 o morda_elf in 1 o Leonid_R, baragol и AnnieBronson. Поскольку показывать 5 точек на рисунке 1440 x 365 пикселей — слегка нерационально, этот рисунок я упущу.

А вот все публикации каждого автора приведены под спойлерами. Кстати, всего они опубликовали 761 пост за этот год.

@Leonid_R

Le 37 публикаций.

Detektiv Habra: prijatelji so z NLP-ji

Рис. 9. Публикации Leonid_R. UTC

@baragol

Le 46 публикаций.

Detektiv Habra: prijatelji so z NLP-ji

Рис. 10. Публикации baragol. UTC

@maybe_elf

Le 297 публикаций.

Detektiv Habra: prijatelji so z NLP-ji

Рис. 11. Публикации morda_elf. UTC

@AnnieBronson

Le 270 публикаций.

Detektiv Habra: prijatelji so z NLP-ji

Рис. 12. Публикации AnnieBronson. UTC

@k_karina

Le 56 публикаций.

Detektiv Habra: prijatelji so z NLP-ji

Рис. 13. Публикации k_karina. UTC

@Travis_Macrif

Le 55 публикаций.

Detektiv Habra: prijatelji so z NLP-ji

Рис. 14. Публикации Travis_Macrif. UTC

О чём конкретно заботится НЛО?

Естественно, интересно узнать, от чего же пользователей Хабра пытается защитить НЛО. Составим «word cloud» для заголовков постов. Сначала я хотел отсортировать список и не включать незначимые слова, а также исправить количество вхождений одного слова в разных формах.

Однако, потом я решил, что так будет не интересно, поскольку качество отрисовки облака напрямую зависит от количества уникальных слов. Кстати, шаблон был взят специально близкий к тематике публикации, а потому нужно нарисовать НЛО как можно качественнее.

Для отрисовки использовался первый попавшийся в Google-выдаче сайт по запросу «word cloud from text».

Torej, alizar больше всего вызывал НЛО для защиты от (Sl. 15):

Detektiv Habra: prijatelji so z NLP-ji

Рис. 15. Облако слов для публикаций alizar

Toda za oznak облако… Да практически такое же (Sl. 16):

Detektiv Habra: prijatelji so z NLP-ji

Рис. 16. Облако слов для публикаций oznak

Od denis-19 публикаций с вызовом НЛО существенно меньше, детализация НЛО слегка подвела (Sl. 17):

Detektiv Habra: prijatelji so z NLP-ji

Рис. 17. Облако слов для публикаций denis-19

Ну и напоследок, общее облако. Оно получилось практически идеальным (Sl. 18):

Detektiv Habra: prijatelji so z NLP-ji

Рис. 18. Облако слов для всех публикаций с участием НЛО

Namesto zaključka

Обычно в конце публикации я пишу какой-нибудь риторический вопрос и пару вариантов ответа на него. Но сегодня мне в голову приходит лишь одно:

Заботьтесь об НЛО и НЛО будет заботиться о вас.

Спасибо за внимание!

Кстати, КДПВ — это облако слов для данной статьи (финальной версии текста и markdown, перед вёрсткой непосредственно на Хабре), за исключением ссылок на hsto.org.

PS Če v besedilu najdete kakršne koli tipkarske ali napake, me prosim obvestite. To lahko storite tako, da izberete del besedila in kliknete »Ctrl / ⌘ + Enter"če imate Ctrl / ⌘, prek zasebna sporočila. Če obe možnosti nista na voljo, pišite o napakah v komentarjih. Hvala vam!

PPS Morda vas bodo zanimale tudi druge moje Habrove raziskave ali pa bi želeli predlagati svojo temo za naslednjo objavo ali morda celo novo serijo objav.

Kje najti seznam in kako pripraviti predlog

Vse informacije najdete v posebnem repozitoriju Detektiv Habra. Tam lahko tudi izveste, kateri predlogi so že objavljeni in kaj je že v delu.

Prav tako me lahko omeniš (s pisanjem VaskivskyiYe) v komentarjih k publikaciji, ki se vam zdi zanimiva za raziskovanje ali analizo. Hvala vam Lolohajev za to idejo.

Vir: www.habr.com

Dodaj komentar