Я люблю писать тексты по мотивам проектов, которыми занимаюсь. За последний год я разместил на Хабре больше 20 постов. Меня постоянно удивляло, как мало толковых комментариев удаётся здесь получить. Просмотров много, а комментариев мало и большинство не по делу. Недавно я начал замечать, натыкаясь на старинные посты за 2012, 2013 годы, что в них обсуждение, как будто, более содержательное. Решил проверить это количественно. Скачал инфу по всем постам за все годы и построил несколько простых графиков. То что я увидел меня удивило и даже немного испугало. Решил разместить наблюдения здесь, чтобы проверить правильные ли я делаю выводы и всё ли учёл.
Для всех опубликованных на Хабре постов я собрал даты публикаций, число просмотров, число лайков и дислайков, число звёздочек и комментариев, список хабов и названия блогов компаний. В ходе прокачки узнал, что число плюсиков и минусиков может быть дробным и даже отрицательным, пост может быть опубликовал в блоги нескольких компаний и может не иметь автора. Если что, таблицу можно скачать из репозитория github.com/alexanderkuk/analyze-habr/blob/master/data/posts.csv
Первым делом я посмотрел как менялось общее число постов со временем. Оно перестало расти в 2013 и немного падает с 2014, что уже немного тревожно:
Потом я построил такой же график для суммарного числа просмотров и испугался. С 2014 оно упало в 3.5 раза:
Это серьёзное утверждение, поэтому я решил свериться с Similarweb.
Они дают только оценки, но в 2014, 2015 тренд тоже явно отрицательный:
Отношение комментариев к числу просмотров во времени выглядит интересно. С 2008 оно падает, а в середине 2012 ступенькой практически исчезает.
Доля лайков ведёт себя также:
Кстати отношение лайков и дислайков почти не меняется. Минусов всегда примерно 25% от плюсов:
Доля звёздочек ведёт себя интересно. Почему-то в последнее время плавно растёт. Почему так?
Короче говоря, в середине 2012 что-то случилось. Может быть, кто-то знает ответ из истории? Я тогда Хабром не пользовался и поэтому попробовать найти разгадку в данных.
Во-первых, заметил, что ступенькой поменялось среднее число хабов, в которые одновременно размещались посты. Видимо, подняли лимиты?
Во-вторых, что важнее, появились блоги компаний:
Неужели это они оказали такое влияние?
Кстати, число просмотров у постов компаний, которое всё время потихоньку росло, последнее время тоже падает. Это самое пугающее:
Доли лайков, звёздочек и комментариев у обычных постов и у постов компаний почти не отличаются. Это тоже неожиданно, я думал коммерческие посты хуже принимают:
Ещё я думал, что, может быть, ситуация хуже в хабах, в которые пишу, а в других нормально комментируют. Да, действительно в big data и data mining комментов поменьше, но незначительно.
Короче, действительно, всё так плохо?
Если что, все выкладки в репозитории github.com/alexanderkuk/analyze-habr/blob/master/notes.ipynb
Автор: alexkuku