Вы ведь знаете, что Хабр — это вам не одна популярная социальная площадка с ограничением на длину публикации в 280 символов? И хотя периодически появляются посты длиной в один абзац, они достаточно редко встречают одобрение от вас, Хабра-жители.
Сегодня мы узнаем, правда ли, что длинные публикации более популярны, а короткие — наоборот. Или снова наоборот? В общем, есть ли на Хабре дискриминация по длине статьи.
Итак, 5 самых популярных хабов из раздела "Разработка". Все профильные, у всех по более чем 100 000 подписчиков. Что же они могут нам рассказать? Приступим!
Этот вопрос поднимается достаточно регулярно и недавно снова был задан здесь amartology.
Методы
Для нашего расследования возьмём хабы Программирование (266 000 подписчиков), Информационная безопасность (518 000), Open source (108 000), Разработка веб-сайтов (529 000) и Java (124 000). Эти 5 имеют наивысший рейтинг в разделе.
Рассмотрение затронет весь 2019 год. Для каждого хаба выбираются все публикации в этих временных рамках. Анализируется весь текст, содержащийся внутри тега < div id="post-content-body" >, а также такие показатели публикации, как голоса (общее число, плюсы, минусы, окончательный рейтинг), просмотры, добавление в закладки и количество комментариев. Очевидно, что дата и время публикации, её ID, автор и заголовок тоже учитываются.
Длина текста считается в байтах (strlen), символах (iconv_strlen) и графемах (grapheme_strlen).
Общие сведения
Всего найдено 4 805 публикаций от 1 845 авторов. Они написали 114 014 297 байт (108.73 МБ) текста, собрав 58 129 730 просмотров, 351 582 добавлений в закладки и 145 194 комментариев. Вот так (Рис. 1) все эти публикации выглядят на временной шкале.

Рис. 1. Все посты, опубликованные в пяти хабах в 2019 году
Программирование
Данный хаб в 2019 собрал 1 908 постов и 826 авторов. Общий рейтинг публикаций достиг +49 975 (↑57 588, ↓7 613 и 65 201 голосов), а количество просмотров достигло 21 934 576. Кроме того, статьи добавили в избранное 161 535 раз, а также прокомментировали 59 561 раз.
Общий размер публикаций составляет 49 222 543 байта (~46.94 МБ), 33 514 654 символов или 33 282 885 графем.
На публикацию приходится +26.2 рейтинга (↑30.2, ↓4 и 34.2 голоса), 11 496.1 просмотров, 84.7 закладок, 31.2 комментария. Размер текста 25 798 байт, 17 565 символов или 17 444 графемы.
Информационная безопасность
Этот хаб в 2019 набрал 1 430 постов от 534 авторов. Общий рейтинг публикаций достиг +39 381 (↑43 874, ↓4 493 и 48 367 голосов), а количество просмотров достигло 19 673 862. Кроме того, статьи добавили в избранное 80 893 раза, а также оставили 48 859 комментариев.
Общий размер публикаций составляет 31 025 982 байта (~29.59 МБ), 19 944 451 символов или 19 781 203 графем.
На публикацию приходится +27.5 рейтинга (↑30.7, ↓3.1 и 33.8 голоса), 13 757.9 просмотров, 56.6 закладок, 34.2 комментария. Размер текста 21 697 байт, 13 947 символов или 13 833 графемы.
Open source
Данный хаб в 2019 насчитывает 576 публикаций и 305 авторов, а также общий рейтинг +17 735 (↑19 699, ↓1 964 и 21 663 голосов), 6 750 210 просмотров, 35 980 добавлений в закладки и 20 116 комментариев.
Общий размер публикаций составляет 14 142 730 байт (~13.49 МБ), 9 598 387 символов или 9 529 648 графем.
На публикацию приходится +30.8 рейтинга (↑34.2, ↓3.4 и 37.6 голоса), 11 719.1 просмотров, 62.5 закладок, 34.9 комментария. Размер текста 24 553 байта, 16 664 символа или 16 545 графем.
Разработка веб-сайтов
Этот хаб в 2019 набрал 1 007 постов от 415 авторов. Общий рейтинг публикаций достиг +28 300 (↑31 594, ↓3 294 и 34 888 голосов), а количество просмотров достигло 12 567 099. Кроме того, статьи добавили в избранное 92 440 раза, а также оставили 26 625 комментариев.
Общий размер публикаций составляет 23 370 415 байта (~22.29 МБ), 15 698 405 символов или 15 578 144 графем.
На публикацию приходится +28.1 рейтинга (↑31.4, ↓3.3 и 34.6 голоса), 12 479.1 просмотра, 91.8 закладок, 26.4 комментария. Размер текста 23 208 байт, 15 589 символов или 15 470 графем.
Java
Данный хаб в 2019 собрал 530 постов и 279 авторов. Общий рейтинг публикаций достиг +9 820 (↑11 391, ↓1 571 и 12 962 голосов), а количество просмотров достигло 43 677 863. Кроме того, статьи добавили в избранное 31 943 раз, а также прокомментировали 8 990 раз.
Общий размер публикаций составляет 13 574 788 байта (~12.95 МБ), 9 617 462 символов или 9 554 683 графем.
На публикацию приходится +18.5 рейтинга (↑21.5, ↓3 и 24.5 голоса), 82 411.1 просмотров, 60.3 закладок, 17 комментариев. Размер текста 25 613 байт, 18 146 символов или 18 028 графем.
Есть ли зависимость от длины?
Короткий ответ на этот вопрос — нет. Зависимости общего рейтинга (Рис. 2), количества плюсов (Рис. 3) и минусов (Рис. 4) от размера публикации нет. Напишете вы 1 000 или 100 000 байт текста, шанс получить +10 примерно одинаков, точно так же, как и для +50 или +100.

Рис. 2. Зависимость рейтинга публикации от длины текста

Рис. 3. Зависимость количества плюсов публикации от длины текста

Рис. 4. Зависимость количества минусов от длины текста
Как видно, из статистики выбиваются несколько точек очень коротких публикаций. К ним относятся публикации о событиях вокруг Nginx и другие важные в какой-то определённый момент заметки. В таком случае оценивается совсем не текст поста.
Примерно также выглядит и зависимость количества просмотров от длины текста (Рис. 05).

Рис. 5. Зависимость количества просмотров от длины текста
Может это идея? Проверим, как же зависит рейтинг от количества просмотров.
Зависимость от количества просмотров
Разве это не очевидно? Больше просмотров — больше оценок (Рис. 6). При этом, рейтинг не обязательно будет выше, поскольку можно получить и больше минусов (Рис. 7) Кроме того, больше просмотров — больше добавлений в закладки (Рис. 8) и комментариев (Рис. 9).

Рис. 6. Зависимость количества оценок от количества просмотров

Рис. 7. Зависимость рейтинга публикации от количества просмотров

Рис. 8. Зависимость количества добавлений в закладки от количества просмотров

Рис. 9. Зависимость количества комментариев от количества просмотров
Самые популярные в 2019
В топ-5 публикаций входят:
- Как Мегафон спалился на мобильных подписках от LMonoceros (+622, 17 324 байта);
- Самый беззащитный — это Сапсан от keklick1337 (+481, 8 959 байтов);
- «Мобильный контент» бесплатно, без смс и регистраций. Подробности мошенничества от Мегафона от LMonoceros (+480, 43 077 байтов);
- Как я нашел способ отследить всех водителей «Ситимобил» от Krupnikas (+465, 13 647 байтов);
- Open source – наше всё от bobuk (+453, 5 212 байтов).
Вместо заключения
Что же делать? Писать длинные публикации или короткие заметки? О популярном или об интересном?
Очевидного ответа на этот вопрос нет. Конечно, если вы гонитесь исключительно за одобрением (количеством плюсов), то больший шанс преуспеть — собрать побольше просмотров, а для этого нужен исключительно громкий заголовок или популярная тема.
Но давайте не забывать, что Хабр существует не ради заголовков, а ради качественных публикаций.
На сегодня всё. Спасибо за внимание!
P.S. Если вы нашли опечатки или ошибки в тексте, пожалуйста, сообщите мне. Это можно сделать выделив часть текста и нажав "Ctrl / ⌘ + Enter", если у вас есть Ctrl / ⌘, либо через личные сообщения. Если же оба варианта недоступны, напишите об ошибках в комментариях. Спасибо!
P.P.S. Возможно, вам будут интересны также другие мои исследования Хабра или вы хотите предложить свою тему для следующей публикации, а может даже новый цикл публикаций.
Всю информацию можно найти в специальном репозитории Хабра-детектива. Там же можно узнать, какие предложения уже были озвучены, а что уже находится в работе.
Кроме того, вы можете упомянуть меня (написав VaskivskyiYe) в комментариях к публикации, которая кажется вам интересной для исследования или анализа. Спасибо Lolohaev за эту идею.
Автор: Yevhenii Vaskivskyi