Хабра-анализ: важна ли длина публикации?

в 8:11, , рубрики: DIY, diy или сделай сам, habrbusters, визуализация данных, никто не читает теги, Социальные сети и сообщества, Статистика в IT, хабра-анализ, хабра-детектив

Хабра-анализ: важна ли длина публикации? - 1
Вы ведь знаете, что Хабр — это вам не одна популярная социальная площадка с ограничением на длину публикации в 280 символов? И хотя периодически появляются посты длиной в один абзац, они достаточно редко встречают одобрение от вас, Хабра-жители.

Сегодня мы узнаем, правда ли, что длинные публикации более популярны, а короткие — наоборот. Или снова наоборот? В общем, есть ли на Хабре дискриминация по длине статьи.

Итак, 5 самых популярных хабов из раздела "Разработка". Все профильные, у всех по более чем 100 000 подписчиков. Что же они могут нам рассказать? Приступим!

Этот вопрос поднимается достаточно регулярно и недавно снова был задан здесь amartology.

Методы

Для нашего расследования возьмём хабы Программирование (266 000 подписчиков), Информационная безопасность (518 000), Open source (108 000), Разработка веб-сайтов (529 000) и Java (124 000). Эти 5 имеют наивысший рейтинг в разделе.

Рассмотрение затронет весь 2019 год. Для каждого хаба выбираются все публикации в этих временных рамках. Анализируется весь текст, содержащийся внутри тега < div id="post-content-body" >, а также такие показатели публикации, как голоса (общее число, плюсы, минусы, окончательный рейтинг), просмотры, добавление в закладки и количество комментариев. Очевидно, что дата и время публикации, её ID, автор и заголовок тоже учитываются.

Длина текста считается в байтах (strlen), символах (iconv_strlen) и графемах (grapheme_strlen).

Общие сведения

Всего найдено 4 805 публикаций от 1 845 авторов. Они написали 114 014 297 байт (108.73 МБ) текста, собрав 58 129 730 просмотров, 351 582 добавлений в закладки и 145 194 комментариев. Вот так (Рис. 1) все эти публикации выглядят на временной шкале.

Хабра-анализ: важна ли длина публикации? - 2

Рис. 1. Все посты, опубликованные в пяти хабах в 2019 году

Программирование

Данный хаб в 2019 собрал 1 908 постов и 826 авторов. Общий рейтинг публикаций достиг +49 975 (↑57 588, ↓7 613 и 65 201 голосов), а количество просмотров достигло 21 934 576. Кроме того, статьи добавили в избранное 161 535 раз, а также прокомментировали 59 561 раз.

Общий размер публикаций составляет 49 222 543 байта (~46.94 МБ), 33 514 654 символов или 33 282 885 графем.

Если просто посчитать среднее

На публикацию приходится +26.2 рейтинга (↑30.2, ↓4 и 34.2 голоса), 11 496.1 просмотров, 84.7 закладок, 31.2 комментария. Размер текста 25 798 байт, 17 565 символов или 17 444 графемы.

Информационная безопасность

Этот хаб в 2019 набрал 1 430 постов от 534 авторов. Общий рейтинг публикаций достиг +39 381 (↑43 874, ↓4 493 и 48 367 голосов), а количество просмотров достигло 19 673 862. Кроме того, статьи добавили в избранное 80 893 раза, а также оставили 48 859 комментариев.

Общий размер публикаций составляет 31 025 982 байта (~29.59 МБ), 19 944 451 символов или 19 781 203 графем.

Если просто посчитать среднее

На публикацию приходится +27.5 рейтинга (↑30.7, ↓3.1 и 33.8 голоса), 13 757.9 просмотров, 56.6 закладок, 34.2 комментария. Размер текста 21 697 байт, 13 947 символов или 13 833 графемы.

Open source

Данный хаб в 2019 насчитывает 576 публикаций и 305 авторов, а также общий рейтинг +17 735 (↑19 699, ↓1 964 и 21 663 голосов), 6 750 210 просмотров, 35 980 добавлений в закладки и 20 116 комментариев.

Общий размер публикаций составляет 14 142 730 байт (~13.49 МБ), 9 598 387 символов или 9 529 648 графем.

Если просто посчитать среднее

На публикацию приходится +30.8 рейтинга (↑34.2, ↓3.4 и 37.6 голоса), 11 719.1 просмотров, 62.5 закладок, 34.9 комментария. Размер текста 24 553 байта, 16 664 символа или 16 545 графем.

Разработка веб-сайтов

Этот хаб в 2019 набрал 1 007 постов от 415 авторов. Общий рейтинг публикаций достиг +28 300 (↑31 594, ↓3 294 и 34 888 голосов), а количество просмотров достигло 12 567 099. Кроме того, статьи добавили в избранное 92 440 раза, а также оставили 26 625 комментариев.

Общий размер публикаций составляет 23 370 415 байта (~22.29 МБ), 15 698 405 символов или 15 578 144 графем.

Если просто посчитать среднее

На публикацию приходится +28.1 рейтинга (↑31.4, ↓3.3 и 34.6 голоса), 12 479.1 просмотра, 91.8 закладок, 26.4 комментария. Размер текста 23 208 байт, 15 589 символов или 15 470 графем.

Java

Данный хаб в 2019 собрал 530 постов и 279 авторов. Общий рейтинг публикаций достиг +9 820 (↑11 391, ↓1 571 и 12 962 голосов), а количество просмотров достигло 43 677 863. Кроме того, статьи добавили в избранное 31 943 раз, а также прокомментировали 8 990 раз.

Общий размер публикаций составляет 13 574 788 байта (~12.95 МБ), 9 617 462 символов или 9 554 683 графем.

Если просто посчитать среднее

На публикацию приходится +18.5 рейтинга (↑21.5, ↓3 и 24.5 голоса), 82 411.1 просмотров, 60.3 закладок, 17 комментариев. Размер текста 25 613 байт, 18 146 символов или 18 028 графем.

Есть ли зависимость от длины?

Короткий ответ на этот вопрос — нет. Зависимости общего рейтинга (Рис. 2), количества плюсов (Рис. 3) и минусов (Рис. 4) от размера публикации нет. Напишете вы 1 000 или 100 000 байт текста, шанс получить +10 примерно одинаков, точно так же, как и для +50 или +100.

Хабра-анализ: важна ли длина публикации? - 3

Рис. 2. Зависимость рейтинга публикации от длины текста

Хабра-анализ: важна ли длина публикации? - 4

Рис. 3. Зависимость количества плюсов публикации от длины текста

Хабра-анализ: важна ли длина публикации? - 5

Рис. 4. Зависимость количества минусов от длины текста

Как видно, из статистики выбиваются несколько точек очень коротких публикаций. К ним относятся публикации о событиях вокруг Nginx и другие важные в какой-то определённый момент заметки. В таком случае оценивается совсем не текст поста.

Примерно также выглядит и зависимость количества просмотров от длины текста (Рис. 05).

Хабра-анализ: важна ли длина публикации? - 6

Рис. 5. Зависимость количества просмотров от длины текста

Может это идея? Проверим, как же зависит рейтинг от количества просмотров.

Зависимость от количества просмотров

Разве это не очевидно? Больше просмотров — больше оценок (Рис. 6). При этом, рейтинг не обязательно будет выше, поскольку можно получить и больше минусов (Рис. 7) Кроме того, больше просмотров — больше добавлений в закладки (Рис. 8) и комментариев (Рис. 9).

Хабра-анализ: важна ли длина публикации? - 7

Рис. 6. Зависимость количества оценок от количества просмотров

Хабра-анализ: важна ли длина публикации? - 8

Рис. 7. Зависимость рейтинга публикации от количества просмотров

Хабра-анализ: важна ли длина публикации? - 9

Рис. 8. Зависимость количества добавлений в закладки от количества просмотров

Хабра-анализ: важна ли длина публикации? - 10

Рис. 9. Зависимость количества комментариев от количества просмотров

Самые популярные в 2019

В топ-5 публикаций входят:

Вместо заключения

Что же делать? Писать длинные публикации или короткие заметки? О популярном или об интересном?

Очевидного ответа на этот вопрос нет. Конечно, если вы гонитесь исключительно за одобрением (количеством плюсов), то больший шанс преуспеть — собрать побольше просмотров, а для этого нужен исключительно громкий заголовок или популярная тема.

Но давайте не забывать, что Хабр существует не ради заголовков, а ради качественных публикаций.

На сегодня всё. Спасибо за внимание!

P.S. Если вы нашли опечатки или ошибки в тексте, пожалуйста, сообщите мне. Это можно сделать выделив часть текста и нажав "Ctrl / ⌘ + Enter", если у вас есть Ctrl / ⌘, либо через личные сообщения. Если же оба варианта недоступны, напишите об ошибках в комментариях. Спасибо!

P.P.S. Возможно, вам будут интересны также другие мои исследования Хабра или вы хотите предложить свою тему для следующей публикации, а может даже новый цикл публикаций.

Где найти список и как внести предложение

Всю информацию можно найти в специальном репозитории Хабра-детектива. Там же можно узнать, какие предложения уже были озвучены, а что уже находится в работе.

Кроме того, вы можете упомянуть меня (написав VaskivskyiYe) в комментариях к публикации, которая кажется вам интересной для исследования или анализа. Спасибо Lolohaev за эту идею.

Автор: Yevhenii Vaskivskyi

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js