Синдром ступеньки и срез посещаемости Хабра

в 5:25, , рубрики: аналитика, Медиа, почему никто не читает теги, статистика, Статистика в IT, Хабрахабр API

Последнюю пару недель внимательно слежу за работой Хабра с помощью Хабра-аналитики и решил собрать свои наблюдения в статью. Сегодня мы обсудим: когда и в каком количестве читают Хабр; что такое «синдром ступеньки»; как получить данные о своих статьях и чем можно провести их анализ.

  1. Статистика посещаемости
  2. Просмотры статей: синдром ступеньки
  3. Публичность данных
  4. Хотлинк Хабра-графиков
  5. Весь инструментарий онлайн

Статистика посещаемости


Синдром ступеньки и срез посещаемости Хабра
(интерактивная версия доступна здесь и, если сайт упадет, то здесь)

Самые интересные факты из графика:

  • В выходные Хабр читают в среднем в два-три раза меньше человек, чем по будням
  • Ночью (по Москве) минимальная активность, примерно в 10 раз меньше чем на следующее утро
  • Пики активности подозрительно совпадают с рабочими часами по Москве
  • В будни основной всплеск активности утром до обеда, а в пятницу и к концу рабочего дня
  • Активность в понедельник сравнима с остальными рабочими днями т.е. никого супер-пика активности в понедельник утром

В один прекрасный день у нас будет свой iconosquare с интеллектуальным анализом текста и бендерами!

Просмотры статей: синдром ступеньки


За время работы сайта с 1го июля было проанализировано более сотни статей и фактически все они имеют «синдром ступеньки». Для примера рассмотрим график просмотров одной из статей:
Синдром ступеньки и срез посещаемости Хабра
(По клику открывается интерактивная версия)

Наиболее характерное поведение таково: до 24х часов просмотры растут близко к полиному 2-3ей степени от числа часов, при этом характер роста меняется во время выхода статью на главную и становится схожим с экспоненциальным. Однако, после выхода с главной, наступает момент насыщения и количество просмотров и добавлений в избранное выходит на константу. Это насыщение просмотров т.е. выход просмотров фактически на константу во времени я и окрестил синдромом ступеньки.
Синдром ступеньки и срез посещаемости Хабра
Основная гипотеза связана с тем, что после ухода статьи с главной у неё больше нет методов распространения. Это можно заметить по насыщению количества репостов во времени.
Синдром ступеньки и срез посещаемости Хабра
(интерактивные версии просмотры, избранное, репосты, там же доступны и данные)

Необходимым условием «живучести» статьи является продолжение её распространения в сети после ухода с главной. Т.е. либо статью продолжают передавать в виде сарафанного радио, например у автора подобный опыт связан со статьёй "Как правильно лгать с помощью статистики". Отследить распространение можно через яндекс-блоги, например через такой запрос [link:habrahabr.ru/post/217545] или для новых статей через Хабра-аналитику. Либо статья выходит в «Лучшее неделимесяцаза всё время» и получает просмотры за счет основной аудитории хабра.

Публичность данных


Одна из новых возможностей — это импорт данных статей и пульса:
Синдром ступеньки и срез посещаемости Хабра
Их можно скачать, кликнув по графику и затем нажав «import data», пример импортированных можно посмотреть тут pulse.csv c git репозитория HabraData (кстати говоря, это репозиторий, в котором я собираю всякие интересные данные связанные с сайтом, а здесь HabraAnalyticsTool консольные утилиты для анализа подобных данных).

Данные доступны (согласно платформе plotly) пермаментно, но в время слежения за статьёй ограничено 52 часами (к сожалению, если увеличить время до недели, то пул статей разрастается и система отрисовки начинает падать с ошибкой авторизации после большого количества запросов).

Хотлинк Хабра-графиков


Благодаря тому, что визуализация перешла на платформу plotly, теперь можно встраивать пульс и мониторы статей в html вот такой конструкцией.

<div class="container">
  <div class="jumbotron">
    <div class="row-fluid">
 <iframe class="container well span12" id="pulse_stream" src="https://plot.ly/~SergeyParamonov/1/"
       seamless="seamless"  height="600px" scrolling="no" ></iframe>
    </div>
  </div>
</div>

Если вы вдруг захотите сделать визуализацию своих статей (или пульса) в блоге достаточно просто встроить полученную ссылку (или автоматически распарсив сайт аналитики и вынув ссылку из страницы).

Весь инструментарий онлайн


Как и ранее доступен онлайн: анализ статей пользователей («история пользователя»), пересечение хабов и анализ аудитории.
image

Автор медленно, но верно допиливает предыдущие запросы и всегда рад услышать идеи (фактически через любые каналы связи, но лучше всего работают комментарии ниже и почта), что еще бы реализовать и улучшить.

Автор: varagian

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js