Последнюю пару недель внимательно слежу за работой Хабра с помощью Хабра-аналитики и решил собрать свои наблюдения в статью. Сегодня мы обсудим: когда и в каком количестве читают Хабр; что такое «синдром ступеньки»; как получить данные о своих статьях и чем можно провести их анализ.
- Статистика посещаемости
- Просмотры статей: синдром ступеньки
- Публичность данных
- Хотлинк Хабра-графиков
- Весь инструментарий онлайн
Статистика посещаемости
(интерактивная версия доступна здесь и, если сайт упадет, то здесь)
Самые интересные факты из графика:
- В выходные Хабр читают в среднем в два-три раза меньше человек, чем по будням
- Ночью (по Москве) минимальная активность, примерно в 10 раз меньше чем на следующее утро
- Пики активности подозрительно совпадают с рабочими часами по Москве
- В будни основной всплеск активности утром до обеда, а в пятницу и к концу рабочего дня
- Активность в понедельник сравнима с остальными рабочими днями т.е. никого супер-пика активности в понедельник утром
В один прекрасный день у нас будет свой iconosquare с интеллектуальным анализом текста и бендерами!
Просмотры статей: синдром ступеньки
За время работы сайта с 1го июля было проанализировано более сотни статей и фактически все они имеют «синдром ступеньки». Для примера рассмотрим график просмотров одной из статей:
(По клику открывается интерактивная версия)
Наиболее характерное поведение таково: до 24х часов просмотры растут близко к полиному 2-3ей степени от числа часов, при этом характер роста меняется во время выхода статью на главную и становится схожим с экспоненциальным. Однако, после выхода с главной, наступает момент насыщения и количество просмотров и добавлений в избранное выходит на константу. Это насыщение просмотров т.е. выход просмотров фактически на константу во времени я и окрестил синдромом ступеньки.
Основная гипотеза связана с тем, что после ухода статьи с главной у неё больше нет методов распространения. Это можно заметить по насыщению количества репостов во времени.
(интерактивные версии просмотры, избранное, репосты, там же доступны и данные)
Необходимым условием «живучести» статьи является продолжение её распространения в сети после ухода с главной. Т.е. либо статью продолжают передавать в виде сарафанного радио, например у автора подобный опыт связан со статьёй "Как правильно лгать с помощью статистики". Отследить распространение можно через яндекс-блоги, например через такой запрос [link:habrahabr.ru/post/217545] или для новых статей через Хабра-аналитику. Либо статья выходит в «Лучшее неделимесяцаза всё время» и получает просмотры за счет основной аудитории хабра.
Публичность данных
Одна из новых возможностей — это импорт данных статей и пульса:
Их можно скачать, кликнув по графику и затем нажав «import data», пример импортированных можно посмотреть тут pulse.csv c git репозитория HabraData (кстати говоря, это репозиторий, в котором я собираю всякие интересные данные связанные с сайтом, а здесь HabraAnalyticsTool консольные утилиты для анализа подобных данных).
Данные доступны (согласно платформе plotly) пермаментно, но в время слежения за статьёй ограничено 52 часами (к сожалению, если увеличить время до недели, то пул статей разрастается и система отрисовки начинает падать с ошибкой авторизации после большого количества запросов).
Хотлинк Хабра-графиков
Благодаря тому, что визуализация перешла на платформу plotly, теперь можно встраивать пульс и мониторы статей в html вот такой конструкцией.
<div class="container">
<div class="jumbotron">
<div class="row-fluid">
<iframe class="container well span12" id="pulse_stream" src="https://plot.ly/~SergeyParamonov/1/"
seamless="seamless" height="600px" scrolling="no" ></iframe>
</div>
</div>
</div>
Если вы вдруг захотите сделать визуализацию своих статей (или пульса) в блоге достаточно просто встроить полученную ссылку (или автоматически распарсив сайт аналитики и вынув ссылку из страницы).
Весь инструментарий онлайн
Как и ранее доступен онлайн: анализ статей пользователей («история пользователя»), пересечение хабов и анализ аудитории.
Автор медленно, но верно допиливает предыдущие запросы и всегда рад услышать идеи (фактически через любые каналы связи, но лучше всего работают комментарии ниже и почта), что еще бы реализовать и улучшить.
Автор: varagian