7 мая с поста президента ушел Д.А. Медведев, которого все мы, возможно, запомним как первого президента России, активно использующего гаджеты, интернет и социальные сети.
Вы может быть слышали, что у Медведева есть аккаунты в Твиттере, ВКонтакте и Фейсбуке. Возможно, вы даже сами подписаны на Медведева в какой-то соц сети. Хотя не уверен.
Недавно, спрашивал у друзей, фолловят ли они Медведева в твиттере? Из 10 человек ответили положительно всего двое. По данным Яндекса в твиттере более 3 млн юзеров. Если аккаунт @medvedevrussia читают более миллиона человек, то получается, что каждый третий пользователь твиттера в России — читает Медведева.
Кто эти люди?!
На этот вопрос я постараюсь ответить ниже. Осторожно, под катом много графиков и текста.
Твиттер
23 июня 2010 Медведев завел аккаунт в твиттере. На 7 мая у него было 1 183 698 фолловера.
У @MedvedevRussia чуть больше 40 тыс. protected аккаунтов и всего 201 suspended.
У 29.6% аккаунтов по 0 фолловеров, а 1-10 фолловеров у 48% твиттерян. Получается, аккаунтов, у кого больше 10 фолловеров всего 22.4%.
Читают одного Дмитрия Анатольевича 49201 человек. Очень похожи на массфолловеров с больше 1000 друзей 14694 человека. Те, которых я очень условно бы назвал «новички» с меньше 100 друзей, составляют 91%, а обычные тви юзеры от 100 до 1000 друзей — 7.8%
Больше чем 455 тыс. не написало в твиттер ни одного твита. Лишь у примерно 45 тыс. людей есть 1000 твитов. В данной выборке не учитывались protected и suspended аккаунты.
Данные взяты у 694 735 человек, у которых больше 0 твитов и аккаунт не protected или suspended.
44% аккаунтов не писали в твиттер уже месяц, можно к ним прибавить 29.6% аккаунтов с 0 твитами, получится не маленькая цифра тех, кто не пишет в твиттер совсем.
29.6% твиттерян написали хоть 1 твит за эту неделю.
Интересный во всех отношениях сервис klout.com, говорит нам, что вся аудитория миллионного аккаунта Медведева составляет 67 000 человек.
Количество добавления юзерами в избранное это весьма интересный параметр. Проведите эксперимент: зайдите к себе в favs twitter.com/favorites и попробуйте посчитать. Могу сделать предположение, что у вас больше чем 1 твит добавлен в избранное, хотя вот у 80% фолловеров — ни одного.
Листы обычно используют продвинутые пользователи, которые понимают зачем они нужны, среди фолловеров @medvedevrussia таких 12%. Хотя, обычный пользователь, может без них легко обходиться.
У 44% дефолтные аватарки.
Для сбора статистики по фолловингу я воспользовался сервисом http://twittercounter.com/
Скриншот снят 22 февраля. Погуглив, я так и не понял что за магическая дата в конце августа, что так резко к аккаунту прибавилось 300 000 фолловеров.
Скриншот снят 11 мая.
ВКонтакте
Аккаунт существует с 9 ноября 2011, за это время на него подписалось 1 501 505 человек.
Почти 160 000 деактивированных аккаунтов.
Деактивированные аккаунты это те, которые по мнению соц-сети ведут подозрительную активность, например как Дмитрий Медведев. На сколько я понимаю, когда проходит период возможности восстановления аккаунта, то старница удаляется и становится такого вида.
Если посмотреть первых подписчиков Дмитрия Анатольевича, то можно увидеть такую картину:
Интересно почему если отмотать примерно в середину, картина резко поменяется?
62% мужчины, 38% женщины. Я, если честно, думал что будет наоборот.
У 600 тыс. человек указан год рождения. 65% человек указали, что им от 12 до 21 года. 10 человек младше 12 лет.
У 14 тыс. человек нет друзей, а больше чем у 35 тыс. больше тысячи. В остальном, все обычно, у людей от 100 до 500 человек в основной массе.
Подписчики Дмитрия Анатольевича весьма любят добавлять к себе аудио и видео :)
Ну и наверное самый интересный график показывающий активность юзеров, на основании параметра последнего захода к себе в аккаунт. 880 тыс. людей были активными в VK хоть раз за сутки. Лишь 130 тыс. не заходили больше месяца.
Страничку в Facebook Медведев завел 20 октября 2011 года.
К сожелению, я не нашел способа просмотреть всех подписчиков через API, поэтому приходится довольствоваться статистикой, которая представляет сама социальная сеть.
Не сложно посчитать, что только 2.3% из лайкнувших страницу участвуют каким-то обрлзом в обсуждении контента на странице.
Как я считал
Скрипт граббер написан на ruby, для получения данных из твиттера использовал этот гем. Чтобы скрипт отработал за приемлимое время, пришлось заюзать мой старый аккаунт @first_follower, в свое время его Твиттер поместил в White List, поэтому в час я могу делать не 300 запросов, а 10 000. Разбил еще все на треды, скрипт справился за ночь.
С ВКонтакте все несколько сложнее. К сожалению, я не нашел хоть сколько-нибудь приемлемого гема для API vkontakte, поэтому работал напрямую через вызов API запросов.
Графики строил в Excel. Человечков взял с сервиса для создании инфографики: http://infogr.am/, жалко сервис еще очень и очень сырой, хотя идея хорошая.
Данные
Я прекрасно понимаю, что с теми данными, которые я собрал можно построить еще много интересных вещей и зависимостей, я всегда рад новым идеям. Еще, могут найтись те, кто скажет что я сильно «приукрашиваю» положение дел. Для вас csv файлы со всеми данными. Решил попробовать yandex disk, раз уж определенная группа товарищей его так хвалит.
Да, я долго думал, правильно ли размещать данные с указанием ID пользователей. Решил, что т.к. сами социальные сети твиттер и вконтакте позволяют внутри веб интерфейса посмотреть всех подписчиков, значит в этом тайны быть никакой не может.
Зачем?
Мне было интересно посмотреть на реальные цифры, какая аудитория читает известного человека в соц-сети. По цифрам, которые предлагает смотреть сама соц-сеть совершенно непонятно, кто все эти тысячи людей, насколько активны, насколько они «живые». По планам, провести еще 1 анализ на предмет того, у всех ли показатели активности читателей одинаковы внутри соц-сети.
Автор: babi4