Всегда отрадно видеть, как западные тренды приходят на родные просторы, а технологии даже идут с опережением. Весь цивилизованный мир давно уже бурлит на тему использования Online Big Data и пользовательского контента социальных сетей, как поля для анализа, выявления трендов и общественных настроений и прогнозирования будущего. Пентагон объявляет тендеры на разработку прогнозной системы, больницы анализируют твиттер для предсказания эпидемий, а некоторые даже предсказывают стихийные бедствия и их последствия, анализируя контент социальных медиа.
Заметив серьёзный интерес Хабра к теме открывающихся на волне роста публичного контента и развития технологий Online Big Data, безграничных возможностей оперативной социологии и прогностики, я решил раскрыть тему подробнее и поделиться с вами практическим примером предсказания результатов финала телепроекта Голос.
Мы проверили, сможет ли Brand Analytics предсказать результаты финала. И можем сказать, что нам это удалось. За несколько часов до финала мы уже не сомневались, как проголосуют телезрители:
Мы знаем, что будет завтра
Проект «Голос» стал своеобразной революцией на российском телевидении. Впервые в проекте такого рода учитывались исключительно вокальные данные конкурсантов. В итоге проект Первого канала собрал лучшие голоса России и СНГ и завоевал сердца миллионов поклонников.
Только на официальном сайте проекта было оставлено более восемнадцати тысяч комментариев, а в финальном SMS-голосовании было отправлено более полутора миллионов сообщений.
Зрительское SMS-голосование было ещё одной особенностью проекта. Победителя проекта выбирали зрители, путем отправки SMS с номером любимого участника.
Можно предположить, что лидер по итогам голосования, окажется и лидером по количеству обсуждений в социальных медиа. Аналитики Brand Analitycs проверили, удастся ли предсказать победителя до финала, изучив мнения об участниках в социальных медиа. Нам удалось предсказать не только победителя проекта, но и достаточно точно увидеть, как распределятся голоса телезрителей.
Распределение количества обсуждений между финалистками, в процентах
Для каждой из четырёх финалисток проекта в системе Brand Analytics была заведена отдельная тема, в которую автоматически в режиме реального времени попадали все упоминания соответствующей участницы из социальных медиа. Кроме анализа количества сообщений, мы провели анализ тональности упоминаний, источников, авторов, географических данных и времени самых активных обсуждений.
Обратите внимание, между соотношением голосов и количеством обсуждений двух главных претенденток на финал – Эльмиры Калиммулиной и Дины Гариповой. Результаты SMS-голосования – 33,8% против 66,2%. Практически в таком же соотношении Дина Гарипова обходит Эльмиру и по количеству обсуждений в социальных медиа, что чётко видно в Brand Analytics, при чём не только по общему количеству упоминаний, но и по соотношению позитива и негатива.
Официальные результаты SMS-голосования телезрителей
Данные по количеству и тональности упоминаний участниц в Brand Analytics
Мы следили за обсуждениями в социальных медиа на протяжении месяца и видели, что Дина Гарипова лидировала по количеству упоминаний всё это время. Начиная с 28 декабря, то есть за сутки до финала, Дина обходит своих соперниц по количеству упоминаний в разы.
Социальное телевидение в России уже реальность
Анализ упоминаний проекта «Голос» интересен также и площадками обсуждения. На западе, где социальное телевидение – обсуждение телепроектов в социальных сетях в прямом эфире – явный тренд последних лет, обсуждения происходят преимущественно в Твиттере. У нас же картина иная – основными площадками дискуссий стали, помимо Твиттера, Вконтакте, YouTube, блоги и некоторые тематические сообщества.
Самые активные обсуждения, конечно, были в день финала. Впрочем, весь месяц, что мы следили за реакцией жителей социальных сетей на «Голос», пики обсуждений в социальных медиа всегда совпадали по времени с эфирными выпусками проекта, продолжались в течение следующего дня, после чего наблюдался существенный спад обсуждений. Такие пики по датам видно в теме каждой участницы, например, Анастасии Спиридоновой: 14 и 15 декабря, 21-22 декабря и 29-30 декабря.
Интересны также и всплески упоминаний во время финала. Самые активные обсуждения каждой участницы начинались после её выбывания из борьбы за первое место, а после выступления следующей финалистки шли на спад:
По данным Ericsson ConsumerLab в США, Европе и Китае, 62% зрителей активны в социальных сетях при просмотре ТВ, а четверть из них используют социальные сети для обсуждения программ непосредственно во время трансляции. Сегодня мы можем с уверенностью сказать, что социальное телевидение становится трендом и для российских социальных медиа. Очевидно, что многие проекты приковывают внимание зрителей, но, как мы видим, даже во время любимого шоу, поклонники не покидают социальные сети, а, напротив, ведут активные дискуссии в ходе просмотра.
Исключение из правил? Смотрим глубже!
Прогнозируя победителя, нельзя не обратить внимания на количество сообщений о Маргарите Позоян. По объёму упоминаний, она вышла на второе место, тогда как по результатам SMS-голосования заняла лишь четвёртое. Это отличный пример того, что анализа только количества упоминаний может быть не достаточно для получения объективной картины мнения общества в социальных сетях. Самый точный прогноз можно получить, проанализировав информационные срезы. В данном случае достаточно посмотреть на авторов сообщений, место обсуждений и сообщения, с наибольшим количеством дублей.
Во-первых, чуть больше 14% сообщений о Маргарите за финальную неделю – это упоминания в твиттере её наставника @BilanOfficial, которые, конечно, нельзя приравнять к SMS в её поддержку, в чём мы и убедились в финале.
Во-вторых, в ленте сообщений, мы можем увидеть, что за Маргариту Позоян призывали голосовать множество спамеров, и именно эти сообщения вывели финалистку чуть ли не в лидеры по количеству упоминаний:
Изучив эти показатели, мы видим, что её четвертое место – вполне объективный итог.
Благодаря мониторингу и анализу упоминаний в социальных медиа, мы с уверенностью можем сказать о том, что предсказать результаты различных выборных соревнований, с голосованием широкой аудитории, вполне реально уже сейчас. Всем желающим убедиться в этом, предлагаем проверить самостоятельно тут, или предложить свои темы для предсказаний.
Однако работы над проектом по созданию самой совершенной в мире системы оперативной социологии и прогностики на основании анализа социальных медиа идут полным ходом. Так что у вас есть шанс, внести свой вклад в развитие технологий будущего. Делитесь идеями, критикой, скепсисом, замечаниями и прочими полезными мнениями. Давайте обсудим, как лучше заглянуть в будущее и опередить в этом Пентагон ;)
Автор: romka777