В предыдущих сериях: Big Data — это не просто много данных. Правильные Big Data организуют позитивную обратную связь. В 3-ей серии: «Кнопка Обамы» как воплощение задач класса rtBD&A глазами аналитика Big Data.
По одной из современных легенд упоминание термина «Кнопка Обамы» появилось во времена президенства Д. Медведева, когда последний поехал в США. На встрече двух президентов-юристов и двух больших поклонников продукции Apple Барак Обама якобы похвалился интересным решением: iPad, на который установлена специализированная программа-телесуфлер с функцией отображения реакции телезрителей и слушателей.
Принцип действия стандартного телесуфлера, показывающего бегущую ленту текста и использующегося для многочисленных публичных выступлений американского президента, был дополнен новым функционалом: в зависимости от позитивной или негативной реакции зрителей, смотрящих выступление Обамы по телевизору или слушающих по радио, менялась цветовая гамма фона и текста на экране iPad. Если населению нравилось о чем в данный момент говорит президент, то экран «зеленел», если же наоборот, то окрашивался в красные тона и тем более яркие, чем сильнее была реакция людей. По нажатию кнопки можно было расширить текст дополнительными вставками по «зеленой» теме, чтобы продлить позитивную волну в целом от всего выступления, или наоборот, завершить негативную тему и перейти к следующей части послания.
Повторюсь, это всего лишь одна из современных технократических легенд-сказок, но как мы помним — в каждой сказке лишь доля сказки. Можно ли на практике воплотить «кнопку Обамы»? Ответ, конечно же положительный. Еще на выборах в 2012 году во Франции активно использовался новый термин — «социальное телевидение». Вот как описывала ситуацию корреспондент CNN Alice Antheaume в своей статье датированной 20 апреля 2012 года:
«Телевидение передает слова, произнесенные кандидатами, а в социальных сетях эти слова обсуждаются. Именно в социальных сетях люди делают выводы относительно убедительности кандидатов. Так происходит, потому что их обещания и цифры, которыми они жонглируют, проверяются на достоверность в реальном времени журналистами и экспертами, что гарантирует мгновенные и компетентные комментарии к разглагольствованиям политиков.»
В 2012 году журналистская братия еще не видела начало заката своей роли «промежуточного эксперта» между источниками информации и читателями, поэтому в вышеперечисленном абзаце единственными выгодополучателями от социального ТВ обозначены «журналисты и эксперты», которые, как предполагается, и должны (через свои аккаунты в соцсетях) «гласом Божьим разъяснять человеческому стаду» происходящее в мире. Но подробнее об этом в другой серии.
Возвращаясь к «кнопке Обамы»: аналитики Big Data обязаны подходить к любой сфере деятельности с точки зрения:
1. Процесса — непрерывному и беспощадному: это сейчас они Гималаи, а через сто миллионов лет — небольшие холмики. Никакой статики! Остановился — умер. Как сердце.
2. Информационных каналов данных: источник — среда — потребитель — сила реакции — передача.
3. Непрерывного мониторинга всего информационного поля — новые данные ценнее старых.
4. Положительной обратной связи — результаты любых задач должна приводить к продолжению процесса.
Исходя из вышеизложенного, в реал-тайм процедуре «кнопки Обамы» есть только источник (президент) и потребитель (зритель), другие субъекты (журналисты, эксперты) потенциально могут и вносят свое личностное восприятие в информационное поле (вечерние политические шоу, новостные обсуждения с экспертами), но не в режиме реал-тайм.
Переходя на технократический уровень поговорим о конкретике реализации «кнопки Обамы». В США основным и, фактически, единственным источником «социального ТВ» выступает Twitter, любимый многими технократами сервис микроблогов — наличие развитого API, коммерческого получения всего потока данных и бесплатного 1% потока, высокая структурированность сообщений (хэштеги, максимум 140 символов, связи, реакция в виде ретвитов и «избранное»).
В наступивший «период насыщения», когда уже большинство населения Земли таки или иначе повязаны интернетом и соцсетями, пользователи Twitter генерят 500 миллионов твитов в сутки. Очень грубая оценка: 60% — на английском, 30% — испанский/португальский. Поскольку в США живет огромное количество испаноговорящего населения, значит можно оценить объем обработки во время часового выступления президента как: (500.000.000/24) * 1,5 =~ 30 миллионов твитов (коэффициент 1.5 учитывает распределение твитов в течение суток), что соответствует потоку примерно в 10.000 сообщений в секунду. И осталось сущая ерунда: вычленить язык оригинала, определить, что речь идет про речь Обамы, определить тональность реакции, гео-лоцировать автора (достаточно на уровне страны или города) и визуализировать текущее состояние процесса.
Кроме того, аналитики Big Data высоко оценят такие важные факторы Twitter для «кнопки Обамы» как:
1. Скорость реакции людей в «социальном ТВ»: попробуйте рассказать друзьям (или зеркалу) какую-нибудь связную идею, мысль, проблему. Многие будут удивлены, насколько речь является низкоинформационным каналом данных! Требуется 3-5-7 минут, чтобы хоть что-то более-менее внятно изложить. Первая реакция через соцсети начинает генерироваться уже через 30-45 секунд. Так что за 2-3 минуты для аналитической системы уже хватает данных для оценки отношения населения.
2. Формат сообщений Twitter, несомненно, очень выигрышный для подобных задач: для контекста «Obama is a f*cking idiot and the world hates him» даже 140 символов — целая книга.
Американским аналитикам Big Data повезло: лингвистика и тезаурус народного американского значительно проще, чем народного русского, кроме того, в России для «социального ТВ» используется не только Twitter (это «любовь больших городов»), но и ВКонтакте, и Одноклассники с «Моим Миром», и Facebook с Instagram — см. регулярные исследования Brand Analytics по распространению соцсетей в России — br-analytics.ru/blog/socialnye-seti-v-rossii-zima-2014-2015-cifry/ — аналитики обязаны знать фактографию.
Поэтому реализация реал-тайм аналитики выступления президента России (для ясности — у президента никакой «кнопки Путина» не было, как и iPad-суфлера) потребовла значительно больше усилий для технической разработки и работы аналитиков: начиная от расширенной платформы сбора данных и заканчивая HiLoad-лингвистикой, способной проставлять объектовую тональность на мощном потоке сообщений.
Вот пара публичных ссылок по результатам подобных задач:
vox-populi.ru/pl2013.phtml — Прямая линия с Президентом России В.В. Путиным (25 апреля 2013 года).
vox-populi.ru/p121213.phtml — Обращение Президента с посланием (12 декабря 2013 года).
Для любителей поразмышлять (проверьте свои аналитические способности): есть ли разница для аналитиков в реализации rtBD&A между Прямой линией и Обращением? Ответ дан после краткого изложения 3-ей серии.
Краткий итог 3-й серии: Big Data — это процесс, распространяющийся по информационным каналам управления. Застывшие «большие данные» — это склеп и слепок мгновения. Но даже архивы можно оживить «поцелуем жизни» прекрасного принца-анлитика, включив данные в цепочку принятия следующих решений.
Ответ: «Послание» является на порядок более сложной задачей, чем двунаправленная «Прямая линия», даже не смотря на «короткий формат» — меньше часа (продолжительность Прямой линии составила 5 часов). Возможно, что кто-то из читателей в комментариях или личном сообщении попробует дать расширенный ответ (а почему Обращение на порядок сложнее) :-)
В следующей серии: бразилианская BigData-самба — энергетика + HANA, а также новая ожидаемая новость — большая дорога больших данных IBM: компания забывает о «железе», почему «Голубой гигант» освобождается от подразделений ПК и серверов?
1-я серия: Big Data — как мечта
2-я серия: Big Data негатива или позитива?
Автор: OzzyTech