Сериал: Big Data — как мечта. II серия. Big Data негатива или позитива?

в 11:29, , рубрики: big data, аналитика, Блог компании Brand Analytics, Блог компании PalitrumLab, исследования, Исследования и прогнозы в IT, Карьера в IT-индустрии, общество, Управление сообществом

Вы когда чаще злы — с утра, днем, или под вечер? Можно ли было уменьшить потери Сколково на досрочное сокращение инвестиций в «неудачные» 50-70 стартапы? Куда перехать жить? Вы можете задаться и другими вероятностно-неопределенными вопросами и задачами — у каждого из нас есть таких мильон. Часто технологии Big Data позволяют … нет, не решить, а правильно подойти к проблематике в целом, посмотреть с высоты Демиурга, поставить правильные вопросы и выстроить более оптимальные пути практического решения.

В комментариях к 1-й серии ServPonomarev задал интересный вопрос про кейсы получения новых мета-знаний из Big Data. Предлагаем даже пойти немного дальше: новые технологии могут позволить не только получить новые знания, но и, по-демиурговски, повлиять новыми знаниями на окружение.

Для начала ответьте сами себе на один вопрос: "Во сколько раз в соцсетях негатива больше чем позитива? В 2, 5, 10 раз? Или может быть все-таки примерно одинаково?" Все мы знаем, что соцсети — это настоящая клоака негатива, осталось проверить глубину падения человечества. Но заниматься подобной ерундой могут себе позволить только грантовые «научники» или в виде «технологического ответвления» практических задач.

Задача геолоцирования «сообщений» в ВК, FB, Twitter, OK, Instagram и др. соцсетей не FourSqure'овского типа — одна из серьезных коммерческих потребностей, требующая нетривиальных решений и массированного мирового тестирования. Хорошие руководители конечно же пытаются «получить навар» с любых затрат. Пару лет назад Наталье Соколовой, руководителю Brand Analytics, пришла идея практического приложения тестирования нового мощного гео-модуля — так родилось популярное регулярное исследование «Любовь и ненависть по регионам России», результаты которого с удовольствием перепечатывает масса региональной и федеральной прессы и пользователи соцсетей, а губернаторы используют в своих отчетах. Последнее исследование за период зима 2014-2015гг — br-analytics.ru/blog/lubov-i-nenavist-na-karte-rossii/

Данные для исследования — свыше полуМИЛЛИАРДА сообщений за 2 недели декабря от 35 млн российских авторов. Понятно, что результаты исследования — верхушка айсберга, и люди с аналитическим умом и «синдромом Менделеева» могут самостоятельно «раскопать» много дополнительной интересной информации, сравнивая с другими данными. Например, оценить объемы данных по конкретным соцсетям из публичной онлайн-статистики агрегатора данных соцмедиа — pl.ilook.ru/statistics. Об уникальных особенностях технологии агрегации данных соцмедиа мы обязательно поговорим в одной из серий, это огромный и технологический интересный рынок — не зря же Apple «увел» у Twitter'а TopSy за $200млн, Twitter, в отместку, был вынужден покупать gnip, а FB маркетинговые инсайты делает с DataSift.

Возвращаясь к «Любви и ненависти»: задавая сотням знакомых первоначальный вопрос («Во сколько раз негатива больше позитива?») всего один раз услышали ответ, что «Позитива, наверное, больше». Исследование показывает, что позитива в в высказываниях пользователей соцсетей в российских соцсетях БОЛЬШЕ негатива в среднем в 4 раза!

Два аспекта в завершении серии:

1. Полтора месяца назад было опубликовано исследование «научников»-лингвистов о позитивном настрое человечества в целом: www.pnas.org/content/112/8/2389.full — само исследование, русскоязычная интерпретация результатов — lenta.ru/news/2015/02/10/positive/

Подобные исследования требуют серьезной методологии и лингвистической проработки. Brand Analytics выпускает исследование «Любовь и ненависть» в полугодовом режиме, потому что социум меняется медленно и большая частота ДЛЯ ИССЛЕДОВАНИЯ не нужна. Скорость нужна для МОНИТОРИНГА изменяющейся ситуации и трендовых всплесков (типа «Челябинский метеорит»). На подготовку исследования затрачивается всего 1-2 дня работы аналитиков Big Data, потому что имеются соответствующие технологии обработки неструктурированных Big Data (лингвистика, тональность, NER, гео-привязка), о которых также поговорим подробнее в дальнейшем.

2. На наш взгляд, самый главный и неожиданный результат: каждое следующее полугодовое исследование показывает рост позитивности в соцсетях в России! Создана положительная обратная связь: миллионы людей — миллиарды сообщений — технологии Big Data — исследование — тысячи публикаций в соцмедиа (СМИ, форумы, соцсети) — десятки тысяч комментариев, обсуждений, клятв «теперь буду у себя в паблике писать только позитивные мысли» — рост позитива у миллионов людей… Человек — был и есть стадное существо :-)

Краткий итог 2-й серии: Big Data — озеро данных, но чтобы поймать вкусную рыбу, нужна начальная информация — правильные вопросы: почему вы оказались рядом с озером? зачем вам нужна рыба? какого цвета, размера, с какой глубины нужна рыба? Тогда вы получите половину ответа: нужна ли вам удочка или спиннинг, грузило или поплавок, лодка или «с берега». Приятного аппетита!

В следующей серии обязательно расскажем об аналитиках Big Data: во-первых, наши коллеги постоянно ищут таковых (пока анализ BD — это больше искусство, чем мастерство, а сотни называющих себя таковыми — недостаточно разделяют себя и «систему» или привыкли работать в более спокойном режиме (неделя-месяц-квартал, а не секунды-минуты-часы); во-вторых, после первой серии пришло 5 запросов с вопросами про аналитику Big Data — а мы стараемся следовать сигналам интереса.

Автор: OzzyTech

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js