Сериал: Big Data — как мечта. Незапланированная 5-я серия: Большая игра. Частное мнение

в 20:50, , рубрики: analytics, big data, Brand Analytics, social media, twitter, Блог компании Brand Analytics, Блог компании PalitrumLab, венчурные инвестиции, интернет-маркетинг, Исследования и прогнозы в IT, метки:

В предыдущих сериях: Big Data — это не просто много данных. Big Data — процесс с положительной обратной связью. «Кнопка Обамы» как воплощение rtBD&A. Философия развития Big Data.
 
Сегодня, 11 апреля, Twitter объявил о прекращении контракта с DataSift. Казалось бы, ну и что? Фактически это означает начало Большой Игры, результаты которой можно сравнить с III Мировой. Звучит жутковато? Давайте расставим фигуры на доске и посмотрим.
 
Мы снимаем сериал про Big Data короткими сериями, так что предполагается, что зрители достаточно смышлёные и обладают широким кругозором, чтобы самостоятельно достраивать мизансцены и действия главных действующих лиц, когда они не в кадре.
 
Расставим некоторые фигуры на шахматной доске: США, Южная Америка, Европа, Китай, Россия, Twitter, Facebook, ВКонтакте — и посмотрим некоторые ходы в развитии партии под названием «Управление миром: Социальные сети и медиа».
 
Жили-были люди, они любили слушать истории и сказания о прошлых столетиях, потом появились книги о прошлых годах, позже — газеты с информацией за недели и дни, теперь есть соцсети с данными по миру за часы и Твиттер — за минуты. Это предел обычных людей (людей-датчиков) по «изданию» и получению информации.

P.S. Секунды и миллисекунды — это уже компьютеры и автоматы, «человечество» будущего, но об этом в другой серии.
 
Люди-датчики генерят моря и океаны медийной информации, в тысячи раз превышающие «стандартные СМИ» — газеты, журналы, радио и ТВ. Потоки мнений, высказываний людей, фото и видео-материалы, расширяют, а порою и полностью меняют целые индустрии: исследования, социология, PR, журналистика, маркетинг, транспорт, развлечения и т.д. Анализ данных социальных сетей позволяет решать «по-новому» (объемы, скорость, полнота) задачи во множестве индустрий. Поэтому в начале десятилетия Salesforce купил канадскую аналитическую платформу Radian6 за $380млн, а HP — Autonomy за $12млрд. Российский рынок также не остался в стороне — несколько коммерческих структур вложили средства в исследования и разработку в области аналитики социальных медиа.
 
Для аналитических платформ нужно много информации — разнообразной и многогранной. С началом эпохи интернета информация от людей агрегируется в разных «хранилищах»: сайтах и комментариях, форумах, блог-платформах, социальных сетях, микроблогах, фото- и видео-сервисах. Для доступа к пользователям Южной Америки американский Google купил (а затем «удавил в объятиях») Orkut, для Кубы американцы создали отдельную «подставную» социальную сеть, а Китай приложил огромные административные государственные усилия, чтобы изгнать американские социальные сервисы из страны.
 
Разные «хранилища» аккумулируют разные «виды» людей и информации (например, см. www.slideshare.net/Taylli01/2014-43472028 для пользователей интернет в России). Но для полноты картины для всех индустрий нужны данные из разных хранилищ, и вот тут на сцену выходят компании Большой Четверки: американские TopSy и gnip, английская DataSift и российская SDS/BrandAnalytics.
 
Каждая из 4-х уникальных систем «сбора и анализа» обладает своими специфическими особенностями (вследствие ориентации на определенные страны и рынки, языки, типы источников, объемы данных), но в этой серии речь идет о другой, более глобальной, плоскости:
 
1. TopSy — всегда считался большим другом Twitter и хранителем архивов последней, компании совместно делали множество интересных проектов, в том числе и «предсказание» следующего президента США. Для рынка стало огромным сюрпризом, когда TopSy был куплен за $200 млн в самом конце 2013 года, но не Twitter'ом, а… Apple. Да-да, тем самым производителем iPhone и iPad. На досуге интересно поразмышлять о причинах и следствиях. Напомним, что Национальная Библиотека Конгресса также заявила, что твиты — наследие человечества и хранит данные, начиная с 2012 года.
2. Следствием «увода» TopSy последовал быстрый (всего-то 3 месяца) ответ со стороны Twitter — компания в марте 2014 года покупает gnip (по оценкам рынка за $240 млн).
3. Таким образом, через год после сделок Apple-TopSy и Twitter-gnip, сегодняшнее объявление об «изгнании» английской DataSift компании из США «закапсулировали» в себя _открытый коммерческий доступ_ к стратегическим данным.
 
Обратите внимание на выделение в последнем пункте — именно здесь кроется много интересного: американо-английские компании 4 года основные разработки направили на обработку большого по объему, но небольшого (1-2 десятка) набора источников. В это же время SDS/BA вкладывались в обработку и топ-ресурсов (включая двусторонние соглашения с Одноклассниками, Мой Мир и др.), и десятков тысяч других источников (сайты и комментарии, форумы, блоги, видео и фото-хостинги). Разнообразие источников значительно расширяет возможности и применение в огромном море потребностей для разных областей человеческой деятельности.
 
Глобальные структуры (типа Samsung и HP), украинские, казахские, немецкие, французские, компании, работающие в арабских странах — напрямую или через агентства, уже активно используют универсальность российского подхода. После отсечения «независимого» DataSift теперь интерес будет еще выше — концентрация капитала сменяется концентрацией информации.
 
В следующих сериях поговорим о более приземленных для сегодняшнего дня вещах: NoSQL или колоночные СУБД, куда плывет «Голубой гигант», откуда растут ноги у слуха, что «данные кончаются».
 
1-я серия. Big Data — как мечта
2-я серия: Big Data негатива или позитива?
3-я серия: «Кнопка Обамы»
4-я серия. Революция мозгов

Автор: OzzyTech

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js