Мы ежедневно выполняем срез документов, расположенных на главных страницах миллиона самых посещаемых сайтов мира. Сегодня рассмотрим, как количество упоминаний кандидатов в президенты РФ коррелирует с происходящими оффлайн событиями.
Читать полностью »
Рубрика «statoperator»
Предвыборная гонка глазами поисковых роботов
2018-03-12 в 23:22, admin, рубрики: big data, data mining, statoperator, выборы, Исследования и прогнозы в ITКак мы изгоняли наркоторговцев из рунета
2017-10-15 в 10:16, admin, рубрики: crawling, data mining, statoperator, органы государственной власти, Роскомнадзор, управление проектамиСегодня мне хотелось бы поведать вам историю о том, как мы определяли сайты, торгующие наркотиками в рунете, о масштабах проблемы, об опыте взаимодействия IT компании с Роскомнадзором, депутатами, различными палатами, и почему на это больше не хватает зла.
Читать полностью »
Измеряем динамику упоминания сущностей в информационном поле
2017-08-22 в 10:55, admin, рубрики: big data, data mining, information retrieval, statoperator, text mining, web crawling, визуализация данных, открытые данные, Регулярные выраженияСегодня мы покажем дашборд с визуализацией данных о динамике популярных сущностей, засетапим для пользователей хабра отдельный инстанс и дадим на нём возможность следить за собственными показателям, добавив регулярку.
Читать полностью »
Чем занимались пиарщики РПЦ в день встречи Путина и Трампа на G20?
2017-07-08 в 6:41, admin, рубрики: data mining, g20, statoperator, визуализация данных, данные, иформационное поле, путин, рпц, трамп
В рамках данной стати мы будем проводить замеры динамики пульсации сущностей в информационном пространстве.
Читать полностью »