Рубрика «analytics» - 3

image

Привет!

В последнее время все чаще приходится наблюдать, что ожидания работодателей и потенциальных ученых по данными сильно отличаются. Компания, инвестируя в новые разработки в первую очередь ждет возврат на инвестиции, а не очередную модель. Специалист же, окончивший всевозможные курсы ждет на вход чистые и понятные данные, а на выходе хотел бы отдать модель прикрепив к ней метрики качества. А дальше «пусть менеджеры разбираются», как это все будет встроено в процесс и как именно полученная модель будет использоваться. В результате возникает пропасть и непонимание между бизнесом и учеными.

По факту оказывается, что модели сами по себе никому не нужны, а на деле приходится заниматься очень большим количеством рутинных задач.

Хотелось бы на обобщенных примерах (все совпадения с реальной жизнью случайны) показать, какие же на самом деле трудности приходится преодолевать, чтобы принести работодателю деньги. Наверное, после этого в аналитику данных люди будут идти более осознанно, попутно получая нужные для работы навыки, а не изучая очередную статью про алгоритм.
Читать полностью »

Веб-аналитика. Как цифры нам врут - 1

Лет 15 назад я начал свой путь в сфере разработки сайтов и интернет-рекламы. Главным аргументом в переговорах с клиентом было то, что «в интернете всё можно посчитать». Имелось в виду, конечно, в отличие от ТВ, радио, баннерной рекламы и прочих не связанных с интернетом каналов.

В то время всё казалось понятным и прозрачным. Так оно, по сути, и было. С течением времени технологии стали менять наш мир всё быстрее и быстрее. Приложения, мобильные сайты, рекламные системы, инструменты веб-аналитики…

В итоге это стало настолько сложным, что для меня сейчас главным критерием оценки любой информации стала достоверность.

Предлагаю вам познакомиться с тем, как цифры путают нас. И как правильно интерпретировать данные, которые мы получаем в Я.Метрике, Google Analytics, других сервисах аналитики, блогах.

Естественно, для правильного понимания статьи нужно знать самые основные термины – конверсия, показатель отказов и прочее. Есть вещи очевидные, но уверен, и новенькое вы кое-что узнаете.

Коротко о содержании:

  • Изучение статистики при разработке структуры сайта
  • Топ-10, будь он неладен
  • Использование только одной системы сбора статистики
  • Изучение показателей по отдельности, а не в совокупности
  • Использование Google Analytics и Яндекс.Метрики, как единственных источников маркетинговых данных
  • «Тёмный трафик»
  • Несовпадение данных Я.Метрики и Я.Директ
  • Пресловутая конверсия
  • Чем меньше абсолютный показатель, тем важнее смысл
  • О чем ещё стоит помнить

Читать полностью »

image

На прошлой неделе прошла встреча кейс-клуба Data Science, на которой специалисты Avito рассказали о том, какие бизнес-задачи сервиса решаются с помощью машинного обучения. В частности поговорили про рекомендации, контекстную рекламу и модерацию. Под катом больше подробностей о встрече и видеозаписи докладов.

Читать полностью »

Обсуждение инструментов аналитики для работы с большими данными в Питере 14 сентября - 1

14 сентября в 19:00 мы встретимся в офисе компании Wrike, чтобы обсудить инструменты аналитики и работу с большими данными. Главное внимание мы уделим успешным практикам и инструментам, разберем конкретные кейсы, поговорим о построении системы аналитики в компании, попробуем дать конкретные советы и рекомендации. Эксперты с удовольствием ответят на ваши вопросы.
Читать полностью »

Spark Summit 2016: обзор и впечатления - 1

В июне прошло одно из самых крупных мероприятий мира в сфере big data и data science — Spark Summit 2016 в Сан-Франциско. Конференция собрала две с половиной тысячи человек, включая представителей крупнейших компаний (IBM, Intel, Apple, Netflix, Amazon, Baidu, Yahoo, Cloudera и так далее). Многие из них используют Apache Spark, включая контрибьюторов в open source и вендоров собственных разработок в big data/data science на базе Apache Spark.

Мы в Wrike активно используем Spark для задач аналитики, поэтому не могли упустить возможности из первых рук узнать, что происходит нового на этом рынке. С удовольствием делимся своими наблюдениями.

Читать полностью »

Когда человечество приближается к очередной ступеньке роста, сразу появляются люди, предвещающие очередной Апокалипсис и «Все пропало!». Индустрия социальных медиа, составные части которой — аналитика, лингвистика и неструктурированные BigData — также уже несколько раз упиралась в стены, но снова и снова разбивала кокон ограниченного восприятия и перелетала бабочкой к новым высотам.

Из наглядных проблем-решений можно вспомнить:
— «Сбор таких мощных потоков невозможен» — появились новые команды с новыми походами и реализовали Topsy, gnip, SDS;
— «Аналитика неструктурированных объемных разноязычных данных на лету невозможна» — Autonomy, Radian6, Brand Analytics отпровергли невозможность;
— «Лингвистика никогда не справится с такими скоростями» — на смену старым медленным алгоритмам пришли AlchemyApi, EurekaEngine

Высота очередной новой стены поднялась на новый, уже нетехнологический (здесь, фактически, объем человечества «закончился» раньше), а на социумный уровень - «Данных станет мало и все пропадет!» — этому посылу как раз и посвящена статья.

У нас есть (свой) ответ на очередную пугалку, но перед его публикацией возможно кто-то из коллег выскажет свое мнение? — welcome!

Очередное «Все пропало» или «Эпоха аналитики соцмедиа закончилась». Реально? - 1
Читать полностью »

В Телеграм-канале telegram.me/soMedia регулярно публикуются «полезняшки» из индустрии социальных медиа. Неделя отметилась публичными выступлениями двух мировых лидеров — Цукерберг на «F8» и Путин на «Прямой линии».
Полезное из индустрии социальных медиа. Дайджест за 09-04 — 16-04 - 1
Читать полностью »

В Телеграм-канале telegram.me/soMedia регулярно публикуются «полезняшки» из индустрии социальных медиа. В статье «Делаем свое популярное СМИ за 5 минут» не зря говорилось, что эксперт — это специалист, который не просто много знает, но и, главное, умеет применять свои знания для прогностики, предсказывая «что будет». На неделе случились события, которые позволили и показать (беспо)мощности мировых СМИ («Офшорогейт»), и предсказать результаты голосования в Голландии за … 24 секунды.

[03.04]
Полезное из индустрии социальных медиа. Дайджест за 03-04 — 08-04 - 1
Читать полностью »

Как использовать Parquet и не поскользнуться - 1

О хранении данных в Parquet-файлах не так много информации на Хабре, поэтому надеемся, рассказ об опыте Wrike по его внедрению в связке со Spark вам пригодится.
В частности, в этой статье вы узнаете:

— зачем нужен “паркет”;
— как он устроен;
— когда стоит его использовать;
— в каких случаях он не очень удобен.

Читать полностью »

Из Библии: «Нет пророка в своем отечестве». Поэтому на людей сильнее действуют пришлые пророчества (импортные статьи, предсказания болгарской Ванги или китайской философии). Так что по принципу японского айкидо используем чужую силу (веру, привычки, устои) на благо себя и приведем очередной перевод для продвижения полезного. Того, что уже массово используют (и в России тоже) практически все крупные FCMG: слушать людей, слышать, реагировать, влиять и побеждать. Благо добрая половина человечества уже живет в социальных медиа.

Используй или проиграй: 31 аргумент в пользу Social Media Intelligence - 1

В небольшом, но емком материале собрана полезная фактография, которую можно использовать в обсуждениях вашей позиции для движения в нужном направлении.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js