25 апреля мы провели очередной митап Avito Student Talks, в этот раз он был посвящён аналитике: карьерному пути, Data Science и продуктовой аналитике. После встречи мы подумали, что её материалы могут быть интересны самой широкой аудитории и решили ими поделиться. В посте — видеозаписи докладов, презентации от спикеров, отзывы слушателей и, конечно, фотоотчёт.
Рубрика «аналитика» - 17
Student Talks: Аналитика. Материалы для начинающих
2019-05-08 в 12:26, admin, рубрики: data engineering, data science, аналитика, веб-аналитика, Карьера в IT-индустрии, митап, модерация, продуктовая аналитика, студенты, Учебный процесс в ITТестирование настройки sendBeacon для отправки данных
2019-04-26 в 13:54, admin, рубрики: google analytics, gtm, аналитика, веб-аналитика, тестПри использовании стандартных методов отправки данных в Google Analytics есть вероятность, что система не успеет отправить все события, если процесс был прерван перезагрузкой страницы. В начале этого года вышло несколько публикаций о том, как улучшить целостность собираемых данных в GA. Читать полностью »
Вдохновлялись продакшеном и баскетболом: как Яндекс готовит чемпионат по программированию
2019-04-26 в 6:52, admin, рубрики: Алгоритмы, аналитика, Блог компании Яндекс, бэкенд, Занимательные задачки, конкурсы, конкурсы разработчиков, математика, машинное обучение, Спортивное программирование, фронтенд, Яндекс.БлицВ конце мая начнётся наш чемпионат по программированию. Он будет проходить в онлайне и позволит проверить себя в одной из четырёх сфер: бэкенд- или фронтенд-разработке, машинном обучении или аналитике данных. Задачи для секций разработали в управлении машинного интеллекта и исследований, Поиске и геосервисах.
Всем участникам сначала предстоит преодолеть квалификационный раунд. После подачи заявки вы сами выберете, когда его проходить. Квалификация 4-часовая и включает в себя от 4 до 6 задач. Самых лучших мы пригласим к участию в финале, который пройдёт 1 июня, тоже в онлайне. Результаты станут известны 5 июня. Победители в каждом направлении получат по 300 тысяч рублей, второе место — 150 тысяч рублей, третье — 100 тысяч. Регистрация открыта и продлится до последнего дня квалификационного раунда — 26 мая, но лучше отправить заявку пораньше.
В этом посте мы поделимся опытом проведения подобных конкурсов — в части аудитории и составления сложных алгоритмических задач.
Мониторинг мёртв? — Да здравствует мониторинг
2019-04-18 в 13:36, admin, рубрики: devops, highload, ITSumma, аналитика, Блог компании ITSumma, веб-аналитика, высокая производительность, высоконагруженные проекты, Разработка веб-сайтов
Наша компания с 2008 года занимается преимущественно управлением инфраструктурами и круглосуточной технической поддержкой веб-проектов: у нас более 400 клиентов, это порядка 15% электронной коммерции России. Соответственно, на поддержке очень разнообразная архитектура. Если что-то падает, мы обязаны в течение 15 минут это починить. Но чтобы понять, что авария произошла, нужно мониторить проект и реагировать на инциденты. А как это делать?
Я считаю, что в организации правильной системы мониторинга происходит беда. Если бы беды не было, то мой спич состоял из одного тезиса: «Установите, пожалуйста, Prometheus + Grafana и плагины 1, 2, 3». К сожалению, теперь так не работает. И главная проблема заключается в том, что все продолжают верить во что-то такое, что существовало в 2008 году, с точки зрения программных компонентов.
В отношении организации системы мониторинга я рискну сказать, что… проектов с грамотным мониторингом не существует. И ситуация настолько плохая, если что-то упадёт, есть риск, что это останется незамеченным — все ведь уверены, что «всё мониторится».
Возможно, всё мониторится. Но как?
Все мы сталкивались с историей наподобие следующей: работает некий девопс, некий админ, к ним приходит команда разработчиков и говорит — «мы зарелизились, теперь замониторь». Что замониторь? Как это работает?
Ок. Мониторим по старинке. А оно уже изменяется, и выясняется, что ты мониторил сервис А, который стал сервисом B, который взаимодействует с сервисом C. Но команда разработчиков тебе говорит: «Поставь софт, он же должен все замониторить!»
Так что изменилось? — Всё изменилось!
Читать полностью »
Почти уволен. Как я построил отдел аналитики Яндекса
2019-04-12 в 7:31, admin, рубрики: аналитика, Блог компании Яндекс, Исследования и прогнозы в IT, карьера, Карьера в IT-индустрии, продуктовая аналитика, советы, управление проектами Меня зовут Алексей Долотов, я 10 лет не писал на Хабр. Отчасти дело в том, что когда мне было 22 года, я начал строить отдел аналитики Яндекса, затем семь лет им руководил, а теперь придумал и строю сервис Яндекс.Таланты. Профессия аналитика даёт массу возможностей. Главное правильно начать — например, в Школе менеджеров сейчас идёт набор по направлению аналитики.
Я решил рассказать, как развивалась моя карьера, и дать несколько советов тем, кто хочет «зажечь» в этой профессии. Надеюсь, мой своеобразный опыт окажется кому-нибудь полезным.
Единственный семестр вуза и начало карьеры
К моменту поступления в вуз я неплохо программировал, даже написал свой shareware-продукт (слово из прошлого). Это был каталогизатор лазерных дисков. Винчестеры ещё были небольшими, на них не всё помещалось, поэтому люди часто пользовались CD и DVD. Каталогизатор считывал файловую систему диска, индексировал её и собирал мета-информацию из файлов, записывал всё это в базу данных и позволял по ней искать. В первый день продукт скачало 50 тысяч китайцев, на второй день на Альтависте появился кряк. А я-то думал, что сделал классную защиту.
«Суверенный рунет», анализ изменений во 2-м чтении законопроекта (+ обновление)
2019-04-10 в 22:11, admin, рубрики: александр жаров, аналитика, Андрей Луговой, Артем Козлюк, блокировка, Госвеб, Госдума, домены, законотворчество, импортозамещение, Ирина Яровая, КЦ нацдомена, Максим Кудрявцев, провайдеры, Роскомнадзор, Ростелеком, рунет, Текучка, телеком, ФСБ, хостинг, шифрование, метки: Александр Жаров, аналитика, Андрей Луговой, Артем Козлюк, блокировка, Госвеб, Госдума, домены, законотворчество, импортозамещение, Ирина Яровая, КЦ нацдомена, Максим Кудрявцев, провайдеры, Роскомнадзор, Ростелеком, рунет, Текучка, телеком, ФСБ, хостинг, шифрованиеОбновлено в 1:11, к материалу добавлена вторая часть.
Накануне комитет Госдумы по информационной политике, информационным технологиям и связи рекомендовал к принятию законопроект о так называемом «автономном Рунете» во втором (основном) чтении. Рассмотрение документа палатой может состояться 11 апреля, начало действия закона — с 1 ноября. Гендиректор хостинга DiPHOST Филипп Кулин проанализировал часть изменений в тексте, произошедшие между первой и второй версией законопроекта.
Game over: аналитики сообщают о росте числа DDoS-атак на игровой сегмент
2019-03-27 в 15:48, admin, рубрики: ddos, аналитика, Блог компании Ростелеком-Solar, Инфографика, информационная безопасность, Исследования и прогнозы в IT, разработка игр«Ростелеком» провел исследование DDoS-атак, осуществлявшихся на российский сегмент интернета в 2018 году. Как свидетельствует отчет, в 2018 году произошел резкий рост не только количества DDoS-атак, но и их мощности. В фокусе внимания злоумышленников чаще всего оказывались игровые серверы.
Продуктовая аналитика ВКонтакте на базе ClickHouse
2019-03-26 в 10:52, admin, рубрики: big data, big data analytics, clickhouse, sql, анализ данных, аналитика, базы данных, Блог компании ВКонтакте, Вконтакте, продуктовая аналитика, статистический анализРазвивая любой продукт, будь то видеосервис или лента, истории или статьи, хочется уметь измерять условное «счастье» пользователя. Понимать, делаем мы своими изменениями лучше или хуже, корректировать направление развития продукта, опираясь не на интуицию и собственные ощущения, а на метрики и цифры, в которые можно верить.
В этой статье я расскажу, как нам удалось запустить продуктовую статистику и аналитику на сервисе с 97-миллионной месячной аудиторией, получив при этом чрезвычайно высокую производительность аналитических запросов. Речь пойдёт о ClickHouse, используемых движках и особенностях запросов. Я опишу подход к агрегации данных, который позволяет нам за доли секунды получать сложные метрики, и расскажу о преобразовании и тестировании данных.
Сейчас у нас около 6 миллиардов продуктовых событий в сутки, в ближайшее время дойдём до 20–25 миллиардов. А дальше — не такими быстрыми темпами поднимемся до 40–50 миллиардов к концу года, когда опишем все интересующие нас продуктовые события.
1 rows in set. Elapsed: 0.287 sec. Processed 59.85 billion rows, 59.85 GB (208.16 billion rows/s., 208.16 GB/s.)
Подробности под катом.
Читать полностью »
Huawei решил предустанавливать собственную «Музыку» с Honor-ом
2019-03-26 в 4:07, admin, рубрики: huawei, аналитика, Владимир Горбунов, Железо, запуск, китай, Медиа, Михаил Ильичев, мобильные приложения, музыкальные сервисы, Россия, Сергей Половников, Текучка, Эльдар Муртазин, метки: huawei, аналитика, Владимир Горбунов, железо, запуск, китай, медиа, Михаил Ильичев, мобильные приложения, музыкальные сервисы, Россия, Сергей Половников, Текучка, Эльдар МуртазинИсточник «Коммерсанта» выяснил, что до конца года китайский производитель телефонов Huawei запустит в России мобильный музыкальный сервис. Huawei и его дочерняя марка «Honor» — лидеры рынка продаж новых телефонов в стране, но не рынка подписных сервисов. Однако «Музыку Huawei» не придётся дорого доносить до российской аудитории, Читать полностью »
Как исследователи в Uber применяют и масштабируют знания о поведении человека
2019-03-21 в 13:06, admin, рубрики: big data, uber, аналитика, бизнес-модели, Блог компании Skyeng, дата-инженер, методология, наука о поведении, психология клиента, Управление продуктом, управление проектамиМы подготовили для читателей Хабры перевод статьи команды Uber Labs. Коллеги из Uber описывают процесс работы аналитиков узкоспециализированного типа (в области науки о поведении) в рамках огромной корпорации, как устроено их взаимодействие с аналитиками других типов (UX-исследователи, продуктовые аналитики) и коллегами из других команд (продуктовых, внутренней разработки), какие задачи они решают и как к ним подходят. Комментирует материал Глеб Сологуб, директор по аналитике Skyeng.
В Uber Labs мы стремимся использовать идеи и методы науки о поведении, чтобы создавать интуитивно понятные и приятные программы и продукты. Члены нашей команды имеют ученые степени по психологии, маркетингу и когнитивным наукам, обладают знаниями предметных областей — таких, как принятие решений, мотивация и обучение, методологические возможности в дизайне экспериментов, а также являются экспертами по статистическому моделированию и причинно-следственным подходам. Эти знания позволяют нам глубоко анализировать проблемы повышения степени удовлетворенности клиентов, а благодаря нашему опыту в области методологии и статистики мы можем измерить влияние удовлетворенности на бизнес (одним из таких подходов является моделирование посредника).
Читать полностью »