«Яндекс» рассказалЧитать полностью »
Рубрика «big data» - 60
Яндекс почистил юнит «Эксперименты» от ресурсоёмкой Yandex Data Factory и успешных «Медиасервисов»
2018-01-14 в 14:55, admin, рубрики: B2B, big data, Yandex Data Factory, закрытие, кейсы, поиск, Текучка, эффективность бизнеса, яндекс, Яндекс.Медиасервисы, метки: b2b, big data, Yandex Data Factory, закрытие, кейсы, поиск, Текучка, эффективность бизнеса, яндекс, Яндекс.МедиасервисыПрограммировать хочу, пусть меня научат! Образовательные проекты Avito
2017-12-22 в 11:48, admin, рубрики: android, backend, big data, html, iOS, ml, php, python, web, Блог компании Avito, Карьера в IT-индустрии, обучение, онлайн-курсы, стажировки, Учебный процесс в IT, Хакатоны, чемпионатыПривет! Меня зовут Анна, я руководитель образовательных проектов в Avito. Нам кажется очень важным способствовать тому, чтобы начинающие (и не только) разработчики узнавали о самых крутых технологиях на рынке. Поэтому мы делаем целый пул образовательных онлайн-проектов в партнёрстве с лучшими площадками. Подробно о них рассказываю под катом, там же раскрываю наши планы на будущее.
Предсказываем отток с помощью нейросети
2017-12-22 в 9:11, admin, рубрики: big data, data engineering, data mining, data science, machine learning, python, RNN, Блог компании Plarium, нейросетьПроблема предсказания оттока клиентов — одна из самых распространенных в практике Data Science (так теперь называется применение статистики и машинного обучения к бизнес-задачам, уже все знают?). Проблема достаточно универсальна: она актуальна для многих отраслей — телеком, банки, игры, стриминг-сервисы, ритейл и пр. Необходимость ее решения довольно легко обосновать с экономической точки зрения: есть куча статей в бизнес-журналах о том, что привлечь нового клиента в N раз дороже, чем удержать старого. И ее базовая постановка проста для понимания так, что на ее примере часто объясняют основы машинного обучения.
Для нас в Plarium-South, как и для любой игровой компании, эта проблема также актуальна. Мы прошли длинный путь через разные постановки и модели и пришли к достаточно оригинальному, на наш взгляд, решению. Все ли так просто, как кажется, как правильно определить отток и зачем тут нейросеть, расскажем под катом.Читать полностью »
Avito Product Analytics Meetup — видео, фото, слайды
2017-12-20 в 10:04, admin, рубрики: big data, meetup, Блог компании Avito, конференции, продуктовая аналитика, Управление продуктом, хранилища данныхНедавно в Avito прошёл первый Product Analytics Meetup. Мы говорили об NPS в продуктовой разработке, персонализации веб-сайтов на основе customer journey map, кросс-продуктовых эффектах, способах повышения конверсии, построении и эволюции аналитических хранилищ данных. Под катом — видеозаписи выступлений, слайды от докладчиков и ссылка на фотоотчёт.
ФРИИ предложил платить россиянам за передачу данных бизнесу
2017-12-20 в 8:42, admin, рубрики: big data, Закон о персональных данных россиян, законотворчество, персональные данные, Россия, Текучка, фрии, метки: big data, Закон о персональных данных россиян, законотворчество, персональные данные, Россия, Текучка, фрииФонд развития интернет-инициатив (ФРИИ) разработал концепцию законопроекта о регулировании больших данных и предложил включить в закон о персональных данных компании-посредники, которые бы знали, какой оператор хранит нужные бизнесу данные пользователей, но самими данными не располагает. Об этом сообщают «Ведомости» со ссылкой на документ.
R и СИБ. Как устранить противоречие интересов и запустить R на Linux в оффлайн-режиме
2017-12-18 в 14:58, admin, рубрики: big data, data mining, data science, R, Промышленное программированиеЯвляется продолжением предыдущих публикаций.
Очень часто попытки применить инструменты DataScience в корпоративной среде встают в полное противоречие с требованиями Службы Информационной Безопасности (СИБ). В мире DataScience рекомендация «поставь с гитхаба» становится практически нерешаемой при полной изоляции аналитической машины от интернета. Тем не менее, задача запуска на linux инфраструктуры R в offline окружении вполне решаемая. Ниже приведу последовательность мантр, которые позволят это исполнить. Если какие-то шаги будут не совсем прозрачными, то скорректирую по мере появления комментариев. Эти же шаги можно использовать и для online инсталляции, пропуская шаги, относящиеся к хитрым трюкам или созданию локальных репозиториев. Собрано по крупицам на основании многократных инсталляций под разнообразные задачи. Практика показала, что тема весьма актуальна.
Лекции Техносферы. Нейронные сети в машинном обучении
2017-12-18 в 13:43, admin, рубрики: big data, mail.ru, Алгоритмы, Блог компании Mail.Ru Group, лекции техносферы, машинное обучение, нейросеть, ТехносфераПредставляем вашему вниманию очередную порцию лекций Техносферы. На курсе изучается использование нейросетевых алгоритмов в различных отраслях, а также отрабатываются все изученные методы на практических задачах. Вы познакомитесь как с классическими, так и с недавно предложенными, но уже зарекомендовавшими себя нейросетевыми алгоритмами. Так как курс ориентирован на практику, вы получите опыт реализации классификаторов изображений, системы переноса стиля и генерации изображений при помощи GAN. Вы научитесь реализовать нейронные сети как с нуля, так и на основе библиотеке PyTorch. Узнаете, как сделать своего чат-бота, как обучать нейросеть играть в компьютерную игру и генерировать человеческие лица. Вы также получите опыт чтения научных статей и самостоятельного проведения научного исследования.
Глубокое обучение при помощи Spark и Hadoop: знакомство с Deeplearning4j
2017-12-15 в 14:36, admin, рубрики: Apache, big data, deep learning, Hadoop, java, spark, Алгоритмы, Блог компании Издательский дом «Питер», машинное обучение, Профессиональная литература, распознавание образовЗдравствуйте, уважаемые читатели!
Мы вполне убедились в мегапопулярности глубокого обучения (Deep Learning) на языке Python в нашей целевой аудитории. Теперь предлагаем поговорить о высшей лиге глубокого обучения — то есть, о решении этих задач на языке Java при помощи библиотеки Deeplearning4j. Мы перевели для вас июньскую статью из блога компании Cloudera, где в интереснейших подробностях рассказано о специфике этой библиотеки и о глубоком обучении в Hadoop и Spark.
Приятного чтения.
Читать полностью »
Построение процесса бизнес-анализа в проектах по разработке BI-приложений с продвинутой визуализацией
2017-12-14 в 5:57, admin, рубрики: big data, аналитика, бизнес-приложения, Большие данные, визуализация, визуализация данных, виртуализация, разработка мобильных приложений, разработка приложенийDisclaimer
Все мы видим, что сфера продвинутой аналитики набирает обороты и все больше специалистов интересуются данной областью. При этом понятной и доступной информации о построении процесса бизнес-анализа при разработке аналитических приложений в открытых источниках не так много. Поэтому очень сложно определиться с правильным рецептом (последовательностью действий) в рамках данного направления. В связи с этим я решил систематизировать ключевые ингредиенты и поделиться с вами пошаговой инструкцией, которая описывает действия аналитика по проработке предметной области и превращении туманной задачи «сделай то, не знаю что» в детальные требования к будущему приложению.
Mail.Ru Group обменяется данными о поведении клиентов с «Пятерочкой» и «Перекрестком»
2017-12-13 в 7:44, admin, рубрики: big data, dentsu aegis, mail.ru group, myTarget, Интернет-реклама, Текучка, метки: big data, dentsu aegis, mail.ru group, myTarget, интернет-реклама, ТекучкаMail.Ru Group и X5 Retail Group объявляют о начале партнерства в области таргетинга онлайн-рекламы и оценки ее влияния на продажи в конкретных магазинах. Новый инструмент уже протестирован международным рекламным холдингом Dentsu Aegis Network.
В рамках сотрудничества Mail.Ru Group и X5 клиенты платформы myTarget получат доступ к обезличенным данным ритейлера о покупательском поведении, что позволит совершенствовать таргетинг и соотносить данные о показах рекламы с результатами продаж в универсамах «Читать полностью »