Рубрика «data science»

За шесть лет в IT, и в команде Machine Learning Technologу Research «Лаборатории Касперского» в частности, я прошел путь от стажера до Data Science Team Lead. Шел честно :) И на каждой ступени проходил через разные нюансы, о которых и хочу рассказать в этой статье. Полагаю, мой опыт будет полезен как начинающим коллегам, чтобы увидеть для себя недостающие аспекты профессионального роста, так и более опытным специалистам, чтобы отрефлексировать свой опыт и задуматься о том, что помогло им в карьере. Кстати, было бы здорово послушать и о ваших аспектах роста в комментариях :)

Senior. Туда и обратно: что я сначала не понимал в своей карьере, а потом как понял - 1
Читать полностью »

Каждый месяц появляются сотни и тысячи научных статей, которые описывают новые разработки в области ИИ. Однако проверить большую часть этих результатов собственными силами и использовать предложенные методы и модели в своем проекте часто очень трудно. К статьям не всегда прикладывается код, еще реже доступны данные, на которых проводили обучение моделей, а значит нельзя просто скачать данные из репозитория и попробовать повторить результат. Имеет место так называемый кризис воспроизводимости.

Читать полностью »

Привет! Я Иван Косолапов, тимлид команды ETA/RTA. Мы часть сервиса Data Science и занимаемся анализом данных и машинным обучением для задач навигации в 2ГИС.

Читать полностью »

Итак, друзья, продолжаем тему прогнозирования временных рядов с помощью Chronos.

Напомню, что Chronos это фреймворк от компании Amazon — простой, но эффективный фрэймворк для предобученных вероятностных моделей временных рядов.

Читать полностью »

Дорогие друзья, порадуемся тому факту, что даже в мире IDE есть свои пауки. Не те, что заползают в ваш код, добавляя баги, а настоящие спасатели программного хаоса. Сегодня речь пойдет о SpyderIDE, любимице научного сообщества и тех, кто слишком увлечен pandas и numpy, чтобы замечать окружающий мир.

Кто ты, Spyder?

Spyder (не путать с вашим дружелюбным соседом Человеком-Пауком) — это Scientific Python Development Environment, специальная IDE для научных исследований, машинного обучения и анализа данных. Ее интерфейс чем-то напоминает смесь Excel, MATLAB и RStudio, но с уникальным шармом Python.

Читать полностью »

Как организовать разметку данных для ML? Советы от Data Light - 1

За каждым «умным» решением, которое принимает ИИ, стоят огромные объемы данных, тщательно размеченные и подготовленные для обучения. Но как организовать этот процесс так, чтобы модель работала эффективно? Мы в Data Light считаем, что это искусство, требующее правильного подхода, инструментов и стратегии.

Читать полностью »

Когда говорят про ИИ в страховании, все обычно представляют классический ML и вероятностные модели (они конечно же имеются у нас в большом количестве).  Страховая отрасль богата всевозможными данными (телеметрия с авто, внешние условия, данные с сайтов и партнёров, и прочее). Все эти большие данные нужны для создания лучших предложений клиентам в рамках кастомизируемых и вариативных страховых продуктах.

Именно с ними работают математики, которых, чтобы было веселее, в страховании называют сложно выговариваемыми словами «актуарии» и «андеррайтеры».

Читать полностью »

Привет, Хабр Недавно посмотрел выступлениеЧитать полностью »

Привет! На связи команда продуктовой аналитики.

Подбор и обновление ассортимента товаров — постоянная головная боль для любого ритейлера. Это трудоемкий процесс, где каждая ошибка стоит реальных денег. В ecom.tech мы стараемся сделать его проще при помощи автоматизации, а заодно изучаем предпочтения покупателей. На этот раз мы искали, что обычно покупают в паре – так называемые комплементарные товары.

В этой статье расскажем:

  • с чем обычно покупают лапшу быстрого приготовления, а с чем — детское питание;

  • как география, время суток и другие факторы влияют на выбор покупателей;

  • Читать полностью »

Искусственный интеллект (AI) и машинное обучение (ML) уже давно вышли за рамки экспериментальных разработок и стали частью реальных проектов в бизнесе и промышленности. Их применение открывает новые горизонты для анализа данных, автоматизации задач и повышения эффективности работы компаний. В этой статье будут приведены примеры использования машинного обучения в реальных проектах, а также базовые шаги для обработки больших данных и настройки моделей. Для более глубокого изучения будут предложены полезные ресурсы и ссылки на инструментальные библиотеки.

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js