Рубрика «data science»
Senior. Туда и обратно: что я сначала не понимал в своей карьере, а потом как понял
2025-01-06 в 6:17, admin, рубрики: data science, machine learning, python, джун, карьера, Карьера в IT-индустрии, карьера ИТ-специалиста, лаборатория касперского, развитие, развитие навыков, развитие программиста, сеньор, советыПочему мы топим за открытый код в науке ― несколько слов о воспроизводимости результатов научных исследований
2024-12-17 в 9:18, admin, рубрики: data science, fedot, github, open source, искусственный интеллект, итмо, машинное обучение, научные исследования, университетыКаждый месяц появляются сотни и тысячи научных статей, которые описывают новые разработки в области ИИ. Однако проверить большую часть этих результатов собственными силами и использовать предложенные методы и модели в своем проекте часто очень трудно. К статьям не всегда прикладывается код, еще реже доступны данные, на которых проводили обучение моделей, а значит нельзя просто скачать данные из репозитория и попробовать повторить результат. Имеет место так называемый кризис воспроизводимости.
Магия простоты: как мы улучшили отображение общественного транспорта на карте
2024-12-12 в 10:08, admin, рубрики: AI, data scienceПривет! Я Иван Косолапов, тимлид команды ETA/RTA. Мы часть сервиса Data Science и занимаемся анализом данных и машинным обучением для задач навигации в 2ГИС.
Chronos от Amazon: революция в обработке временных рядов. Часть 2
2024-12-06 в 6:00, admin, рубрики: artificial intelligence, Chronos, data science, llm, machine learning, natural language processing, time series, временные ряды, искусственный интеллект, машинное обучениеИтак, друзья, продолжаем тему прогнозирования временных рядов с помощью Chronos.
Напомню, что Chronos это фреймворк от компании Amazon — простой, но эффективный фрэймворк для предобученных вероятностных моделей временных рядов.
SpyderIDE: Твоя новая «восьмилапая» подруга для Python-разработки
2024-12-04 в 9:15, admin, рубрики: data science, mathematica, matplotlib, ml, numpy, python, SpyderIDE, обзор, Программирование, среда разработкиДорогие друзья, порадуемся тому факту, что даже в мире IDE есть свои пауки. Не те, что заползают в ваш код, добавляя баги, а настоящие спасатели программного хаоса. Сегодня речь пойдет о SpyderIDE, любимице научного сообщества и тех, кто слишком увлечен pandas и numpy, чтобы замечать окружающий мир.
Кто ты, Spyder?
Spyder (не путать с вашим дружелюбным соседом Человеком-Пауком) — это Scientific Python Development Environment, специальная IDE для научных исследований, машинного обучения и анализа данных. Ее интерфейс чем-то напоминает смесь Excel, MATLAB и RStudio, но с уникальным шармом Python.
Как организовать разметку данных для ML? Советы от Data Light
2024-11-29 в 13:30, admin, рубрики: data annotation, data science, data science digest, аннотация данных, инструменты для аннотации, краудсорсинг, разметка данных, разметка датасетаЗа каждым «умным» решением, которое принимает ИИ, стоят огромные объемы данных, тщательно размеченные и подготовленные для обучения. Но как организовать этот процесс так, чтобы модель работала эффективно? Мы в Data Light считаем, что это искусство, требующее правильного подхода, инструментов и стратегии.
От слов к делу: Практические кейсы применения NLP в Ингосстрахе
2024-11-28 в 10:07, admin, рубрики: AI, data science, llm, machine learning, nlp, бенчмаркиКогда говорят про ИИ в страховании, все обычно представляют классический ML и вероятностные модели (они конечно же имеются у нас в большом количестве). Страховая отрасль богата всевозможными данными (телеметрия с авто, внешние условия, данные с сайтов и партнёров, и прочее). Все эти большие данные нужны для создания лучших предложений клиентам в рамках кастомизируемых и вариативных страховых продуктах.
Именно с ними работают математики, которых, чтобы было веселее, в страховании называют сложно выговариваемыми словами «актуарии» и «андеррайтеры».
Увеличиваем размер выборки и прокрашиваем серые метрики: неочевидная ошибка при проведении А-B — тестов
2024-11-16 в 11:15, admin, рубрики: data scienceПривет, Хабр Недавно посмотрел выступлениеЧитать полностью »
Необычные вкусы покупателей: что такое товарные пары и как их исследовать
2024-11-01 в 7:03, admin, рубрики: data mining, data science, retail, анализ данных, комплементы, продуктовая аналитика, Статистика в ITПривет! На связи команда продуктовой аналитики.
Подбор и обновление ассортимента товаров — постоянная головная боль для любого ритейлера. Это трудоемкий процесс, где каждая ошибка стоит реальных денег. В ecom.tech мы стараемся сделать его проще при помощи автоматизации, а заодно изучаем предпочтения покупателей. На этот раз мы искали, что обычно покупают в паре – так называемые комплементарные товары.
В этой статье расскажем:
-
с чем обычно покупают лапшу быстрого приготовления, а с чем — детское питание;
-
как география, время суток и другие факторы влияют на выбор покупателей;
Data Science и машинное обучение: примеры использования в реальных проектах
2024-10-29 в 5:15, admin, рубрики: data scienceИскусственный интеллект (AI) и машинное обучение (ML) уже давно вышли за рамки экспериментальных разработок и стали частью реальных проектов в бизнесе и промышленности. Их применение открывает новые горизонты для анализа данных, автоматизации задач и повышения эффективности работы компаний. В этой статье будут приведены примеры использования машинного обучения в реальных проектах, а также базовые шаги для обработки больших данных и настройки моделей. Для более глубокого изучения будут предложены полезные ресурсы и ссылки на инструментальные библиотеки.