Рубрика «data science»

Архитектура проекта автоматического обучения ML-моделей

2025-04-17 в 12:45, admin, рубрики: AutoML, data science, machine learning, python

На связи Кравцов Кирилл и Суздалев Руслан из команды моделирования поведенческих сценариев Центра развития искусственного интеллекта СПАО «Ингосстрах» (далее – ЦРИИ). В статье поделимся решением, которое помогает нам быстрее обучать и интегрировать модели в компании.

С ростом компании и ЦРИИ, в частности, у нас появлялось все больше бизнес-заказчиков, которым нужны были ML-модели. Поэтому потребность росла, а ограниченность ресурсов не позволяла быстро обрабатывать задачи бизнеса и многое уходило в беклог.

Читать полностью »

Как я сделала свой первый AI-продукт с ChatGPT и капелькой любви

2025-04-16 в 20:06, admin, рубрики: AI-Product, api, chatgpt-4, data science, flask, logistic regression, ml, python3, scikit-learn

В этой статье я расскажу о моем опыте самостоятельного изучения основ Python и Machine Learning и создании первого проекта OneLove на базе собственной модели искусственного интеллекта.

Кто я и зачем мне это было нужно

Мне 51 год, и я работаю тестировщицей в банке. По образованию я экономист. У меня нет особых навыков программирования. Были попытки учить Python и Java, но без практического применения. По работе немного пишу на JS для авто-тестов в Cypress фреймворке, тестирую UI и API — так что базовое понимание, как всё устроено, у меня есть.

Читать полностью »

Нелинейные зависимости в регрессии. Как линейная регрессия может описать параболу, синусоиду и твою зарплату (хихи)

2025-04-15 в 6:16, admin, рубрики: data science, регрессия, собеседование

Разбираем стажерско-джуновский вопрос с собеседования.

Вопрос с собеса:

«Можем ли мы описать параболу линейной регрессией?»

Читать полностью »

Мифы о байесовском А-Б тестировании

2025-04-11 в 12:23, admin, рубрики: ab testing, ab-тестирование, bayesian, data science, анализ данных, аналитика, байесовский подход, проверка гипотез, статистика

Сегодня сравним два подхода к А/Б тестированию: байесовский и частотный. Обсудим сложности в интерпретации p-value. Посмотрим, как можно учитывать дополнительную информацию через априорное распределение. Остановим тест раньше времени и решим проблему подглядывания.

Меня зовут Коля, я работаю аналитиком данных в X5 Tech. Мы с Сашей продолжаем писать серию статей по А/Б тестированию. Предыдущие статьи можно найти в описании профиля.

Постановка задачи

Читать полностью »

Как полюбить математику и подружиться с ней на всю жизнь, если ты уже не школьник

2025-04-02 в 11:15, admin, рубрики: data science, аналитическая геометрия, линейная алгебра, матан, матанализ, математика, математика взрослому, математика для гуманитариев, математика на пальцах, математический анализ

«Вспоминаю, как в 7-м классе ничего не понимал, когда мы начинали разбирать тригонометрию. С учителем мы не смогли найти общий язык, поэтому к 8–9-му классу я был уверен, что никогда не буду заниматься математикой, а уж тем более сидеть по несколько часов в день, утыкаясь в учебники Беклемишева или Кожевникова и параллельно просматривая лекции Физтеха…»

Читать полностью »

Применение роя агентов в криптовалютном телеграм боте

2025-03-30 в 15:18, admin, рубрики: Binance, data science, javascript, python, TypeScript, блокчейн, искуственный интеллект, Криптовалюты, машинное обучение, трейдинг

Исходный код, разобранный в статье, опубликован в этом репозитории

OpenAI развивает технологию роя агентов искусственного интеллекта, активная LLM модель переключается исходя из контекста поставленной задачи. Например, когда холодный контакт написал в личку телеграм, общение идёт приветливо и многословно, как только речь идет непосредственно о покупке товара, другая модель говорит минимально по делу

Читать полностью »

Все ли волки страшные: AUF или как приручить uplift?

2025-03-28 в 9:41, admin, рубрики: data science, machine learning, open source, python, uplift, uplift modeling, uplift modelling, библиотека, визуализации, метрики

Всем привет! Меня зовут Мельников Виктор, я работаю Junior Data Scientist в хабе Розничного Бизнеса Департамента Продвинутой Аналитики в Альфа-Банке. В этой статье я расскажу про AUF — Open Source библиотеку Альфа-Банка.

Её главная задача — автоматическое решение задач uplift-моделирования.

Позволяет ускорять разработку в десятки раз и убирает рутину, избавляя от привычного fit-predict. Приятным бонусом идёт полный отчёт по качеству модели, понятный как DS, так и бизнесу.

ДисклеймерЧитать полностью »

За гранью A-B: Синтетический контроль

2025-03-28 в 7:19, admin, рубрики: ab-тестирование, causal Inference, data analytics, data science, time series, аналитика данных, оценка эффекта, прогнозирование, продуктовая аналитика

Привет! Я Настя — лид A/B Платформы в Wildberries. На протяжении всего карьерного пути меня интересует тема оценки эффектов. Для этого существуют различные инструменты, в числе которых как A/B‑тестирование, так и альтернативные способы, например, различные вариации Causal Inference.

В этой статье я хочу поделиться примером проведения двух квази‑экспериментов в Wildberries с использованием Синтетического контроля (Synthetic Control).

Почему не А/B-тестирование?

Читать полностью »

Задача про n-ое число Фибоначчи

2025-03-18 в 7:15, admin, рубрики: data science, fibonacci, integer, ml, sequences

Суть моего труда заключается в том, чтобы определить функцию для нахождения n-ого числа Фибоначчи с линейной сложностью поиска. Вот какие методы я попробовал:

Возможно получится по простым данным постоить полином большой степени, используя метод неопределённых коэффициентов и использовать его для подсчёта последующих значений последовательности.

Читать полностью »

Logit Lens & ViT model: туториал

2025-03-16 в 15:46, admin, рубрики: data analysis, data science, explainable ai, Transformers

Привет!

В этом туториале разобран метод для анализа внутренних представлений "логит-линза" (Logit Lens).

В результате практики по туториалу, вы:

Изучите подход и концепцию Logit Lens;
Реализуете Logit Lens для Visual Transformer;
Познакомитесь с анализом результатов применения логит-линзы.

Приступим! Как всегда, весь код будет на гитхаб — step by step.

Logit Lens: о методе

Метод Logit Lens был предложен на Lessworng в 2020 году на примере модели GPT-2.

Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «data science»

Архитектура проекта автоматического обучения ML-моделей

Как я сделала свой первый AI-продукт с ChatGPT и капелькой любви

Кто я и зачем мне это было нужно

Нелинейные зависимости в регрессии. Как линейная регрессия может описать параболу, синусоиду и твою зарплату (хихи)

Мифы о байесовском А-Б тестировании

Постановка задачи

Как полюбить математику и подружиться с ней на всю жизнь, если ты уже не школьник

Применение роя агентов в криптовалютном телеграм боте

Все ли волки страшные: AUF или как приручить uplift?

За гранью A-B: Синтетический контроль

Почему не А/B-тестирование?

Задача про n-ое число Фибоначчи

Logit Lens & ViT model: туториал

Logit Lens: о методе

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «data science»

Кто я и зачем мне это было нужно

Постановка задачи

Почему не А/B-тестирование?

Logit Lens: о методе

Новости

Актуальные темы

Архив