Рубрика «kaggle»

Анализ EEG-датасетов с Kaggle: от сигнала до ML-модели

2025-10-30 в 19:06, admin, рубрики: data science, EEG, kaggle, python

Электроэнцефалография (ЭЭГ) — это неинвазивный метод регистрации электрической активности мозга через электроды на поверхности головы. За последние годы ЭЭГ-данные перестали быть исключительно медицинской прерогативой и прочно вошли в мир data science. Сегодня их используют в нейромаркетинге для оценки реакций на рекламу, в когнитивных исследованиях для измерения внимания и памяти, в разработке Brain-Computer Interface (BCI) и даже в спортивной аналитике.

Популярность ЭЭГ объясняется несколькими факторами:

Доступность: относительно недорогие портативные устройства (Emotiv, Muse, OpenBCI)
БезопасностьЧитать полностью »

Полезные задачи на Kaggle ( LLM, Diffusion Models)

2025-09-16 в 15:01, admin, рубрики: AI, deep learning, diffusion models, kaggle, llm, machine learning

В мире Data Science и Data Engineering ценится не только теория, но и практический опыт: умение работать с реальными данными, строить модели и доводить решения до результата. Однако получить такой опыт непросто: рабочие проекты часто закрыты NDA, а учебные кейсы не отражают сложность реальных задач.

Именно поэтому платформа Kaggle заняла особое место в индустрии. Это крупнейшее мировое сообщество специалистов по данным:

🌍 более 13 миллионов участников из разных стран;
🏆 сотни активных соревнований ежегодно;
📊 миллионы доступных датасетов и готовых ноутбуков.

Читать полностью »

Автомобили в кино. Kaggle-датасет на 1,75 миллиона строк

2025-09-14 в 13:17, admin, рубрики: data, dataset, kaggle, визуализация данных, парсинг

На imcdb.org энтузиасты уже два десятка лет отмечают автомобили в фильмах: кадры, марки, модели. Верифицируют находки на форуме, спорят о деталях. В итоге появилась крупнейшая база “машин-актёров” в кино: 1,75 млн страниц с кадрами и описаниями транспорта из фильмов разных стран. Я собрал всё это в один датасет.

Читать полностью »

Titanic + CatBoost (Первое решение, первый Jupyter Notebook)

2025-08-08 в 19:36, admin, рубрики: catboost, juniorml, kaggle, machinelearning, ml, scikitlearn, titanic, машинноеобучение, соревнование

#Импортируем все необходимые библиотеки

import pandas as pd
from catboost import CatBoostClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import json

# 🔕 Отключаем предупреждения, чтобы не загромождали вывод


import warnings
warnings.filterwarnings('ignore')

Читать полностью »

Прогнозируем движение беспилотного автомобиля (или как я вышел в тройку лидеров на Yandex Cup 2024)

2025-01-31 в 11:42, admin, рубрики: data science, kaggle, LightGBM, machine learning, python, yandex cup 2024, беспилотные автомобили, чемпионат по программированию

*фотографии чемпионата взяты из телеграм-канала чемпионата

Меня зовут Николай Назаров, я работаю аналитиком данных в X5 Tech. Недавно завершился чемпионат по программированию Yandex Cup ML Challenge 2024 Читать полностью »

Как делать бизнес в Open Source

2024-09-04 в 8:57, admin, рубрики: data science, Evidently AI, kaggle, open source, гиперпараметры, интервью, композиции моделей, машинное обучение, технологический стек

Эмели Драль — кофаундер и технический директор Evidently AI. У её open source библиотеки для оценки, тестирования и мониторинга качества данных и моделей машинного обучения уже более 22 миллионов скачиваний.

26 сентября Эмели выступит на AI Conf 2024 с докладом «Читать полностью »

В IT в 30. Как я стал solo Kaggle Grandmaster, устроился на работу, но так и не стал программистом

2022-08-15 в 8:45, admin, рубрики: Gamedev, kaggle, ml, войти в IT, Карьера в IT-индустрии, машинное обучение, разработка игр

Читать полностью »

Дата-сайентист, который просто не может перестать выигрывать на Kaggle

2021-01-24 в 11:57, admin, рубрики: data science, kaggle, machine learning, skillfactory, Блог компании SkillFactory, интервью, машинное обучение, Программирование, соревнования, Хакатоны

Ранее у нас в блоге уже был материал про лучших в Kaggle, а сегодня представляю вам интервью с признанным дата-сайентистом и гроссмейстером Kaggle Филиппом Сингером, который поделится своим опытом, вдохновением и и достижениями. Беседа призвана мотивировать и воодушевить других людей, которые хотят понять, что нужно, чтобы стать гроссмейстером Kaggle. Также в этом интервью мы узнаем больше об академическом прошлом Филиппа, его увлечении Kaggle и о его работе в качестве дата-сайентиста.

Дата-сайентист, который просто не может перестать выигрывать на Kaggle - 1

Читать полностью »

Магия Ensemble Learning

2020-10-17 в 9:49, admin, рубрики: big data, data engineering, data science, Ensemble Learning, kaggle, machine learning, Portfolio Diversification, Блог компании OTUS. Онлайн-образование

Привет! Приглашаем Data Engineer'ов и специалистов по Machine Learning на бесплатный Demo-урок «Вывод ML моделей в промышленную среду на примере онлайн-рекомендаций». А также мы публикуем статью Luca Monno — Head of Financial Analytics at CDP SpA.

Одним из наиболее полезных и простых методов машинного обучения является Ensemble Learning. Ensemble Learning – это метод, лежащий в основе XGBoost, Бэггинга, Случайного Леса и многих других алгоритмов.

На Towards Data Science есть много классных статей, но я выбрал две истории (первая и Читать полностью »

Почему меня разочаровали результаты Kaggle ARC Challenge

2020-06-23 в 10:28, admin, рубрики: AGI, ARC, big data, data science, kaggle, Алгоритмы, Блог компании Сбербанк, искусственный интеллект, машинное обучение, нейронные сети

Кто-то с ужасом, а кто-то с нетерпением ждет ИИ как в произведениях фантастов. С личностью, эмоциями, энциклопедическими знаниями и главное – с интеллектом, то есть способностями к логическим выводам, оперированию абстрактными понятиями, выделению закономерностей в окружающем мире и превращению их в правила. Как мы знаем, именно такой ИИ теоретики называют «сильным» или ещё AGI. Пока это далеко не мейнстримное направление в машинном обучении, но руководители многих больших компаний уже считают, что сложность их бизнеса превысила когнитивные способности менеджеров и без «настоящего ИИ» двигаться вперёд станет невозможно. Идут дискуссии, что же это такое, каким он должен быть, как сделать тест чтобы уж точно понять, что перед нами AGI, а не очередной blackbox, который лучше человека решает локальную задачу – например, распознавание лица на фотографии.

Три недели назад на каггле прошло первое в истории платформы соревнование по «сильному» ИИ – Abstraction and Reasoning Challenge. Чтобы проверить способность моделей к обобщению и решению абстрактных задач, все участники суммарно решили только чуть менее половины задач. Решение-победитель справляется приблизительно с 20% из них — и то девятичасовым перебором вручную захардкоженных правил (ограничение в девять часов установили организаторы).

В посте я хочу напомнить о сложностях работы с AGI, рассказать о самых интересных идеях участников, топовых решениях и поделиться мнением, что не так с текущими попытками создать AGI.
Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «kaggle»

Анализ EEG-датасетов с Kaggle: от сигнала до ML-модели

Полезные задачи на Kaggle ( LLM, Diffusion Models)

Автомобили в кино. Kaggle-датасет на 1,75 миллиона строк

Titanic + CatBoost (Первое решение, первый Jupyter Notebook)

Прогнозируем движение беспилотного автомобиля (или как я вышел в тройку лидеров на Yandex Cup 2024)

Как делать бизнес в Open Source

В IT в 30. Как я стал solo Kaggle Grandmaster, устроился на работу, но так и не стал программистом

Дата-сайентист, который просто не может перестать выигрывать на Kaggle

Магия Ensemble Learning

Почему меня разочаровали результаты Kaggle ARC Challenge