Рубрика «data science» - 11

Сертификация по программе IBM Data Science Professional Certificate

2020-02-07 в 8:17, admin, рубрики: analysis data, classification, data science, data visualization, foursquare, location data, machine learning, ml, pandas, python, scikit-learn, визуализация данных, машинное обучение

Статья является кратким обзором о сертификации по программе IBM Data Science Professional Certificate.

Будучи новичком в Python, мне пришлось столкнуться с реализацией задач:

Загрузка и парсинг HTML таблиц
Очистка загруженных данных
Поиск географических координат по адресу объекта
Загрузка и обработка GEOJSON
Построение интерактивных тепловых карт (heat map)
Построение интерактивных фоновых картограмм (choropleth map)
Преобразование географических координат между сферической WGS84 и картезианский системой координат UTM
Представление пространственных географических объектов в виде гексагональная сетки окружностей
Поиск географических объектов, расположенных на определенном расстоянии от точки
Привязка географических объектов к полигонам сложной формы на поверхности
Описательные статистический анализ
Анализ категорийных переменных и визуализация результатов
Корреляционный анализ и визуализация результатов
Сегментация с использованием k-Mean кластеризации и elbow метода
Анализ и визуализация кластеров

Читать полностью »

Туториал по Uplift моделированию. Часть 2

2020-02-04 в 12:23, admin, рубрики: causal effect, causal Inference, causal tree, causality, causalml, data mining, data science, net lift, uplift, аплифт, Блог компании МТС, искусственный интеллект, математика, машинное обучение

В первой части мы познакомились с uplift моделированием и узнали, что метод позволяет выбирать оптимальную стратегию коммуникации с клиентом, а также разобрали особенности сбора данных для обучения модели и несколько базовых алгоритмов. Однако эти подходы не позволяли оптимизировать uplift напрямую. Поэтому в этой части разберем более сложные, но не менее интересные подходы.
Читать полностью »

Новости машинного обучения. Выпуск 8

2020-02-03 в 8:53, admin, рубрики: artificial neural network, data science, deep learning, machine learning, бионический протез, будущее здесь, визуализация данных, глубокое обучение, идеи для бизнеса, искусственная нейронная сеть, искусственный интеллект, машинное обучение, Научно-популярное, нейросеть, новости науки и техники, обработка изображений, робототехника, экзоскелет

Предыдущий выпуск

Экзоскелеты; бионические протезы; промышленные роботы; исследование автоматических рекоммендаций Ютуба; создание моделей машинного обучения в браузере с помощью MediaPipe; виртуальная клавиатура для смартфонов; 5G; еще раз о сильном и слабом ИИ.

Читать полностью »

Туториал по uplift моделированию. Часть 1

2020-01-30 в 13:15, admin, рубрики: causal effect, causal Inference, causality, causalml, data mining, data science, net lift, true lift, uplift, uplift modelling, аплифт, Блог компании МТС, интернет-маркетинг, маркетинг, машинное обучение, Повышение конверсии, реклама

Команда Big Data МТС активно извлекает знания из имеющихся данных и решает большое количество задач для бизнеса. Один из типов задач машинного обучения, с которыми мы сталкиваемся – это задачи моделирования uplift. С помощью этого подхода оценивается эффект от коммуникации с клиентами и выбирается группа, которая наиболее подвержена влиянию.

Такой класс задач прост в реализации, но не получил большого распространения в литературе про машинное обучение. Небольшой цикл статей, подготовленный Ириной Елисовой (iraelisova) и Максимом Шевченко (maks-sh), можно рассматривать как руководство к решению таких задач. В рамках него мы познакомимся с uplift моделями, рассмотрим, чем они отличаются от других подходов, и разберем их реализации.
Читать полностью »

OpenCV Hackathon is coming

2020-01-29 в 13:28, admin, рубрики: c++, data science, image processing, open source, opencv, python

Этим летом библиотека OpenCV отмечает свой двадцатый юбилей. OpenCV — самая большая библиотека компьютерного зрения в мире. Она используется чуть ли не в каждом мобильном телефоне, планшете и камере, не говоря уже о настольных системах и серверах. SourceForge рапортует о 20 миллионах скачиваний релизных версий библиотеки, и это число продолжает расти.
Читать полностью »

Рубрика «Читаем статьи за вас». Октябрь — Декабрь 2019

2020-01-29 в 11:00, admin, рубрики: arxiv.org, data science, machine learning, ods, open data science, science, Алгоритмы, Блог компании Open Data Science, математика, машинное обучение, обработка изображений

Рубрика «Читаем статьи за вас». Октябрь — Декабрь 2019 - 1

Привет! Продолжаем публиковать рецензии на научные статьи от членов сообщества Open Data Science из канала #article_essense. Хотите получать их раньше всех — вступайте в сообщество!

Статьи на сегодня:

Poly-encoders: Transformer Architectures and Pre-training Strategies for Fast and Accurate Multi-sentence Scoring (Facebook, 2019)
Implicit Discriminator in Variational Autoencoder (Indian Institute of Technology Ropar, 2019)
Self-training with Noisy Student improves ImageNet classification (Google Research, Carnegie Mellon University, 2019)
Momentum Contrast for Unsupervised Visual Representation Learning (Facebook, 2019)
Benchmarking Neural Network Robustness to Common Corruptions and Perturbations (University of California, Oregon State University, 2019)
DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter (Hugging Face, 2019)
Plug and Play Language Models: A Simple Approach To Controlled Text Generation (Uber AI, Caltech, HKUST, 2019)
Deep Salience Representation for F0 Estimation in Polyphonic Music ( New York University, USA, 2017)
Analyzing and Improving the Image Quality of StyleGAN (NVIDIA, 2019)

Читать полностью »

Новости машинного обучения. Выпуск 7

2020-01-17 в 11:25, admin, рубрики: data science, deep learning, machine learning, будущее здесь, визуализация данных, глубокое обучение, идеи для бизнеса, искусственный интеллект, машинное обучение, Научно-популярное, нейросеть, обработка изображений

Предыдущий выпуск

Новости ML, новые технологии, идеи по применению и гипотезы.

Nvidia GauGan

Изображение сделано в Nvidia GauGan. Видео, статья и исходный код.

Читать полностью »

Скандал на конкурсе Kaggle: победитель сжульничал, алгоритм плохо оценивает шанс бездомных животных найти хозяев

2020-01-16 в 16:55, admin, рубрики: big data, data science, kaggle, kaggle competition, Алгоритмы, конкурс kaggle, машинное обучение, Программирование, Спортивное программирование, финансы в IT

Скандал на конкурсе Kaggle: победитель сжульничал, алгоритм плохо оценивает шанс бездомных животных найти хозяев - 1

Kaggle — система организации конкурсов по исследованию данных, принадлежащая компании Google — обнаружила мошенничество в результатах одного из своих конкурсов. Победителя конкурса отстранили от участия в дальнейших соревнованиях.

Kaggle регулярно организует конкурсы в сфере обработки данных и машинного обучения. Призы на этих конкурсах могут достигать десятков тысяч долларов. На прошлой неделе компания объявила, что команда-победитель конкурса, который состоялся в прошлом году и был посвящён улучшению работы сайта по поиску хозяев для бездомных животных, выиграла обманом. Читать полностью »

Знакомимся с методом обратного распространения ошибки

2020-01-10 в 12:46, admin, рубрики: algorithms, artificial intelligence, big data, data science, deep learning, mathematics, Алгоритмы, Блог компании OTUS. Онлайн-образование, математика

Всем привет! Новогодние праздники подошли к концу, а это значит, что мы вновь готовы делиться с вами полезным материалом. Перевод данной статьи подготовлен в преддверии запуска нового потока по курсу «Алгоритмы для разработчиков».

Поехали!

Метод обратного распространения ошибки – вероятно самая фундаментальная составляющая нейронной сети. Впервые он был описан в 1960-е и почти 30 лет спустя его популяризировали Румельхарт, Хинтон и Уильямс в статье под названием «Learning representations by back-propagating errors».Читать полностью »

Письмо начинающему изучать Data Science

2020-01-01 в 20:10, admin, рубрики: Anaconda Python, data science, deep learning, machine learning, python, глубокое обучение, искусственные нейронные сети, искусственный интеллект, машинное обучение, нейросети, обработка изображений, Программирование, распознавание изображений

Я бы хотел получить такое письмо три года назад, когда только начинал изучать Data Science (DS). Чтобы там были необходимые ссылки на полезные материалы. Статья не претендует на полноту охвата необъятной области DS. Однако для начинающего специалиста будет полезна.

Нейронные сети – это...

Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «data science» - 11

Сертификация по программе IBM Data Science Professional Certificate

Туториал по Uplift моделированию. Часть 2

Новости машинного обучения. Выпуск 8

Туториал по uplift моделированию. Часть 1

OpenCV Hackathon is coming

Рубрика «Читаем статьи за вас». Октябрь — Декабрь 2019

Новости машинного обучения. Выпуск 7

Скандал на конкурсе Kaggle: победитель сжульничал, алгоритм плохо оценивает шанс бездомных животных найти хозяев

Знакомимся с методом обратного распространения ошибки

Письмо начинающему изучать Data Science

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «data science» - 11

Новости

Актуальные темы

Архив