- Mall Customers Dataset — данные посетителей магазина: id, пол, возраст, доход, рейтинг трат. (Вариант применения: Customer Segmentation Project with Machine Learning)
- Iris Dataset — датасет для новичков, содержащий размеры чашелистиков и лепестков для различных цветков.
- MNIST Dataset — датасет рукописных цифр. 60 000 тренировочных изображений и 10 000 тестовых изображений.
- The Boston Housing DatasetЧитать полностью »
Рубрика «python» - 82
52 датасета для тренировочных проектов
2019-12-16 в 13:18, admin, рубрики: data science, dataset, deep learning, edisonsoftware, machine learning, python, Блог компании Edison, машинное обучение, Программирование, Учебный процесс в ITИнстанцирование в Python
2019-12-16 в 8:29, admin, рубрики: python, инстанцирование, Программирование, экземпляр классаДопустим, у вас есть класс Foo :
class Foo(object):
def __init__(self, x, y=0):
self.x = x
self.y = y
Что происходит, когда вы создаёте его объект?
f = Foo(1, y=2)
Какой метод вызывается первым при этом вызове Foo? Большинство новичков, да и, возможно, немало опытных питонистов тут же ответят: «метод __init__». Но если внимательно приглядеться к сниппетам выше, вскоре станет понятно, что такой ответ неверен.
__init__ не возвращает никакого результата, а Foo(1, y=2), напротив, возвращает экземпляр класса. К тому же __init__ принимает self в качестве первого параметра, чего не происходит при вызове Foo(1, y=2). Создание экземпляра происходит немного сложнее, о чём мы и поговорим в этой статье.
14 open-source проектов для прокачки Data Science мастерства (easy, normal, hard)
2019-12-15 в 18:39, admin, рубрики: data science, deep learning, edisonsoftware, open source, python, Блог компании Edison, машинное обучение, Программирование, Учебный процесс в ITData Science для начинающих
1. Sentiment Analysis (Анализ настроений через текст)
Посмотрите полную реализацию проекта Data Science с использованием исходного кода — Sentiment Analysis Project в R.
Sentiment Analysis — это анализ слов для определения настроений и мнений, которые могут быть положительными или отрицательными. Это тип классификации, при котором классы могут быть двоичными (положительными и отрицательными) или множественными (счастливыми, злыми, грустными, противными ...). Мы реализуем этот Data Science проект на языке R и будем использовать набор данных в пакете «janeaustenR». Мы будем использовать словари общего назначения, такие как AFINN, bing и loughran, выполнять внутреннее соединение, и в конце мы создадим облако слов, чтобы отобразить результат.
Язык: R
Набор данных/Пакет: janeaustenR
Читать полностью »
Создаем структуру простого мультиплатформенного бота
2019-12-15 в 15:11, admin, рубрики: api, bot, Facebook, Leader-ID, python, telegram, telegram bots, Блог компании Leader-ID, Системы обмена сообщениями, Управление сообществомРегистрация пользователей на мероприятия, автоматический поиск ответов в базе, общение с техподдержкой, обмен контактами — все это часть функций нашего бота Leader-ID. Он «живет» на трёх платформах: VK, Facebook Messenger и Telegram, при этом логика его работы пишется один раз на всех с использованием платформонезависимых абстракций. Такой подход позволяет быстро добавлять новые функции и шлифовать старые.
Структура системы делает единым процесс разработки функций под разные платформы и на порядок упрощает процессы в сравнении с вариантом их ручного переписывания в каждом платформозависимом API. При этом, чтобы завести бота на новой платформе, достаточно лишь написать соответствующий адаптер (коннектор).
Про эту структуру и хотелось кратко рассказать. Возможно, это окажется полезным тем, кто хочет написать своего кроссплатформенного бота, но еще не погружался глубоко в тему и пока изучает чужой опыт.
Читать полностью »
Дайджест интересных материалов для мобильного разработчика #326 (9 — 15 декабря)
2019-12-15 в 13:59, admin, рубрики: aso, python, UI, Блог компании Цифровые Экосистемы, маркетинг приложений, разработка мобильных приложений, Разработка под android, разработка под iOSВ новом выпуске — разработка приложений на Python, новая AppCode, CI/CD для игр, новый код мобильной продуктивности от Microsoft, приоритеты дизайна, тенденции UX, маркетинга и ASO.
Хабрарейтинг 2019: статистика и рейтинг авторов за 2019 год
2019-12-15 в 13:45, admin, рубрики: pandas, python, веб-аналитика, визуализация данных, Программирование, Социальные сети и сообщества, статистика, Статистика в IT, хабрВ первой части была рассмотрена некоторая статистика и опубликован рейтинг статей этого сайта. Во второй части будут рассмотрены другие статистические закономерности этого года, которые мне показались интересными, а также будет опубликован рейтинг авторов за этот, 2019 год.
Первая часть рассчитана на читателей сайта, эта будет более интересна авторам, но и остальные надеюсь, найдут что-нибудь полезное — статьи авторов, попавших в рейтинг, определенно имеет смысл прочитать.
Продолжение под катом.
Читать полностью »
Хабрарейтинг 2019: статистика и рейтинг лучших статей за 2019 год
2019-12-15 в 13:43, admin, рубрики: matplotlib, pandas, python, веб-аналитика, визуализация данных, Программирование, Социальные сети и сообщества, статистика, Статистика в ITЗаканчивается 2019 год, и пора подвести итоги и собрать статистику и рейтинг наиболее интересных статей Хабра за этот период. Предыдущий рейтинг можно прочитать здесь, надеюсь новый будет еще более интересным.
Парсинг и обработка данных были за этот год улучшены (кстати, изображение на КДПВ сгенерировано на базе заголовков статей), так что надеюсь, результаты будут более интересными. Также я добавил две новые категории в рейтинге — теперь отдельно будут рассматриваться хабы «ИТ-эмиграция» и «Здоровье», думаю, для многих и то и то может быть актуально.
Продолжение и результаты под катом.
Читать полностью »
Простой классификатор P300 на открытых данных
2019-12-14 в 16:57, admin, рубрики: BCI, EEG, Impulse Neiry, machine learning, Neiry, neuroscience, P300, python, машинное обучение, мозг, нейрофизиология, открытые данные, ээгМой коллега Рафаэль Григорян eegdude недавно написал статью о том, зачем человечеству потребовалась ЭЭГ и какие значимые явления могут быть зарегистрированы в ней. Сегодня в продолжение темы нейроинтерфейсов мы используем один из открытых датасетов, записанных на игре, использующей механику P300, чтобы визуализировать сигнал ЭЭГ, посмотреть структуру вызванных потеницалов, построить основные классификаторы, оценить качество, с которым мы можем предсказать наличие такого вызыванного потенциала.
Напомню, что P300 — это вызванный потенциал (ВП), специфический отклик мозга связанный с принятием решений и и различением стимулов (что он из себя представляет мы увидим ниже). Обычно он используется для построения современных BCI.
Для того, чтобы заняться классификацией ЭЭГ, можно позвать друзей, написать игру про Енотов и Демонов в VR, записать собственные реакции и написать научную статью (об этом я расскажу как-нибудь в другой раз), но по счастью, учёные со всего мира уже провели некоторые эксперименты за нас и осталось только скачать данные.
Разбор способа построения нейроинтерфейса на P300 с пошаговым кодом и визуализациями, а также ссылку на репозиторий можно найти под катом.
Три метода Pandas, о которых вы, возможно, не знали
2019-12-13 в 9:30, admin, рубрики: pandas, python, Блог компании RUVDS.com, Программирование, разработка, Разработка веб-сайтовАвтор статьи, перевод которой мы сегодня публикуем, говорит, что когда он узнал о тех методах библиотеки Pandas, о которых хочет тут рассказать, он почувствовал себя совершенно некомпетентным программистом. Почему? Дело в том, что ему, когда он до этого писал код, лень было заглянуть в поисковик и узнать, существуют ли некие эффективные способы решения некоторых задач. Как результат, он даже и не знал о существовании целого ряда весьма полезных методов Pandas. Он, не пользуясь этими методами, всё же смог реализовать необходимую логику, но это потребовало от него нескольких часов работы, это заставило его понервничать. И, конечно, он по ходу дела написал кучу ненужного кода. Эту статью он подготовил для тех, кто не хотел бы оказаться в его ситуации.
Разработка мобильных приложений на Python. Библиотека KivyMD
2019-12-12 в 18:52, admin, рубрики: kivy kivymd python3, python, разработка мобильных приложенийПриветствую! Сегодня речь снова пойдет о библиотеке KivyMD — наборе виджетов для кроссплатформенной разработки на Python в стиле Material Design. В этой статье я сделаю не обзор виджетов KivyMD, как в недавней статье, а, скорее, это будет материал больше о позиционировании виджетов. Что-то похожего на туториал по разработке мобильных приложений на Python для новичков здесь не будет, так что если впервые слышите о фреймворке Kivy, вряд ли вам будет все это интересно. Ну, а мы погнали под кат!Читать полностью »