Рубрика «машинное обучение» - 130

How linear algebra is applied in machine learning

2018-10-21 в 8:12, admin, рубрики: data analysis, data science, english, linear algebra, machine learning, maths, математика, машинное обучение

When you study an abstract subject like linear algebra, you may wonder: why do you need all these vectors and matrices? How are you going to apply all this inversions, transpositions, eigenvector and eigenvalues for practical purposes?

Well, if you study linear algebra with the purpose of doing machine learning, this is the answer for you.

In brief, you can use linear algebra for machine learning on 3 different levels:

application of a model to data;
training the model;
understanding how it works or why it does not work.

drawing Читать полностью »

Как мы научили нейросеть определять документы

2018-10-19 в 14:48, admin, рубрики: big data, machine learning, Алгоритмы, Блог компании ВКонтакте, Вконтакте, детекторы лиц, машинное обучение, нейросети, распознавание документов, распознавание изображений

Как мы научили нейросеть определять документы - 1

Этим летом мы научили нейронную сеть определять, присутствует ли на изображении документ, и если да — то какой именно.

Для чего это понадобилось

Чтобы разгрузить сотрудников и обезопасить людей от мошенников. Мы применяем новую нейросеть в двух сферах: когда пользователь восстанавливает доступ к странице и для скрытия личных документов из общего поиска.

Читать полностью »

Как правильно «фармить» Kaggle

2018-10-18 в 11:00, admin, рубрики: data mining, data science, kaggle, ods, open data science, python, Блог компании Open Data Science, кэгл, математика, машинное обучение

*фарм — (от англ. farming) — долгое и занудное повторение определенных игровых действий с определенной целью (получение опыта, добыча ресурсов и др.).

Введение

Недавно (1 октября) стартовала новая сессия прекрасного курса по DS/ML (очень рекомендую в качестве начального курса всем, кто хочет, как это теперь называется, "войти" в DS). И, как обычно, после окончания любого курса у выпускников возникает вопрос — а где теперь получить практический опыт, чтобы закрепить пока еще сырые теоретические знания. Если вы зададите этот вопрос на любом профильном форуме — ответ, скорее всего, будет один — иди решай Kaggle. Kaggle — это да, но с чего начать и как наиболее эффективно использовать эту платформу для прокачки практических навыков? В данной статье автор постарается на своем опыте дать ответы на эти вопросы, а также описать расположение основных грабель на поле соревновательного DS, чтобы ускорить процесс прокачки и получать от этого фан.

Читать полностью »

Как участвовать в соревнованиях по машинному обучению. Лекция в Яндексе

2018-10-18 в 10:34, admin, рубрики: kaggle, Блог компании Яндекс, истории успеха, конкурсы разработчиков, машинное обучение, Спортивное программирование

Многие из постоянных посетителей ML-тренировок придерживаются обоснованного мнения, что участие в конкурсах — самый быстрый способ попасть в профессию. У нас даже была статья на эту тему. Автор сегодняшней лекции Артур Кузин на собственном примере показал, как можно за пару лет переквалифицироваться из сферы, вообще не связанной с программированием, в специалиста по анализу данных.

— Всем привет. Меня зовут Артур Кузин, я lead data scientist компании Dbrain.Читать полностью »

Делаем проект по машинному обучению на Python. Часть 3

2018-10-18 в 7:48, admin, рубрики: алгоритм, Алгоритмы, Блог компании NIX Solutions, машинное обучение

Делаем проект по машинному обучению на Python. Часть 3 - 1

Перевод A Complete Machine Learning Walk-Through in Python: Part Three

Многим не нравится, что модели машинного обучения представляют собой чёрные ящики: мы кладём в них данные и безо всяких объяснений получаем ответы — часто очень точные ответы. В этой статье мы постараемся разобраться, как созданная нами модель делает прогнозы и что она может рассказать о решаемой нами задаче. И завершим мы обсуждением самой важной части проекта по машинному обучению: задокументируем сделанное и представим результаты.

В первой части мы рассмотрели очистку данных, разведочный анализ, конструирование и выбор признаков. Во второй части изучили заполнение отсутствующих данных, реализацию и сравнение моделей машинного обучения, гиперпараметрическую настройку с помощью случайного поиска с перекрёстной проверкой и, наконец, оценку получившейся модели.
Читать полностью »

Нейронная сеть с использованием TensorFlow: классификация изображений

2018-10-17 в 16:09, admin, рубрики: python, TensorFlow, машинное обучение, нейронная сеть, перевод

Привет! Представляю вашему вниманию перевод статьи «Train your first neural network: basic classification».

Это руководство по обучению модели нейронной сети для классификации изображений одежды, таких как кроссовки и рубашки. Для создания нейронной сети используем python и библиотеку TensorFlow.
Читать полностью »

Neurotic Bikes: генезис

2018-10-17 в 14:13, admin, рубрики: AI, reinforcement learning, искусственный интеллект, машинное обучение

На днях Youtube посчитал, что мне покажется интересным видео с названием «AI Learns to play Hill Climb Racing». Забавно, ведь за пару минут до этого я закоммитил очередные изменения в проект, где мы с коллегами в перерывах между работой и работой решаем именно эту задачу. Никакого «AI» в том видео, правда, не обнаружилось – автор поразвлекал публику баловством с Box2D и на том успокоился. Тем не менее, предлагаю считать этот факт убедительным доказательством актуальности темы и разобрать устройство нашей погремушки.

Коротко о задаче: транспортное средство – в нашем случае это то ли Чужой, то ли швейная машинка «Зингеръ» на колесах, назовем его просто «агент» – должно проехать по наперлинным одноименным шумом барханам от старта до финиша. Вот так выглядит агент в своей песочнице:

Neurotic Bikes: генезис - 1
Агент, коснувшийся спиной трека или не демонстрирующий должного рвения в продвижении к цели, снимается с трассы.
Читать полностью »

Хакатон по Data Science в СИБУРе: как это было

2018-10-17 в 9:40, admin, рубрики: data mining, data science, machine learning, predictive maintenance, Блог компании Цифровой СИБУР, машинное обучение, производство, прототипирование, Сибур, хакатон, Хакатоны

Привет!

С начала года мы провели больше 10 хакатонов и воркшопов по всей стране. В мае мы вместе с AI-community организовывали хакатон по направлению «Цифровизация производства». До нас хакатон про data science на производстве ещё не делали, и сегодня мы решили подробно рассказать о том, как это было.

Цель была проста. Нужно было оцифровать наш бизнес на всех его этапах (от поставок сырья до производства и прямых продаж). Само собой, должны были решаться и задачи прикладного характера, например:

устранение простоев оборудования, технологических нарушений и сбоев;
повышение производительности и вместе с этим — качества продукции;
снижение затрат на логистику и закупки;
ускорение запуска и вывода на рынок новых продуктов.

В чём главная ценность таких задач? Правильно, в максимальном приближении к настоящим бизнес-кейсам, а не к абстрактным проектам. Первая задача уже подробно описана на Хабре одним из участников (спасибо, cointegrated Давид!). А второй задачей, вынесенной на хакатон, стала необходимость оптимизировать процесс совмещения плановых ремонтов ж/д-вагонов логистического парка. Это взяли прямо из нашего текущего бэклога, немного адаптировав для участников, дабы сделать её понятнее.

Итак, описание задачи.
Читать полностью »

Закон Тьюринга: штат Калифорния запретил чат-ботам притворяться людьми

2018-10-17 в 9:28, admin, рубрики: Блог компании Нейросети Ашманова, боты, законодательство, искусственный интеллект, машинное обучение, робототехника, тест тьюринга, Чат-боты

Кибернетики в течение 60 лет не могли полноценно осмыслить тему сходства людей и роботов. Они даже придумали надуманный и переусложнённый Критерий Тьюринга: «можно считать, что создан настоящий ИИ, если нельзя отличить чат-бота от человека в сетевом общении».

Им просто не хватало настоящего позитивного юридического мышления. Зачем ломать голову, похож ли робот на человека, как проверить, похож ли, что делать, если похож.

Нужно просто запретить ему притворяться человеком — и всё, одна из самых сложных проблем искусственного интеллекта решена элегантно и просто.

28 сентября в штате Калифорния был принят закон о запрете чат-ботов, побуждающих к покупке товаров и услуг, или продвигающих политические партии, если эти чат-боты не сообщают собеседникам, что не являются людьми.
Читать полностью »

Самые востребованные навыки в сфере data science

2018-10-16 в 8:58, admin, рубрики: data science, Блог компании Everyday Tools, глубокое обучение, карьера, Карьера в IT-индустрии, машинное обучение, поиск работы, работа с данными, Учебный процесс в IT

В плане знаний от специалистов по data science ждут многого: машинное обучение, программирование, статистика, математика, визуализация данных, коммуникация и глубокое обучение. Каждая из этих областей охватывает десятки языков, фреймворков, технологий, доступных для изучения. Так как же специалистам по работе с данными лучше распорядиться своим бюджетом времени на обучение, чтобы быть в цене у работодателей?

Я тщательно изучил сайты с вакансиями, чтобы выяснить, какие же навыки сейчас пользуются наибольшей популярностью у работодателей. Я рассматривал как более широкие дисциплины, связанные с работой с данными, так и конкретные языки и инструменты, в рамках отдельного исследования. За материалами я обратился к сайтам LinkedIn, Indeed, SimplyHired, Monster и AngelList, по состоянию на 10 октября 2018 года. На графике ниже показано, сколько вакансий по data science представлено на каждом из этих ресурсов.

Самые востребованные навыки в сфере data science - 1

Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «машинное обучение» - 130

How linear algebra is applied in machine learning

Как мы научили нейросеть определять документы

Для чего это понадобилось

Как правильно «фармить» Kaggle

Введение

Как участвовать в соревнованиях по машинному обучению. Лекция в Яндексе

Делаем проект по машинному обучению на Python. Часть 3

Нейронная сеть с использованием TensorFlow: классификация изображений

Neurotic Bikes: генезис

Хакатон по Data Science в СИБУРе: как это было

Закон Тьюринга: штат Калифорния запретил чат-ботам притворяться людьми

Самые востребованные навыки в сфере data science

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «машинное обучение» - 130

Для чего это понадобилось

Введение

Новости

Актуальные темы

Архив