Рубрика «машинное обучение» - 141

Почему хватит считать нейронные сети черным ящиком?

2018-08-16 в 11:07, admin, рубрики: keras, lime, python, visualisation, виртуализация, искусственный интеллект, Компьютерное зрение, машинное обучение, распознавание изображений

Если вы достаточно долго увлекаетесь нейросетевыми технологиями, то наверняка встречались с мнением, кратко заключенным в риторическом вопросе: «Как ты объяснишь человеку, когда нейросеть считает, что у него рак?». И если в лучшем случае такие мысли заставят тебя сомневаться в использовании нейросетей в достаточно ответственных сферах, то в худшем случае ты можешь и потерять весь свой интерес.

Читать полностью »

GeekUniversity открывает набор на факультет искусственного интеллекта

2018-08-15 в 13:32, admin, рубрики: data scientist, geekbrains, geekuniversity, mail.ru group, Блог компании Mail.Ru Group, искусственный интеллект, Карьера в IT-индустрии, машинное обучение

GeekUniversity открывает набор на факультет искусственного интеллекта - 1

В нашем онлайн-университете для программистов открылся новый факультет искусственного интеллекта. Cтуденты всего за полтора года смогут пройти путь от новичка до программиста-исследователя (data scientist) уровня middle. GeekUniversity — совместный образовательный проект Mail.Ru Group и GeekBrains с гарантированным трудоустройством.
Читать полностью »

В чём мерить будем? Как выбрать правильные ML-метрики под задачи бизнеса

2018-08-15 в 8:05, admin, рубрики: Блог компании Инфосистемы Джет, машинное обучение, метрики, оценка моделей

Сегодня одним из главных препятствий на пути внедрения машинного обучения в бизнес является несовместимость метрик ML и показателей, которыми оперирует топ-менеджмент. Аналитик прогнозирует увеличение прибыли? Но ведь нужно понять, в каких случаях причиной увеличения станет именно машинное обучение, а в каких — прочие факторы. Увы, но довольно часто улучшение метрик ML не приводит к росту прибыли. К тому же иногда сложность данных такова, что даже опытные разработчики могут выбрать некорректные метрики, на которые нельзя ориентироваться.

Давайте рассмотрим, какие бывают метрики ML и когда их целесообразно использовать. Разберём типичные ошибки, а также расскажем о том, какие варианты постановки задачи могут подойти для машинного обучения и бизнеса.
Читать полностью »

Из нагруженной MPP СУБД — бодрый Data Lake с аналитическими инструментами: делимся подробностями создания

2018-08-14 в 13:58, admin, рубрики: big data, data lake, Блог компании ВТБ, втб, машинное обучение, хранение данных, хранилища данных

Все организации, которые имеют хоть какое-то отношение к данным, рано или поздно сталкиваются с вопросом хранения реляционных и неструктурированных баз. Непросто найти одновременно удобный, эффективный и недорогой подход к этой проблеме. А еще сделать так, чтобы на данных смогли успешно работать дата-сайентисты с моделями машинного обучения. У нас получилось – и хотя пришлось повозиться, итоговый профит оказался даже больше ожидаемого. Обо всех подробностях расскажем ниже.

Из нагруженной MPP СУБД — бодрый Data Lake с аналитическими инструментами: делимся подробностями создания - 1
Читать полностью »

Многорукие бандиты в рекомендациях

2018-08-14 в 9:53, admin, рубрики: data mining, python, Алгоритмы, Блог компании Avito, машинное обучение, многорукие бандиты, рекомендательные системы

Всем привет! Меня зовут Миша Каменщиков, я занимаюсь Data Science и разработкой микросервисов в команде рекомендаций Авито. В этой статье я расскажу про наши рекомендации похожих объявлений и о том, как мы улучшаем их при помощи многоруких бандитов. С докладом на эту тему я выступал на конференции Highload++ Siberia и на мероприятии «Data & Science: Маркетинг».

Читать полностью »

Нейросети: реализация задачи про грибы на Tensor Flow и Python

2018-08-11 в 15:31, admin, рубрики: python, TensorFlow, ИИ и машинное обучение, искусственный интеллект, машинное обучение, нейронные сети

Tensor Flow — фреймворк для построения и работы с нейросетями от компании Google. Позволяет абстрагироваться от внутренних деталей машинного обучения и сосредоточиться непосредственно на решении своей задачи. Очень мощная вещь, позволяет создавать, обучать и использовать нейронные сети любого известного типа. Не нашел на Хабре ни одного толкового текста на эту тему, поэтому пишу свой. Ниже будет описана реализация решения задачи про грибы с помощью библиотеки Tensor Flow. Кстати, алгоритм, описанный ниже, подходит для предсказаний практически в любой области. Например, вероятности рака у человека в будущем или карт у соперника в покере.Читать полностью »

«Машинный звук»: синтезаторы на базе нейросетей

2018-08-11 в 11:02, admin, рубрики: Аудиомания, Блог компании Аудиомания, звук, машинное обучение, синтез звука

Разработчики из исследовательского проекта Magenta (подразделение Google) представили синтезатор с открытым исходным кодом NSynth Super. В его основе лежит система искусственного интеллекта, которая миксует несколько предварительно загруженных сэмплов (например, звучание гитары и пианино) в новый звук с уникальными характеристиками.

Подробнее о системе NSynth Super и других алгоритмах-композиторах расскажем далее.

Читать полностью »

Перевод книги Эндрю Ына «Страсть к машинному обучению» Главы 15 — 17

2018-08-11 в 9:10, admin, рубрики: машинное обучение, Эндрю Ын

15 Одновременная оценка нескольких идей во время анализа ошибок

У вашей команды есть несколько идей, как улучшить определитель кошек в вашем приложении:

Решить проблему с тем, что ваш алгоритм относит собак к кошкам
Решить проблему с тем, что ваш алгоритм распознает больших диких кошек (львов, пантер, т. п.) как домашних
Улучшить работу системы на нечетких изображениях
…

Можно оценить все эти идеи одновременно. Обычно я создаю специальную таблицу и заполняю ее для примерно 100 случаев ошибочной классификации валидационной (dev) выборки. Так же я делаю краткие комментарии, которые могут помочь мне вспомнить конкретные примеры в последствие. Для иллюстрации этого процесса, давайте рассмотрим сводную таблицу, которую вы могли бы создать из небольшого набора примеров вашей валидационной (dev) выборки

Читать полностью »

Обнаружение сарказма с помощью сверточных нейросетей

2018-08-10 в 14:21, admin, рубрики: neural networks, машинное обучение, перевод

Привет! Представляю вашему вниманию перевод статьи "Detecting Sarcasm with Deep Convolutional Neural Networks" автора Elvis Saravia.

Обнаружение сарказма с помощью сверточных нейросетей - 1

Одна из ключевых проблем обработки естественного языка — обнаружение сарказма. Обнаружение сарказма важно в других областях, таких как эмоциональные вычисления и анализ настроений, поскольку это может отражать полярность предложения.

В этой статье показано, как обнаружить сарказм и также приведена ссылка на нейросетевой детектор сарказма.
Читать полностью »

Я, РобоЛойер. Ищу аномалии в документах

2018-08-10 в 12:45, admin, рубрики: anomaly detection, doc2vec, machine learning, word2vec, Блог компании Digital Design, машинное обучение

Представляете ли вы, сколько нормативных документов в час приходится просматривать корпоративному юристу и к каким последствиям может привести его невнимательность? Бедолага юрист должен вчитываться в каждый договор, тем более, если для него нет типового шаблона, что случается часто.

Глядя в уставшие глаза нашего корпоративного юриста, мы решили создать сервис, который будет находить проблемы в документах и сигналить о них задремавшему юристу. В результате мы создали решение с агрегацией знаний по некоторой базе договоров и подсказками юристам, на что следует обратить особое внимание. Конечно, не обошлось без магии. Математической магии под названием Anomaly Detection.

В основном, подходы Anomaly Detection применяются для анализа поведения разнообразного оборудования для выявления отказов, или в банковском секторе для определения фрода. А мы попробовали применить эти алгоритмы для анализа юридических документов. Следуйте под кат, чтобы узнать, как мы это делали.

Я, РобоЛойер. Ищу аномалии в документах - 1

Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «машинное обучение» - 141

Почему хватит считать нейронные сети черным ящиком?

GeekUniversity открывает набор на факультет искусственного интеллекта

В чём мерить будем? Как выбрать правильные ML-метрики под задачи бизнеса

Из нагруженной MPP СУБД — бодрый Data Lake с аналитическими инструментами: делимся подробностями создания

Многорукие бандиты в рекомендациях

Нейросети: реализация задачи про грибы на Tensor Flow и Python

«Машинный звук»: синтезаторы на базе нейросетей

Перевод книги Эндрю Ына «Страсть к машинному обучению» Главы 15 — 17

15 Одновременная оценка нескольких идей во время анализа ошибок

Обнаружение сарказма с помощью сверточных нейросетей

Я, РобоЛойер. Ищу аномалии в документах

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «машинное обучение» - 141

15 Одновременная оценка нескольких идей во время анализа ошибок

Новости

Актуальные темы

Архив