Рубрика «машинное обучение» - 84

Алгоритм DeepPrivacy не позволяет нейросети деанонимизировать людей на фото и видео - 1

Исследователи из Норвежского технологического университета придумали, как использовать технологию DeepFake для сохранения анонимности людей на фото и видео с сохранением исходных данных изображения.

Сохранение собственной конфиденциальности стало важной проблемой. Пока ещё не было найдено подходящего решения для анонимизации человеческих лиц на изображениях без ухудшения качества самого фото. Как правило, для сохранения анонимности лица обычно размывают или закрывают пикселями или чёрным квадратом. Однако это нарушает распределение данных изображения и усложняет дальнейшую его обработку алгоритмами.

Хакон Хуккелас, Рудольф Местер и Фрэнк Линдсет создали систему DeepPrivacy, которая разработана с помощью сразу нескольких нейросетей, используемых для обработки изображений. Сначала изображение обрабатывается нейросетью S3FD, которая определяет, где на фото находится само лицо. Затем в дело вступает нейросеть Mask R-CNN, которая размечает ключевые точки фото человека — глаза, уши, плечи и нос. Этот этап необходим для того, чтобы впоследствии созданное нейросетью новое лицо выглядело максимально реалистично.
Читать полностью »

Недавно натолкнулся на вопрос в чате ODS: почему алгоритм, генерирующий текст буква-за-буквой, сэмплит буквы не из p (вектор вероятностей следующей буквы, предсказанный языковой моделью), а из p'=softmax(log(p)/t) (где t — это ещё какой-то непонятный положительный скаляр)?

Быстрый и непонятный ответ: t — это "температура", и она позволяет управлять разнообразием генерируемых текстов. А ради длинного и детального ответа, собственно, и написан этот пост.
Сэмплирование с температурой - 1

Читать полностью »

Эпопея по созданию робота с нюхом собаки - 1

Андрей Мершин до сих пор зол на собак. «Ну, вообще-то я их люблю», – говорит греческо-русский ученый в своем уютном офисе в Mассачусетском институте (MIT). – «Но они меня просто уделывают».

Он включает видео, чтобы показать то, о чём говорит. В нём черно-белый спаниель по кличке Люси подходит к шести стаканчикам с человеческой мочой. Собака нюхает их, иногда – коротко, иногда – чуть подольше, явно пытаясь в чём-то разобраться. На самом деле, она совершает диагностику. Ищет контрольный аромат, свидетельствующий о раке простаты. Оказывается, этот рак придает характерную нотку мужской моче. Вполне заметную – по крайней мере, для собаки. Когда Люси находит стаканчик от больного раком, она садится напротив него и получает от тренеров вкусняшку.

Среди людей – которые слетали на Луну, получили фото черной дыры и создали машины с автопилотами, – определение рака простаты до сих пор считается очень непростой задачей. В основном, человечество пытается проверить кровь пациента на повышенные уровни специфических протеинов (PSA). Но успех этого занятия – крайне сомнителен. Ученый, который впервые открыл PSA, назвал тест «чуть более удачным, чем подбрасывание монетки». А ложноположительное срабатывание может привести к биопсии простаты, крайне неприятной процедуре, при которой большая полая игла вставляется через стенку прямой кишки для извлечения образцов ткани.

С другой стороны, правильно натренированные собаки могут определять рак простаты с точностью больше 90%, и для них это вообще не составляет проблем. Люси справляется с шестью образцами меньше чем за две минуты. Читать полностью »

Вступление

Обработка естественного языка (NLP) является популярной и важной областью машинного обучения. В данном хабре я опишу свой первый проект, связанный с анализом эмоциональной окраски кино отзывов, написанный на Python. Задача сентиментного анализа является довольно распространенной среди тех, кто желает освоить базовые концепции NLP, и может стать аналогом 'Hello world' в этой области.

В этой статье мы пройдем все основные этапы процесса Data Science: от создания собственного датасета, его обработки и извлечения признаков с помощью библиотеки NLTK и наконец обучения и настройки модели с помощью scikit-learn. Сама задача состоит в классификации отзывов на три класса: негативные, нейтральные и позитивные.
Читать полностью »

Недавно мне на глаза попался датасет на Kaggle с данными о 45 тысячах фильмов с Full MovieLens Dataset. Данные содержали не только информацию об актерах, съемочной команде, сюжете и т.п., но и оценки, выставленные фильмам пользователями ресурса (26 миллионов оценок от 270 тыс.пользователей).

Стандартная задача для таких данных — это рекомендательная система. Но мне в голову почему-то пришло прогнозирование рейтинга фильма на основе информации, доступной до его выхода. Я не знаток кинематографа, и поэтому обычно ориентируюсь на рецензии, выбирая что посмотреть из новинок. Но ведь рецензенты тоже несколько biased — они-то смотрят гораздо больше разных фильмов, чем рядовой зритель. Поэтому спрогнозировать, как оценит фильм обычная публика, показалось занятным. Читать полностью »

На сегодняшней презентации примерено в 20:49 МСК компания Apple показала новые смартфоны iPhone 11 (от $699 в США), iPhone 11 Pro ($999) и iPhone 11 Pro Max ($1099).

Основные отличительные характеристики iPhone 11:

  • Новый 4-ядерный процессор A13 Bionic. Сравнительная производительность CPU разных смартфонов показана на диаграмме ниже без подписей. Компания Apple заявила, то iPhone 11 почти вдвое быстрее, чем любой смартфон Android. Пиковая производительность процессора с 8,5 млрд транзисторов составляет 1 TOPS (1 триллион операций в секунду).

    Apple представила iPhone 11, который почти вдвое быстрее любого Android-смартфона - 1

Читать полностью »

Недавно исследователи из GoogleAI показали свой поход к задаче трекинга руки и определения жестов в реальном времени. Я как раз занимался подобной задачей и потому решил разобраться с тем как они подошли к решению, какие технологии они использовали, и как добились хорошей точности при риал тайм работе на мобильном устройстве. Также запустил модель на android и протестировал в реальных условиях.

Нейронные сети для трекинга рук в режиме реального времени - 1

Читать полностью »

Замена лиц актёров с помощью нейросетей работает уже неплохо. Если интересно, вбейте на ютубе запрос «Терминатор с лицом Сталлоне». Надеюсь, по контексту понятно, что вы увидите.

Технология замена лиц открытая. Проще говоря, каждый может заморочиться и подменить лицо в любом ролике или фильме. Эффект от замены пока ещё попадает в «зловещую долину». Однако, через год я буду с опаской относиться к любым видеозвонкам.

Сильвестр Сталлоне сыграет Нео в Матрице, или Кино 2.0 - 1

Если в 2020 году вам звонит по видеосвязи знакомый, то вы не можете быть уверены, что это настоящий человек. И внешний вид, и голос могут быть фальшивкой. Чем, естественно, воспользуются всевозможные мошенники. Но сильнее всего эта технология изменит кинематограф. Читать полностью »

image
Источник: xkcd

Линейная регрессия является одним из базовых алгоритмов для многих областей, связанных с анализом данных. Причина этому очевидна. Это очень простой и понятный алгоритм, что способствует его широкому применению уже многие десятки, если не сотни, лет. Идея заключается в том, что мы предполагаем линейную зависимость одной переменной от набора других переменных, а потом пытаемся эту зависимость восстановить.

Но в этой статье речь пойдет не про применение линейной регрессии для решения практических задач. Здесь будут рассмотрены интересные особенности реализации распределенных алгоритмов её восстановления, с которыми мы столкнулись при написании модуля машинного обучения в Apache Ignite. Немного базовой математики, основ машинного обучения и распределенных вычислений помогут разобраться, как восстанавливать линейную регрессию, даже если данные распределены между тысячами узлов.
Читать полностью »

После экспериментов с многим известной базой из 60000 рукописных цифр MNIST возник логичный вопрос, есть ли что-то похожее, но с поддержкой не только цифр, но и букв. Как оказалось, есть, и называется такая база, как можно догадаться, Extended MNIST (EMNIST).

Если кому интересно, как с помощью этой базы можно сделать несложную распознавалку текста, добро пожаловать под кат.

Python + OpenCV + Keras: делаем распознавалку текста за полчаса - 1
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js