Компания NVIDIA представила результаты своей работы над новым алгоритмом искусственного интеллекта в виде открытой онлайн-платформы, преобразующей изображения животных. Посетители могут загрузить фотографию домашнего питомца и увидеть, как он превращается в тигра, волка или леопарда, сохраняя при этом узнаваемые черты.
В основе платформы лежит фреймворк FUNIT (few-shot unsupervised image-to-image translation framework). В эту аббревиатуру его создатели уместили все отличительные особенности технологии: алгоритм является самообучаемым, генерирует новые изображения на базе исходного и достигает хороших показателей на небольших наборах данных.
Последнее обстоятельство особенно важно. В своем проекте на GitHub исследователи из компании отмечают: «Методы самообучающегося преобразования изображений… достигли немалого успеха, однако они до сих подвержены ограничениям двух типов. Во-первых, обучение, как правило, требует демонстрации большого количества изображений из конечного класса. Во-вторых, модель, обученная определенному типу преобразования, не может быть приспособлена для выполнения преобразований другого типа в ходе работы».
FUNIT избавлен от обоих этих недостатков. Генеративно-состязательная сеть, которая лежит в основе технологии, способна трансформировать изображения в те классы, которые вообще не использовались в выборке. Другими словами, платформа может сделать из леопарда собаку породы шарпей, даже если не сталкивалась с этой породой в процессе обучения — достаточно, чтобы несколько посетителей загрузили соответствующие фотографии. По мнению создателей, подобное умение выделять основные черты и делать обобщения на базе небольшого числа примеров делает искусственный интеллект на шаг ближе к человеческому
В дальнейшем специалисты NVIDIA планируют развивать платформу и расширять ее возможности. Сейчас в набор данных для обучения добавили еще несколько классов: изображения цветов, птиц и еды.
Автор: nanton