Всем привет. Меня зовут Игорь Акимов, я руководитель направления мобильных продуктов ABBYY. Наверное, многие знают ABBYY по лучшим словарям Lingvo и помощнику любого студента FineReader, но кроме этого мы занимаемся ещё много чем интересным в сфере интеллектуальной обработки информации и лингвистики. За 28 лет накопили огромный багаж в сфере машинного обучения и нейросетей, а новых проектов и идей так много, что кажется, нам нужна помощь :) Поэтому мы приглашаем вас принять участие в конкурсе. Мы ищем идеи по применению новых технологий в мобильной разработке, которые будут близки большому числу людей. И назвали конкурс мы смело – mABBYYlity (тут и ABBYY, и мобильность, и ability – способность). Короче, всё основное тут – mobility.abbyy.com. А в статью за подробностями.
Читать полностью »
Рубрика «обработка изображений» - 52
Конкурс идей от ABBYY – как выиграть новый iPhone
2017-09-12 в 14:21, admin, рубрики: ABBYY, AI, AR, mabbyylity, machie learning, mobility, VR, Блог компании ABBYY, идеи, конкурс, машинное обучение, обработка изображений, разработка мобильных приложений, Разработка под AR и VR, хакатонСегментация лица на селфи без нейросетей
2017-09-11 в 11:08, admin, рубрики: classic, cv2, dlib, face, no deep learning, opencv, python, segmentation, selfie, Алгоритмы, Блог компании Open Data Science, машинное обучение, обработка изображений Приветствую вас, коллеги. Оказывается, не все компьютерное зрение сегодня делается с использованием нейронных сетей. Хотя многие стартапы и заявляют, что у них дип лернинг везде, спешу вас разочаровать, они просто хотят хайпануть немножечко. Рассмотрим, например, задачу сегментации. В нашем слаке развернулась целая драма. Одна богатая и высокотехнологичная селфи-компания собрала датасет для сегментации селфи с помощью нейросетей (а это непростое и недешевое занятие). А другая, более бедная и не очень развитая решила, что можно подкупить людей, размечающих фотки, и
спполучить базу. В общем, страсти в этих ваших Интернетах еще те. Недавно я наткнулся на статью, где без всяких нейросетей на устройстве делают очень даже хорошую сегментацию. Для сегментации от пользователя требуется дать алгоритму несколько подсказок, но с помощью dlib и opencv такие подсказки легко автоматизируются. В качестве бонуса мы так же сгладим вырезанное лицо и перенесем на какого-нибудь рандомного человека, тем самым поймем, как работают маски во всех этих снапчятах и маскарадах. В общем, классика еще жива, и если вы хотите немного окунуться в классическое компьютерное зрение на питоне, то добро пожаловать под кат.
Бот в муравейнике
2017-09-08 в 2:23, admin, рубрики: AI, Delphi, Алгоритмы, бот игры, искусственный интеллект, Компьютерное зрение, компьютерные игры, машинное обучение, обработка изображений, разработка игр, распознавание изображений, робототехника
Еще один игровой бот для «Космических рейнджеров HD» (издатель 1С) наводит на интересные мысли о путях развития искусственного интеллекта (ИИ).Читать полностью »
О различении объектов по цвету
2017-09-06 в 12:16, admin, рубрики: Алгоритмы, машинное обучение, обработка изображений, распознавание цвета, цветопередачаСтатья предназначена, в первую очередь, для людей ранее не работавших с цветом. Она описывает те нюансы, интересные моменты и подводные камни, которые я узнал, когда впервые начал работать с распознаванием цветов (задачи типа сличения цвета двух объектов, нахождения нужного объекта роботом по запросу человека и т.д.).
Ориентация мобильного робота, выбор способа регистрации особых точек изображений
2017-09-05 в 18:37, admin, рубрики: open source, Raspberry Pi, Алгоритмы, Видео регистрация, обработка изображений, Разработка робототехникиЭто предыстория и продолжение статьи:
Дело было вечером...,все статьи на хабре были прочитаны, затеял «небольшой» проект по автономной ориентации робота на RaspberryPi 3. С железом проблем нет, собирается недорого из г-на и палок купленных на ебау деталек, камера с хорошей стеклянной оптикой(это важно для стабильности калибраций), привод камеры вверх, вниз и компас, гироскоп и тд прикрепленные к камере:
Существующие системы SLAM не устраивают, или по цене, или по качеству/скорости. Поскольку наработок деталей для Visual SLAM у меня много, решил шаг за шагом писать и выкладывать алгоритмы и код в открытый доступ, с обоснованием причин выбора тех или иных алгоритмов.
Читать полностью »
Нейросетевая игра в имитацию
2017-09-04 в 11:50, admin, рубрики: aae, adversarial autoencoder, conditional gan, cyclegan, dcgan, deep learning, domain transfer network, GAN, infogan, neural networks, ods, putin zebra, Алгоритмы, Блог компании Open Data Science, математика, машинное обучение, обработка изображений Здравствуйте, коллеги. В конце 1960-ых годов прошлого века Ричард Фейнман прочитал в Калтехе курс лекций по общей физике. Фейнман согласился прочитать свой курс ровно один раз. Университет понимал, что лекции станут историческим событием, взялся записывать все лекции и фотографировать все рисунки, которые Фейнман делал на доске. Может быть, именно после этого у университета осталась привычка фотографировать все доски, к которым прикасалась его рука. Фотография справа сделана в год смерти Фейнмана. В верхнем левом углу написано: "What I cannot create, I do not understand". Это говорили себе не только физики, но и биологи. В 2011 году, Крейгом Венером был создан первый в мире синтетический живой организм, т.е. ДНК этого организма создана человеком. Организм не очень большой, всего из одной клетки. Помимо всего того, что необходимо для воспроизводства программы жизнедеятельности, в ДНК были закодированы имена создателей, их электропочты, и цитата Ричарда Фейнмана (пусть и с ошибкой, ее кстати позже исправили). Хотите узнать, к чему эта прохладная тут? Приглашаю под кат, коллеги.
Прототип проекта стоимостью $86 миллионов в 57 строках кода
2017-08-30 в 13:08, admin, рубрики: DIY, javascript, Блог компании Badoo, обработка видео, обработка изображений, Программирование, прототипирование, распознавание номеров, Спортивное программированиеСегодня очень много хороших конкурентных систем создается отдельными разработчиками, а не только большими компаниями. Как правило, это копирование на базе эталонного решения (продукт корпорации) с последующей оптимизацией. В таком случае выигрывают все: компании – от здоровой конкуренции, разработчики – от развития технических навыков и получения опыта, потребители – от новых возможностей и решений.
Представлюсь: меня зовут Иван Греков, я из фронтенд-команды Badoo. Мне очень понравился этот пост, я просто не смог пройти мимо и не перевести его. Этот пост – отличный источник вдохновения для любителей прототипирования устройств и open-source-решений. Перевод публикуется с сохранением авторской точки зрения и, надеюсь, будет интересен вам.
Быстрая регистрация особых точек изображений с помощью голосования биграфа
2017-08-27 в 18:19, admin, рубрики: open source, Raspberry Pi, Алгоритмы, Видео регистрация, обработка изображений, Разработка робототехникиДетектирование и регистрация особенностей изображений имеет много приложений в робототехнике, видео компрессии и т.д. Быстрая и аккуратная регистрация — пока недостижимая мечта многих программистов и пользователей. Она или быстрая, или аккуратная…
Читать полностью »
Android: эволюция фоторедактора ВКонтакте
2017-08-25 в 13:01, admin, рубрики: android, Блог компании ВКонтакте, Вконтакте, обработка изображений, Разработка под android, фоторедакторКак менялся фоторедактор для Android — от первой версии Snapster до фильтров в официальном приложении ВКонтакте.
Читать полностью »
Как сделать проект по распознаванию рукописных цифр с дообучением онлайн. Гайд для не совсем начинающих
2017-08-25 в 11:04, admin, рубрики: cnn, data mining, deep learning, image recognition, machine learning, ods, open data science, python, TensorFlow, Блог компании Open Data Science, гайд, глубокое обучение, машинное обучение, нейронные сети, обработка изображений, проектПривет!
В последнее время машинное обучение и data science в целом приобретают все большую популярность. Постоянно появляются новые библиотеки и для тренировки моделей машинного обучения может потребоваться совсем немного кода. В такой ситуации можно забыть, что машинное обучение — не самоцель, а инструмент для решения какой-либо задачи. Мало сделать работающую модель, не менее важно качественно презентовать результаты анализа или сделать работающий продукт.
Я хотел бы рассказать о том, как создал проект по распознаванию рукописного ввода цифр с моделями, которые дообучаются на нарисованных пользователями цифрах. Используется две модели: простая нейронная сеть (FNN) на чистом numpy и сверточная сеть (CNN) на Tensorflow. Вы сможете узнать, как сделать практически с нуля следующее:
-
создать простой сайт с использованием Flask и Bootstrap;
-
разместить его на платформе Heroku;
-
реализовать сохранение и загрузку данных с помощью облака Amazon s3;
-
собрать собственный датасет;
-
натренировать модели машинного обучения (FNN и CNN);
-
сделать возможность дообучения этих моделей;
-
сделать сайт, который сможет распознавать нарисованные изображения;
Для полного понимания проекта желательно знать как работает deep learning для распознавания изображений, иметь базовые знания о Flask и немного разбираться в HTML, JS и CSS.