Виртуальный геохронологический глобус, на котором можно увидеть, как выглядела поверхность нашей планеты в разные эры (Нео-протерозой, Палеозой, Мезозой, Кайнозой), начиная от временного промежутка в 750 миллионов лет назад.
Читать полностью »
Виртуальный геохронологический глобус, на котором можно увидеть, как выглядела поверхность нашей планеты в разные эры (Нео-протерозой, Палеозой, Мезозой, Кайнозой), начиная от временного промежутка в 750 миллионов лет назад.
Читать полностью »
Статьи про компьютерное зрение, интерпретируемость, NLP – мы побывали на конференции AISTATS в Японии и хотим поделиться обзором статей. Это крупная конференция по статистике и машинному обучению, и в этом году она проходит на Окинаве – острове недалеко от Тайваня. В этом посте Юлия Антохина (Yulia_chan) подготовила описание ярких статей из основной секции, в следующем вместе с Анной Папета расскажет про доклады приглашенных лекторов и теоретические исследования. Немного расскажем и про то, как проходила сама конференция и про “неяпонскую” Японию.
Microsoft убрала из интернета свою базу данных на 10 миллионов лиц MS Celeb, пишет Financial Times. Фотографии под лицензией Creative Commons использовались для обучения систем распознавания лиц учёными со всего мира. К сожалению, среди них оказались военные подразделения и китайские фирмы SenseTime и Megvii, которые специализируются на разработке систем видеонаблюдения. Вероятно, это могло вызвать недовольство в высших эшелонах власти и породить обвинения в адрес IT-компании, которая якобы оказывает техническое содействие потенциальному врагу.
База данных MS Celeb вышла в 2016 году. Microsoft описывает её как крупнейший общедоступный набор данных распознавания лиц в мире, содержащий более 10 млн изображений почти 100 000 человек.
Читать полностью »
Примеры видеороликов из тестового набора
Российская компания NtechLab заняла второе место на конкурсе нейросетей ActEV: Activities in Extended Video среди алгоритмов, способных распознавать действия на видео. В конкурсе принимали участие 39 алгоритмов, в финальном этапе ActEV-PC Independent Evaluation остались семь участников.
Такие системы могут широко применяться в коммерческих системах. Например, это позволяет автоматизировать поиск неправильно припаркованных автомобилей, оставленных предметов, а также курящих в неположенных местах граждан — и оперативно оповещать об этих действиях полицию. Система автоматического распознавания действий для правоохранительных органов особенно эффективна в сочетании с обширной системой видеонаблюдения, которая работает в связке с системой распознавания лиц.
Читать полностью »
В последнее время мы в группе распознавания компании ABBYY всё больше применяем нейронные сети в различных задачах. Очень хорошо они зарекомендовали себя в первую очередь для сложных видов письменности. В прошлых постах мы рассказывали о том, как мы используем нейронные сети для распознавания японской, китайской и корейской письменности.
Пост про распознавания японских и китайских иероглифов
Пост про распознавание корейских символов
В обоих случаях мы использовали нейронные сети с целью полной замены метода классификации отдельного символа. Во всех подходах фигурировало множество различных сетей, и в задачи некоторых из них входила необходимость адекватно работать на изображениях, которые не являются символами. Модель в этих ситуациях должна как-то сигнализировать о том, что перед нами не символ. Сегодня мы как раз расскажем о том, зачем это в принципе может быть нужно, и о подходах, с помощью которых можно добиться желаемого эффекта.
А в чём вообще проблема? Зачем нужно работать на изображениях, которые не являются отдельными символами? Казалось бы, можно разделить фрагмент строки на символы, классифицировать их все и собрать из этого результат, как, например, на картинке ниже.
Да, конкретно в данном случае так действительно можно сделать. Но, увы, реальный мир устроен куда более сложно, и на практике при распознавании приходится иметь дело с геометрическими искажениями, смазом, пятнами кофе и прочими трудностями.
Читать полностью »
Легко принять, как само собой разумеющееся, возможность отправить фотку другу, и не волноваться по поводу того, какое устройство, браузер или операционную систему он использует – однако так было не всегда. К началу 1980-х компьютеры умели хранить и показывать цифровые изображения, однако по поводу наилучшего способа для этого существовало множество конкурирующих идей. Нельзя было просто отправить изображение с одного компьютера на другой и надеяться, что всё заработает.
Читать полностью »
Вы пока не разбираетесь, почему ReLU лучше сигмоиды, чем отличается Rprop от RMSprop, чем нормализованный сигнал лучше ненормализованного и почему сигналы вообще стоит пробрасывать? И зачем нейронной сети нужен граф, и какую он совершил ошибку, что она распространяется обратно? У вас есть проект, в котором требуется компьютерное зрение, но вы хотите его реализовать при помощи OpenCV? Вы делаете межгалактического робота для борьбы с грязными тарелками, и хотите, чтобы он мог сам решать, отмывать или и так сойдет? Или вы видели предложения по зарплатам для специалистов ML на hh.ru и все еще под впечатлением?
Мы запускаем открытый курс «Нейронные сети и компьютерное зрение», который адресован тем, кто в этой области делает первые шаги. В чем преимущества нашего курса?
Наверняка вы неоднократно видели в интернете такие картинки:
Я решил написать универсальный скрипт для создания подобных изображений.Читать полностью »
В этом году власти Москвы планируют объявит тендер на создание масштабной системы распознавания лиц, которая, по словам чиновников, охватит более 200 тысяч камер видеонаблюдения в столице. Мэр Москвы Сергей Собянин рассказал об этом на совещании у президента РФ Владимира Путина по вопросам развития технологий в области искусственного интеллекта.
Он также напомнил, что система распознавания лиц уже тестировалась Москве, запуск в пробном режиме был выполнен во время чемпионата мира по футболу 2018 года.
Читать полностью »