Ежедневно Google Maps строят полезные маршруты, выдают информацию о пробках и о коммерческих организациях для миллионов людей. Чтобы нашим пользователям было удобнее, эта информация должна в реальном времени отражать постоянно изменяющийся мир. Автомобили Street View ежедневно собирают миллионы изображений, и вручную невозможно проанализировать более 80 миллиардов изображений высокого разрешения, собранных на сегодня, чтобы найти новую или обновлённую информацию, пригодную для размещения на Google Maps. Одна из целей команды Ground Truth – автоматическое извлечение информации из изображений с географической привязкой для улучшения Google Maps.
В работе "Извлечение структурированной информации из базы изображений Street View с использованием attention-алгоритмов" мы описали наш подход к точному автоматическому распознаванию названий улиц на очень сложных фотографиях Street View из разных стран при помощи глубинной нейросети. Наш алгоритм показал точность в 84,2% на сложном наборе данных French Street Name Signs (FSNS), и серьёзно опередил предыдущих лидеров в этой области. Что важно, наша система легко масштабируется на извлечение других типов информации из фотографий Street View, и сейчас помогает нам автоматически распознавать вывески коммерческих предприятий. И мы с удовольствием объявляем о том, что эта модель выложена в общий доступ!
Читать полностью »