Компания Waymo открыла в общий доступ и только для некоммерческого использования большой датасет, предназначенный для обучения алгоритмов беспилотных автомобилей.
Датасет «Waymo Open Dataset» содержит в себе тысячу двадцатисекундных записей, собранных с пяти лидаров и пяти камер во время реальных поездок по четырем американским городам с разными дорожными и погодными условиями, как пояснено в блоге компании.
Большая часть данных в датасете маркирована и содержит в себе суммарно о 12 млн. 3D меток и 1,2 млн. 2D меток различных объектов вокруг автомобиля.
Компания Waymo считается одним из лидеров в отрасли беспилотных автомобилей. Данные являются важным компонентом для машинного обучения в работе Waymo.
Беспилотные автомобили Waymo уже проехали более 10 млн. миль в двадцати пяти городах США. Этот богатый и разнообразный опыт, накопленный в реальном мире, помог инженерам и исследователям компании разработать и модернизировать беспилотные инновационные модели и алгоритмы.
Теперь Waymo открывает для исследователей специально подготовленный датасет на основе данных датчиков высокого разрешения, собранных беспилотными автомобилями Waymo во время тестовых поездок по американским городам, расположенным в штатах Калифорния, Аризона и Вашингтон.
Датасет собран на основе тысячи поездок, различающихся между собой погодой, временем суток, количеством пешеходов и автомобилей вокруг, а также многими другими факторами.
Из каждой поездки разработчики Waymo выбрали наиболее репрезентативный фрагмент длиной 20 секунд.
Данные, собранные из каждой поездки состоят из видеороликов с пяти камер и облаков точек с пяти лидаров (одного лидара дальнего действия и четырех лидаров ближнего действия). Для удобства дальнейшей обработки алгоритмами все данные датасета синхронизированы и сформированы в виде единых пакетов данных за каждые 0,1 секунды поездки.
Данные датасета размечены и на них нанесены границы вокруг объектов четырех главных типов: автомобили, пешеходы, велосипедисты и дорожные знаки. При этом пока размечены только все данные с лидаров, а с камер размечено только сто роликов.
В будущем Waymo планирует доразметить все данные с камер, а также опубликовать данные с новых поездок.
Этот открытый датасет только первый шаг для Waymo, где ожидают обратной связи от его исследователей о том, как сделать эти данных еще более эффективными в новых следующих открытых датасетах.
Автор: denis-19