Отвлечемся ненадолго от темы новых процессоров Intel (это совсем ненадолго) и поговорим о машинном зрении и Deep Learning. Вообще, тема AI стала общей при обсуждении перспектив развития компьютерной техники, и многие, я думаю, заметили следующую особенность. Постепенно, по мере совершенствования специализированных аппаратных и программных средств, элементы AI выходят из дата-центров с супер-серверами «в поля», становятся все более доступными технически и финансово. В Intel также видят эту тенденцию, и, чтобы упростить внедрение передовых технологий в повседневную жизнь, предлагают вендорам воспользоваться их новым решением — Intel Vision Accelerator.
Что такое Intel Vision Accelerator? Это набор референсных дизайнов для плат-ускорителей, на основе которых любой производитель электроники может создать свой продукт с нужным набором особенностей. Однако, естественно, просто дизайна еще недостаточно — нужна элементная база. У Intel она уже есть — это специализированный сопроцессор Movidius и FPGA Arria. В чем преимущества такого подхода?
- возможность инференса нейронных сетей «на месте»;
- высокая производительность на специализированных задачах;
- высокая эффективность в пересчете на энергозатраты, стоимость и т.д.;
- полная совместимость с Open Visual Inference & Neural Network Optimization (OpenVINO) toolkit — набором библиотек, средств оптимизации и информационных ресурсов для разработки софта, использующего машинное зрение и Deep Learning.
Давайте сравним эти две платформы применительно к Deep Learning.
Intel Vision Accelerator с Intel Movidius | Intel Vision Accelerator c Intel Arria | |
---|---|---|
Особенность | Высокая эффективность в пересчете на потребление и стоимость | Производительное интегрированное решение |
Область применения | Классические нейронные сети | Дополнительная оптимизация при deep learning с использованием высоконагруженных сетей |
Варианты использования | Устройства, имеющие ограничения по размерам и потреблению, классические топологии сетей, которые могут быть оптимизированы под ASIC | Сервера среднего и начального уровней, среды, хорошо поддающиеся программной оптимизации |
Интерфейсы подключения | PCIe, mini-PCIe, M2 | PCIe |
Количество видеопотоков | От 1 до 16 на устройство | От 3 до 32 |
Batch size | 1-4 | 1-144 |
Энергопотребление | ~2 Вт | ~35 Вт |
В настоящее время Intel Vision Accelerator поддерживает следующие топологии сетей и алгоритмы:
Топологии | Алгоритмы |
---|---|
GoogleNet ResNet–18 ResNet–50 ResNet–101 SqueezeNet SqueezeNext VGG-16 Faster RCNN MobileNet Tiny Yolo |
Определение/распознавание лица Классификация атрибутов лица Слежение за руками Определение пола и возраста Определение предмета/слежение за предметом Распознавание поведения и жестов Определение брошенных предметов Многоцелевое слежение Определение буквы/слова и т.д. |
Вы спросите: зачем нам знать о предложениях Intel для вендоров? Вручную ведь ускорители делать не предлагается. Ответ такой: это пост о классе устройств (или двух классах), которые в скором времени появятся на рынке. А вы сможете их найти для своих нужд — если знаете, что нужно искать.
Автор: saul