Зачем нужна система мониторинга на кристалле

в 18:09, , рубрики: ultrasoc, Блог компании ИТ-ГРАД, высокая производительность, гетерогенные вычисления, ИТ-ГРАД

Британский стартап UltraSoC представил on-chip-технологию для отслеживания характеристик микросхем без ущерба для производительности. Рассказываем, как устроено решение.

Зачем нужна система мониторинга на кристалле - 1
/ фото 83DegreesMedia CC BY

Зачем внедрять системы мониторинга в чип

Гетерогенные устройства строятся из нескольких блоков. Ими могут выступать процессоры, сопроцессоры или интегральные схемы ASIC. Специализация вычислительных модулей повышает производительность всей системы, но «многокомпонентный состав» приводит к сложностям с оптимизацией — каждому аппаратному блоку требуется настройка.

Проблема усугубляется, если чипы используются крупным дата-центром. Мониторинг обширной инфраструктуры — задача не из легких. Специализированные программные решения зачастую наносят ущерб эффективности работы вычислительных систем. К примеру, утилита для измерения пропускной способности канала iPerf снижает производительность сети на 10–15%.

Для решения этой проблемы UltraSoC внедрили инструменты для мониторинга прямо на чип. Компания разработала ряд логических полупроводниковых модулей, каждый из которых отвечает за одну из задач — мониторинг, отладку, обеспечение безопасности. Производители чипов могут использовать эти модули и вытраливать их на одной схеме с процессорами, GPU, сетевыми интерфейсами. Это позволяет собирать данные со всех компонентов микросхемы «на месте» без инвазивных программных решений. Эта технология уже адаптирована для работы со стандартными архитектурами: от ARM и RISC-V до MIPS и Xtensa.

Устройство системы

В UltraSoC предлагают порядка тридцати модулей, которые можно компоновать в зависимости от особенностей конкретной системы на кристалле (SoC). Модули делятся на три класса:

  1. Блоки аналитики — контролируют и мониторят компоненты микросхемы;
  2. Блоки обмена сообщениями — связывают модули UltraSoC между собой;
  3. Коммуникаторы — интерфейсы для связи с внешними системами и внутренними компонентами.

К примеру, для микропроцессоров на базе архитектуры RISC-V вся система может выглядеть следующим образом:

Зачем нужна система мониторинга на кристалле - 2

Полученные данные о состоянии компонентов чипа можно выводить через различные интерфейсы: USB, Ethernet, PCI-Express и даже Wi-Fi. После эту информацию можно загрузить в любую аналитическую систему для поиска аномалий в работе компонентов.

Потенциал и недостатки решения

Разработчики из UltraSoC говорят, что их система найдет применение в дата-центрах и поможет облачным провайдерам мониторить масштабную облачную инфраструктуру. Так как параметры системы на кристалле отслеживаются с помощью аппаратных средств, которые (в отличие от программных) не оказывают влияние на производительность, операторы ЦОД смогут получать актуальные данные о состоянии серверов в реальном времени.

Из-за того что технология оценивает работу низкоуровневых компонентов напрямую, она поможет быстрее определять причину так называемых гейзенбагов — «плавающих ошибок», которые сложно отловить из-за того, что они регулярно меняют свойства.

Но прежде чем технология найдет широкое применение, команде UltraSoC придется убедить производителей внедрить решение в свои чипы. Его реализация усложнит бизнес-процессы, приведет к удорожанию производства и увеличению цены микросхем. Поэтому многие компании могут отказаться, сославшись на то, что клиентам будет дешевле самостоятельно воспользоваться сторонним ПО для мониторинга.

Но ряд производителей все же хочет опробовать продукт. Например, в компании Esperanto собираются внедрить технологию UltraSoC в тысячу процессоров на базе RISC-V и ускорители AI/ML, чтобы отслеживать их производительность.

Альтернативные разработки

Другие организации тоже разрабатывают on-chip системы. В частности, специальные сенсоры для отслеживания напряжения и температуры (PVT — Process, Voltage, Temperature). Они заточены под работу в системах на кристалле и ASIC. В начале прошлого года Moortec заручились поддержкой производителя чипов TSMC и реализовали свою технологию в 12-нм микросхемах. В компании уверены, что процессоры с системами мониторинга «на борту» найдут применение в ЦОД, мобильных устройствах, системах ИИ, IoT и проч.

Еще один проект — «умные» PVT-сенсоры — стал результатом совместной работы компаний. Комбинация цифровых систем мониторинга и анализа UltraSoC и физических сенсоров Moortec позволяет комплексно отслеживать состояние SoC и оптимизировать нагрузку в режиме реального времени.

Что ждет технологию в будущем

Разработчики из UltraSoC считают, что рост популярности высокотехнологичных решений (AI, ML, IoT), а также переход на гетерогенные системы сделают встроенные инструменты мониторинга незаменимыми.

В компании планируют сделать архитектуру решения более гибкой и настраиваемой. Для этого в UltraSoC начали разрабатывать UltraDevelop 2. Это — интегрированная среда разработки (IDE), с помощью которой можно конфигурировать, отлаживать и оптимизировать параметры компонентов чипа. Её релиз намечен на второй квартал 2019 года.


О чем мы пишем в корпоративном блоге:

Несколько постов из нашего Telegram-канала:

Автор: ИТ-ГРАДовец

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js