Рубрика «GPU-кластеры»

Почему GPU обманывают о своей нагрузке и как с этим бороться

2022-04-21 в 7:59, admin, рубрики: GPU-кластеры, Блог компании Яндекс, высокая производительность, машинное обучение, Сетевые технологии, суперкомпьютеры

В предыдущем посте я рассказывал о том, как мы строили свои суперкомпьютеры. В этом — поделюсь опытом, который мы накопили, эксплуатируя наши кластеры. Этот опыт будет полезен не только тем, кто обучает огромные ML-модели. На грабли, о которых пойдёт речь, легко наступить, даже если вы специалист с парой GPU.

Почему GPU обманывают о своей нагрузке и как с этим бороться - 1

Почему в распределённом обучении нельзя доверять утилизации GPU? Почему переход в эру распределённого обучения — фундаментальный сдвиг парадигмы мышления, к которому должен быть готов каждый ML-разработчик? Ещё больше «Почему» и ответов на них — под катом.
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «GPU-кластеры»

Почему GPU обманывают о своей нагрузке и как с этим бороться

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «GPU-кластеры»

Почему GPU обманывают о своей нагрузке и как с этим бороться

Новости

Актуальные темы

Архив