О статье
Этот пост — небольшая заметка, предназначенная для программистов, которым хочется больше узнать о том, как GPU обрабатывает ветвление. Можно считать её введением в эту тему. Рекомендую для начала просмотреть [1], [2] и [8], чтобы получить представление о том, как в общем виде выглядит модель выполнения GPU, потому что мы будем рассматривать только одну отдельную деталь. Для любопытных читателей в конце поста есть все ссылки. Если найдёте ошибки, то свяжитесь со мной.
Содержание
- О статье
- Содержание
- Словарь
- Чем ядро GPU отличается от ядра ЦП?
- Что такое согласованность/расхождение?
- Примеры обработки маски выполнения
- Выдуманная ISA
- AMD GCN ISA
- AVX512
- Как бороться с расхождением?
- Ссылки