Если стационарный компьютер или ноутбук ориентирован на новые и требовательные видеоигры, а также работу с системами автоматизированного проектирования и другими специализированными приложениями, то в нём чаще всего установлен видеоускоритель либо компании Nvidia, либо AMD. Текущее поколение видеоускорителей представлено девятисотой серией GeForce и трёхсотой серией чипов Radeon. Обе постепенно заполняются моделями разной направленности: Nvidia начала делать это осенью 2014 года, AMD — в прошлом июне.
Новая линейка появится в 2016 году. Производители предоставляют скудную информацию о новых продуктах. Возможно, они опасаются эффекта Осборна: рассказ о более совершенном последователе состарит текущую модель в общественном восприятии, что негативно отразится на продажах последней. А ещё разработчики и сами могут не знать, как будет выглядеть конечный продукт на прилавке. Но какая-то информация есть уже сейчас.
Новое поколение можно характеризовать использованием HBM2 (High Bandwidth Memory 2) и уменьшением техпроцесса производства. AMD и Nvidia переходят с 28 нм на 14 и 16 нм FinFET, соответственно. Оба нововведения призваны увеличить производительность на ватт в 2 раза.
High Bandwidth Memory или HBM — это технология памяти, которая была разработана AMD и Hynix. До появления HBM в видеокартах использовалась память GDDR5. Для получения дополнительной пропускной способности приходилось добавлять чипы и каналы, которые отъедали пространство на плате и энергию. Обычное ускорение частоты работы микросхем памяти затормозилось, поскольку повышение частоты означает быстрый рост тепловыделения. Решением проблем призвано стать то, чем производители занимались последние пару десятилетий для уменьшения стоимости и энергопотребления и увеличения производительности: интеграция. К примеру, центральные процессоры включили в свой состав множество элементов, от математических сопроцессоров до контроллеров памяти. В каждом случае были свои плюсы.
HBM предполагает сближение памяти и чипа видеоускорителя в одной структуре. Но процессы производства слишком отличаются, чтобы реализовать подобное в одном кристалле. Поэтому используется конструкция из трёх элементов: главного чипа (в данном случае GPU, видеоускорителя), столбиков памяти и интерпозера. Интерпозер — обычный кремниевый чип, производимый по относительно старому процессу. Роль интерпозера полностью пассивна. У него нет активных элементов, поскольку его основной задачей является электрическое соединение дорожек между памятью и процессором.
Главный чип и столбики памяти стоят на интерпозере. Поскольку это кремниевый чип, он может соединять куда больше элементов, чем обычная плата. Именно интерпозер является ключевой деталью High Bandwidth Memory. Под интерпозером расположены другие традиционные элементы, но их задачей является обмен с шиной PCI Express, вывод на мониторы и другие интерфейсы. Всё общение между видеопроцессором и памятью происходит с помощью интерпозера.
Частота работы памяти невысока (1 ГГц вместо 6), но это компенсируется очень широким соединением: 1024 бит шины на каждую из четырёх стопок. У GDDR5 шина памяти достигает 512 бит ширины, что в восемь раз меньше 4096 бит HBM. В результате уже в первом поколении HBM получается продемонстрировать преимущество пропускной способности (512 ГБ/с).
Планы Hynix по производству HBM2.
Первое поколение HBM уже используется в нескольких продуктах трёхсотой серии Radeon. Второе поколение HBM появится как в продуктах AMD, так и Nvidia. Некоторые источники считают, что факт владения HBM даст AMD приоритет к доступу к HBM2. В нём скорость обмена возрастёт с 128 ГБ/с до 256 ГБ/с на каждую из стопок, а объём памяти слоя вырастет в четыре раза. Первый HBM предусматривает 4 слоя памяти в стопке, во втором будут доступны конфигурации с 4 и 8 слоями.
Следующая микроархитектура Nvidia носит название Pascal. Её основными характеристиками являются 16-нм техпроцесс FinFET+ от компании TSMC и до 16 ГБ памяти HBM2. Это даёт возможность предположить, что будет использоваться конфигурация с 4 слоями HBM2. Также доступна информация, что разработка следующего видеопроцессора Nvidia ставит целью достижение 1 ТБ/с скорости обмена данными с видеопамятью. Это в два раза больше, чем может предложить текущая Fury X.
Карты на основе Pascal впервые будут использовать NVLink, высокоскоростную шину между центральным и графическим процессорами или между графическими процессорами. Скорость NVLink значительно выше, чем у PCI Express.
Продукты Pascal начнут выходить где-то в 2016 году. (Будет интересно увидеть маркетинг модели GTX 1080 и разъяснения, что она отлично подходит для разрешений 4К.) Кое-что уже существует. На днях Nvidia представила автомобильный компьютер Drive PX 2, ядром которого являются два процессора Tegra и два неких чипа микроархитектуры Pascal. Drive PX 2 — это мощная дробилка чисел для испытания технологий робоавтомобилей, и имя Pascal упоминается в анонсе вскользь.
Новая микроархитектура AMD носит название Polaris. Порция данных о ней появилась 4 января. В Polaris предусмотрена поддержка HDMI 2.0a (вывод до 4K 60 FPS), DisplayPort 1.3 (вывод до 8K 60 FPS), энкодинга и декодинга 4K h.265 (HEVC). AMD будет использовать 14 нм техпроцесс FinFET. Относительно 28-нм техпроцесса будут достигнуты лучшие скорости, меньшие токи утечки, меньшее варьирование показателей элементов.
AMD найдёт идеальную точку для улучшения энергоэффективности, обеспечивая прирост производительности за счёт архитектурных изменений. Как показывает график ниже, новый техпроцесс даёт хорошее уменьшение энергопотребления при той же частоте, но не настолько крупное пространство для увеличения производительности. AMD делает акцент на производительности на ватт, а не собственно производительности. Это позволит достичь консольный уровень графики даже в компактных ноутбуках.
Впрочем, это не означает, что Polaris не продолжит рост производительности. Просто для достижения новых показателей будут задействованы изменения в архитектуре, а не тупой рост частот. AMD выдала мало информации, но из предоставленного следует, что были переработаны многие блоки графических чипов. Polaris — это четвёртое поколение Graphics Core Next, поэтому архитектура наследует те же принципы. Каждый вычислительный блок содержит 4 блока SIMD, которые в свою очередь содержат блоки векторных вычислений.
Неизвестно, продолжат ли «зелёные» использовать GDDR5 в бюджетных продуктах. Micron сделала несколько объявлений о технологии GDDR5X, которая сулит скорость примерно в два раза больше GDDR5. Впрочем, GGDR5X является проприетарной технологией Micron, и поставки возможны ближе к концу 2016 года.
В свою очередь «красные» уже заявляют, что GDDR5 останется в продуктах, которые ориентированы на низкое энергопотребление или среднюю производительность. Какие конкретно модели будут содержать «старый» тип памяти, AMD пока не говорит.
AMD продемонстрировала прототип подобного недорогого видеоускорителя микроархитектуры Polaris с памятью GDDR5 вместо HBM. Его сравнили с неназванным образцом GTX 950. Регистрировалось энергопотребление в Star Wars Battlefront в разрешении 1920×1080. Трудно сделать какие-либо выводы в этом тесте, где фреймрейт был ограничен 60 к/с, но карта на Polaris потребляла на почти 40 % меньше энергии: в районе 85 ватт против 140.