С момента летнего анонса графических процессоров NVIDIA мы посвятили немало страниц продуктам на основе нового кремния — GeForce RTX 2080, RTX 2080 Ti, да и самой архитектуре Turing. И судя по тому, как выступили в тестах старшие модели двадцатой серии, складывается впечатление, что главное в видеокартах RTX — это именно новые функций рендеринга, трассировка лучей и акселерация сетей машинного обучения, а вовсе не «сырая» производительность. Это особенно заметно на примере GeForce RTX 2080, который оказался полным аналогом GeForce GTX 1080 Ti в существующих играх и продается по сопоставимым ценам. Зато младшая модель, GeForce RTX 2070, по всей видимости, готова предложить то, чего хотят геймеры, без энтузиазма настроенные по отношению к трассировке лучей в компьютерных играх, а именно — больше FPS за те же деньги!
⇡#Технические характеристики
TU106 — единственный из трех процессоров архитектуры Turing, который дошел до потребительских устройств с нетронутой конфигурацией вычислительных блоков, в то время как GeForce RTX 2080 и RTX 2080 Ti получили урезанные варианты TU104 и TU102. По количеству CUDA-ядер одинарной точности и блоков наложения текстур RTX 2070 находится в промежутке между двумя устройствами на основе GP104 — GeForce GTX 1070 и GTX 1080. Кроме того, согласно референсным данным, RTX 2070 рассчитан на боле низкие тактовые частоты, чем GTX 1080, а кристалл сам по себе содержит в полтора раза больше транзисторов. Неудивительно, что вопрос сравнения с GTX 1080 стоит для RTX 2070 столь же остро, как для RTX 2080 — с GTX 1080 Ti. Однако графическим процессорам Turing помогает обновленная архитектура потоковых мультипроцессоров (SM) и большой объем кешей L1 и L2. Благодаря этим нововведениям новинке будет проще достигнуть проектного быстродействия в реальных задачах, чем GTX 1080, пусть на бумаге чип семейства Pascal имеет большое преимущество. Наконец, GeForce RTX 2070 и GTX 1080 обладают одинаковой разрядностью шины памяти (256 бит), но пиковая пропускная способность у RTX 2070 на целых 40 % больше за счет микросхем GDDR6, работающих на скорости 14 Гбит/с на контакт, даже без учета прогрессивных алгоритмов компрессии цвета, появившихся в архитектуре Turing.
Блок-схема графического процессора NVIDIA TU106
Что касается логики трассировки лучей и обработки данных нейросетями (inference), то внутри потокового мультипроцессора Turing соотношение между вычислительными блоками различных типов, включая CUDA-ядра FP32, блоки наложения текстур, RT- и тензорные ядра, не зависит от общего количества SM, поэтому ошибочно считать, что новые функции даны GeForce RTX 2070 лишь для того, чтобы оправдать буквы RTX в названии. В играх, которые освоят новые приемы рендеринга, скорее всего, сохранится тот баланс быстродействия между различными моделями 20-й серии, который сегодня мы увидим в тестах стандартного ПО под Direct3D 11 и 12.
Производитель | NVIDIA | ||||||
---|---|---|---|---|---|---|---|
Название | GP104 | GP102 | GP100 | GV100 | TU106 | TU104 | TU102 |
Микроархитектура | Pascal | Pascal | Pascal | Volta | Turing | Turing | Turing |
Техпроцесс, нм | 16 nm FinFET | 16 nm FinFET | 16 nm FinFET | 12 нм FFN | 12 нм FFN | 12 нм FFN | 12 нм FFN |
Число транзисторов, млн | 7 200 | 12 000 | 15 300 | 21 100 | 10 800 | 13 600 | 18 600 |
Площадь чипа, мм2 | 314 | 471 | 610 | 815 | 445 | 545 | 754 |
Конфигурация SM/TPC/GPC | |||||||
Число SM | 20 | 30 | 60 | 84 | 36 | 48 | 72 |
Число TPC | 20 | 30 | 30 | 42 | 18 | 24 | 36 |
Число GPC | 4 | 6 | 6 | 6 | 3 | 6 | 6 |
Конфигурация потокового мультипроцессора (SM) | |||||||
FP32-ядра | 128 | 128 | 64 | 64 | 64 | 64 | 64 |
FP64-ядра | 4 | 4 | 32 | 32 | 2 | 2 | 2 |
INT32-ядра | Н/Д | Н/Д | Н/Д | 64 | 64 | 64 | 64 |
Тензорные ядра | Н/Д | Н/Д | Н/Д | 8 | 8 | 8 | 8 |
RT-ядра | Н/Д | Н/Д | Н/Д | Н/Д | 1 | 1 | 1 |
Программируемые вычислительные блоки GPU | |||||||
FP32-ядра | 2 560 | 3 840 | 3 840 | 5 376 | 2 304 | 3 072 | 4 608 |
FP64-ядра | 80 | 120 | 1 920 | 2 688 | 72 | 96 | 144 |
INT32-ядра | Н/Д | Н/Д | Н/Д | 5 376 | 2 304 | 3 072 | 4 608 |
Тензорные ядра | Н/Д | Н/Д | Н/Д | 672 | 288 | 384 | 576 |
RT-ядра | Н/Д | Н/Д | Н/Д | Н/Д | 36 | 48 | 72 |
Блоки фиксированной функциональности | |||||||
TMU (блоки наложения текстур) | 160 | 240 | 240 | 336 | 144 | 192 | 288 |
ROP | 64 | 96 | 128 | 128 | 64 | 64 | 96 |
Конфигурация памяти | |||||||
Объем кеша L1 / текстурного кеша, Кбайт | 48 | 48 | 24 | ≤ 128 из 128, общий с разделяемой памятью | 32/64 из 96 (общий с разделяемой памятью) | 32/64 из 96 (общий с разделяемой памятью) | 32/64 из 96 (общий с разделяемой памятью) |
Объем разделяемой памяти / SM, Кбайт | 96 | 96 | 64 | ≤ 96 из 128 (общий с кешем L1) | 32/64 из 96 (общий с кешем L1) | 32/64 из 96 (общий с кешем L1) | 32/64 из 96 (общий с кешем L1) |
Объем регистрового файла / SM, Кбайт | 256 | 256 | 256 | 256 | 256 | 256 | 256 |
Объем регистрового файла / GPU, Кбайт | 5 120 | 7 680 | 15 360 | 21 504 | 9 216 | 12 288 | 18 432 |
Объем кеша L2, Кбайт | 2 048 | 3 072 | 4 096 | 6 144 | 4 096 | 4 096 | 6 144 |
Разрядность шины RAM, бит | 256 | 384 | 4 096 | 4 096 | 256 | 256 | 384 |
Тип микросхем RAM | GDDR5/GDDR5X | GDDR5X | HBM2 | HBM2 | GDDR6 | GDDR6 | GDDR6 |
Шина NVLINK | Н/Д | Н/Д | 4 × NVLink 1.0 x8 | 6 × NVLink 2.0 x8 | Н/Д | 1 × NVLink 2.0 x8 | 2 × NVLink 2.0 x8 |
Формально GeForce RTX 2070 пришел на замену GTX 1070, и в этой паре техническое преимущество Turing не вызывает сомнений, но рекомендованные розничные цены ($499 для партнерских видеокарт) сделали новинку преемником GeForce GTX 1080. Видеокарты Founders Edition, доступные напрямую от NVIDIA, в этом поколении стали дороже ($599 за GeForce RTX 2070 FE вместо $549 за GeForce GTX 1070 FE) и фактически конкурируют с топовыми модификациями сторонних производителей — повышенные тактовые частоты и качество конструкции это позволяют.
Производитель | NVIDIA | |||||
---|---|---|---|---|---|---|
Модель | GeForce GTX 1070 | GeForce GTX 1080 | GeForce GTX 1080 Ti | GeForce RTX 2070 | GeForce RTX 2080 | GeForce RTX 2080 Ti |
Графический процессор | ||||||
Название | GP104 | GP104 | GP102 | TU106 | TU104 | TU102 |
Микроархитектура | Pascal | Pascal | Pascal | Turing | Turing | Turing |
Техпроцесс, нм | 16 нм FinFET | 16 нм FinFET | 16 нм FinFET | 12 нм FFN | 12 нм FFN | 12 нм FFN |
Число транзисторов, млн | 7 200 | 7 200 | 12 000 | 10 800 | 13 600 | 18 600 |
Тактовая частота, МГц: Base Clock / Boost Clock | 1 506 / 1 683 | 1 607 / 1 733 | 1 480 / 1 582 | 1 410 / 1 620 (Founders Edition: 1 410 / 1 710) | 1 515 / 1 710 (Founders Edition: 1 515 / 1 800) | 1 350 / 1 545 (Founders Edition: 1 350 / 1 635) |
Число шейдерных ALU | 1 920 | 2 560 | 3 584 | 2304 | 2944 | 4352 |
Число блоков наложения текстур | 120 | 160 | 224 | 144 | 184 | 272 |
Число ROP | 64 | 64 | 88 | 64 | 64 | 88 |
Оперативная память | ||||||
Разрядность шины, бит | 256 | 256 | 352 | 256 | 256 | 352 |
Тип микросхем | GDDR5 SDRAM | GDDR5X SDRAM | GDDR5X SDRAM | GDDR6 SDRAM | GDDR6 SDRAM | GDDR6 SDRAM |
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) | 2 000 (8 000) | 1 250 (10 000) | 1 376,25 (11 010) | 1 750 (14 000) | 1 750 (14 000) | 1 750 (14 000) |
Объем, Мбайт | 8 192 | 8 192 | 11 264 | 8 192 | 8 192 | 11 264 |
Шина ввода/вывода | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 | PCI Express 3.0 x16 |
Производительность | ||||||
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) | 6 463 | 8 873 | 11 340 | 7 465 / 7 880 (Founders Edition) | 10 069 / 10 598 (Founders Edition) | 13 448 / 14 231 (Founders Edition) |
Производительность FP32/FP64 | 1/32 | 1/32 | 1/32 | 1/32 | 1/32 | 1/32 |
Пропускная способность оперативной памяти, Гбайт/с | 256 | 320 | 484 | 448 | 448 | 616 |
Вывод изображения | ||||||
Интерфейсы вывода изображения | DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b | DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b | DisplayPort 1.3/1.4, HDMI 2.0b | DisplayPort 1.4a, HDMI 2.0b | DisplayPort 1.4a, HDMI 2.0b | DisplayPort 1.4a, HDMI 2.0b |
TBP/TDP, Вт | 150 | 180 | 250 | 175/185 (Founders Edition) | 215/225 (Founders Edition) | 250/260 (Founders Edition) |
Розничная цена (США, без налога), $ | 349 (рекомендованная) / 399 (Founders Edition, nvidia.com) | 499 (рекомендованная) / 549 (Founders Edition, nvidia.com) | НД (рекомендованная) / 699 (Founders Edition, nvidia.com) | 499 (рекомендованная) / 599 (Founders Edition, nvidia.com) | 699 (рекомендованная) / 799 (Founders Edition, nvidia.com) | 999 (рекомендованная) / 1 199 (Founders Edition, nvidia.com) |
Розничная цена (Россия), руб. | НД (рекомендованная) / 31 590 (Founders Edition, nvidia.ru) | НД (рекомендованная) / 45 790 (Founders Edition, nvidia.ru) | НД (рекомендованная) / 52 990 (Founders Edition, nvidia.ru) | НД (рекомендованная) / 47 990 (Founders Edition, nvidia.ru) | НД (рекомендованная) / 63 990 (Founders Edition, nvidia.ru) | НД (рекомендованная) / 95 990 (Founders Edition, nvidia.ru) |
На примере Founders Edition мы познакомились со старшими моделями 20-й серии, но в случае GeForce RTX 2070 сразу начнем с партнерских видеокарт. AORUS GeForce RTX 2070 — наиболее совершенная модификация RTX 2070 в каталоге GIGABYTE. Базовый вариант этого устройства (артикул GV-N2070AORUS-8GC) работает на более высоких тактовых частотах, чем RTX 2070 Founders Edition (1770 против 1710 МГц) а у версии XTREME (GV-N2070AORUS X-8GC) расчетная частота GPU под нагрузкой составляет 1815 МГц. Кроме того, в AORUS GeForce RTX 2070 XTREME разогнана оперативная память, пусть и на чисто символические 142 МГц эффективной частоты. Штатное энергопотребление видеокарт производитель не указывает, но оба устройства наверняка выходят за пределы 185 Вт, заявленных для GeForce RTX 2070 FE.
Во всяком случае тот аспект, в котором видеокарта GIGABYTE явно не уступает GTX 2070 Founders Edition, — это розничные цены: на площадке Newegg просят $599 за базовую AORUS GeForce RTX 2070 и $620 за версию XTREME. В России, напротив, цены начинаются с 46 865 руб., а это даже меньше, чем стоимость Founders Edition в официальном магазине NVIDIA. С другой стороны, самые доступные модификации GeForce RTX 2070, которые только можно найти на торговых площадках США и в московских интернет-магазинах, продаются за $500 либо 36 581 руб. Да и видеокарты прошлого поколения заметно упали в цене, после того как в продаже появились GeForce 20-й серии — вплоть до $470 за GeForce GTX 1080 и $449 за Vega 64. Российский рынок эту коррекцию принимает с опозданием, у нас GeForce RTX 2070 оказывается самым выгодным предложением в своей категории производительности, тогда как GTX 1080 и Vega 64 пока только начали терять в цене.
⇡#Конструкция
Пусть графический процессор TU106 относится к третьему эшелону чипов Turing, фактические характеристики кремния задают совсем иные требования к обвязке видеокарт, нежели у GP106. С такими габаритами, как у AORUS GeForce RTX 2070 XTREME, система охлаждения вполне смогла бы обслужить и более мощные GPU. По высоте видеокарта занимает три полных слота расширения, но большая часть объема приходится вовсе не на радиатор, а на блок вентиляторов. Разработчики поместили внутрь пластиковой рамы три крыльчатки диаметром 100 мм, но длину устройства удалось сэкономить за счет того, что ребра вентиляторов имеют разую высоту и их окружности пересекаются. Центральный вентилятор вращается по часовой стрелке, а боковые — против, благодаря чему снижается турбулентность воздушного потока. К счастью, столь сложная конструкция защищена от повреждений перекладинами кожуха, ведь посторонний предмет, попавший в лопасти, может мгновенно привести в негодность все три крыльчатки.
Когда видеокарта включена, каждый вентилятор окружен ярким ободком, который пропадает, как только кулер переходит в пассивный режим. Раскрыть иллюзию не так уж просто, ведь здесь нет ни прозрачных колец, ни спрятанных под вентиляторами источников света. На самом деле, в одну из лопастей крыльчатки встроен RGB-светодиод, синхронизированный с тахометром вентилятора таким образом, что человек видит разноцветные полоски, медленно ползущие вокруг центра вращения.
Окошки с логотипом AORUS в торце и на задней поверхности кожуха имеют собственную подсветку. Оттенок и режим работы всех светодиодов регулируются фирменным ПО AORUS Engine. Вот только для того, чтобы постоянно лицезреть это великолепие, владельцу устройства GIGABYTE понадобится не только корпус с прозрачным окном, но и райзер PCI Express, позволяющий смонтировать видеокарту параллельно системной плате.
Охлаждение компонентов PCB выполняет радиатор, скрепленный пятью тепловыми трубками. В то время как иные производители используют для передачи тепла с кристалла GPU полированное основание, а подчас даже испарительную камеру, GIGABYTE предпочитает прямой контакт между чипом и расплющенными концами тепловых трубок. Для чипов памяти GDDR6 и компонентов регулятора напряжения (причем не только полевых транзисторов, но и дросселей с конденсаторами) к оребрению припаяны отдельные пластины. Даже алюминиевый щиток на задней стороне печатной платы участвует в охлаждении текстолита под микросхемами RAM.
⇡#Печатная плата
Первое, что бросается в глаза на PCB этой видеокарты, — семь разъемов для вывода изображения (три DisplayPort, три HDMI и USB Type-C с интерфейсом DisplayLink), в то время как GeForce RTX 2070 Founders Edition и большинство партнерских видеокарт имеют лишь пять. Но не все так просто: сам графический процессор способен одновременно использовать четыре выхода, а на плате нет коммутатора видеосигнала для того, чтобы преодолеть это ограничение. В итоге пользователю всегда доступны только три разъема — DisplayPort, HDMI и USB. Оставшиеся четыре разделены на два блока: активна либо пара DisplayPort, либо два HDMI — в зависимости от того, к какому блоку подключено устройство вывода изображения. Причем сменить конфигурацию на лету нельзя, активный блок разъемов определяется при перезагрузке компьютера.
Напряжение на видеокарту подается по шести- и восьмиконтактному разъемам, что в комбинации с силовыми линиями слота PCI-Express обеспечивает резерв мощности в 300 Вт. VRM содержит 10 фаз питания графического процессора и две — чипов GDDR6 (GeForce RTX 2070 Founders Edition ограничена формулой 6+2). На текстолите пустуют места для распайки элементов двух дополнительных фаз питания GPU — по всей видимости, такая же плата, но с полностью укомплектованным VRM, лежит в основе модели AORUS GeForce RTX 2070 WATERFORCE. Как и в Founders Edition, здесь используются только твердотельные конденсаторы и полевые транзисторы с интегрированным драйвером, а также сразу два ШИМ-контроллера uPI uP9512P (разработчики не пошли по простому пути удвоения фаз), которые умеют варьировать число активных фаз для поддержания высокого КПД во всем диапазоне потребляемой мощности.
Микросхемы памяти с маркировкой 8SA77 D9WCW выпущены на фабрике Micron и характеризуются пропускной способностью 14 Гбит/с на контакт. Говорят, что NVIDIA уже применяет аналогичные чипы Samsung в потребительских видеокартах семейства Turing, но нам такие устройства пока не попадались.