Современные GPU — одни из самых сложных полупроводниковых решений в мире. Достаточно сказать, что GPU V100 содержит 21,1 млрд транзисторов, разместившихся на площади 815 мм²!
Само собой, бесконечно наращивать сложность GPU не выйдет. Специалисты Nvidia уже сейчас задумываются над тем, как решить данную проблему в обозримом будущем. И они считают, что одним из вариантов является использование нескольких отдельных кристаллов для создания единого графического процессора (Multi-Chip-Module GPU; MCM-GPU). То есть речь о тех же принципах, которые используются в некоторых современных процессорах с большим количеством ядер.
Над проектом специалисты Nvidia работали совместно с учёными из Университета штата Аризона, Техасского университета и центра Barcelona Supercomputing Center. Исследователи предлагают многочиповую компоновку в качестве способа обойти закон Мура.
Специалисты предлагают «разбить» графический процессор на достаточно простые базовые модули GPU Module (GPM) и уже из них, используя высокоскоростные межблочные соединения, формировать итоговый графический процессор.
Конечно, специалисты использовали программные эмуляторы, чтобы понять, насколько целесообразен подобный подход. В частности, был создан виртуальный Multi-Chip-Module GPU, включающий 256 мультипроцессоров (Streaming Multiprocessor; SM). Он оказался на 45,5% производительнее самого большого на сегодняшний день монолитного GPU со 128 мультипроцессорами. Кроме того, он на 26,8% быстрее конфигурации из двух видеокарт с теми же 256 мультипроцессорами в сумме. Если же говорить о гипотетическом монолитном GPU с 256 блоками SM, создать который на сегодняшний день невозможно, разница в производительности составила бы не более 10%.
Конечно, всё это пока исследования, и даже не самой Nvidia, а её специалистов совместно с учёными различных университетов. Однако в не самом далёком будущем нас вполне могут ожидать именно такие графические процессоры.
Источник:
Nvidia