Немногим менее года назад на прилавках магазинов появились процессоры Ivy Bridge – первые микропроцессоры, изготовленные по технологии 22нм, и, что важнее, первые, использующие «tri-gate» транзисторы. По сравнению с предшественниками эти процессоры были ощутимо быстрее и потребляли совсем немного энергии. Но, в конечном счете, это была лишь очередная попытка выжать еще немного из материалов и технологии производства, уже почти достигнувших предела своих возможностей.
К счастью, есть другая развивающаяся технология, которой под силу продлить жизнь кремниевой электроники: трехмерная интеграция. Это технология, которая позволяет создавать системы с высокой степенью интеграции, путём вертикальной укладки друг на друга и соединения различных слоёв, в частности, полупроводниковых кристаллов. Например, можно взять кристалл памяти DRAM и поместить его сверху на кристалл микропроцессора. В результате, раньше находившиеся на расстоянии нескольких сантиметров части, теперь находятся менее чем в миллиметре друг от друга. Это сокращает энергопотребление – чем больше расстояние, тем сложнее передача данных, и увеличивает пропускную способность.
Потенциальные преимущества 3D-интеграции включают в себя многофункциональность, повышение производительности, снижение энергопотребления, миниатюризацию, удешевление и повышение надежности. Давайте попробуем разобраться чуть подробнее в том, что же собой представляет эта технология.
Мотивирующий пример из области недвижимости
Представьте, что вы и еще 10.000 человек проживаете в уютном коттеджном поселке из одноэтажных домиков. Сравните эту картину со сценарием, где то же число людей населяет одно высотное здание.
Какую территорию будет занимать каждое из этих поселений? Сколько времени Вам понадобится на то, чтобы нанести дружеский визит знакомому? Во сколько обойдется поддержание инфраструктуры такого поселения (дороги, электро- и водоснабжение и т.д.)? Уверен, что это умственное упражнение не вызовет трудностей, и не буду приводить ответы, в виду их очевидности.
Немного истории
Современный уровень развития технологии интеграции – это уже, по сути, третье её поколение.
Первоначально всё начиналось с попыток объединения двух кремниевых кристаллов на плоскости и упаковки их в единый корпус. Такой подход использовался, например, при производстве Pentium Pro – в 1997 году технология производства не позволяла интегрировать большой L2-кэш в кристалл процессорного ядра. Поэтому L2 кэш был выполнен как отдельный кристалл и находился в общем корпусе с процессорным кристаллом.
Частично открытый корпус Pentium Pro. Кристалл кэша – справа. Можно заметить, насколько регулярна его литография, по сравнению с процессорным ядром.
Удивительно, но спустя 15 лет данный подход живее всех живых, хоть и несколько изменился. Упоминаемая в литературе как «advanced packaging», его современная реализация предполагает использования кремниевой пластины-ретранслятора (transposer) как «мини-материнской платы», соединяющей несколько кристаллов. Приимущество такого подхода в том, что можно расположить кристаллы гораздо ближе, чем ранее, и при этом не надо вносить никаких изменений в их дизайн. Ожидается, что этот подход будет применяться в новых поколениях multi-GPU видеокарт от Nvidia и AMD.
Следующий шаг в развитии носит название 3d stacking. Хоть слои компонентов и располагаются один поверх другого, но соединения между слоями располагаются только по краям. Такой подход, например, давно и успешно использует компания Apple для соединения DRAM и CPU в разнообразных гаджетах.
3d stacking
Ну и последний шаг – 3d TSV (through-silicon via), характеризуется наличием сквозных соединений между слоями в произвольной точке. На данный момент массово применяется только для соединения с оптическими сенсорами в разнообразной цифровой фото/видео технике.
3d TSV
Факторы, влияющие на развитие 3d интеграции
Основные факторы, влияющие на развитие данной технологии, представлены на следующем рисунке. Остановимся на них подробнее.
Миниатюризация и уменьшение цены. Если вспомнить размеры микропроцессоров 10 лет назад, то очевидно, что при сохранении размеров они не вписались бы в формат современных гаджетов. Тех же телефонов, например. Казалось бы, уже более чем сорокалетнее исполнение закона Мура дает решение этой проблемы, эффективно уменьшая площадь с каждым поколением технологии производства. Но при этом не стоит забывать, что сложность устройств и число транзисторов в них растет, оказывая ровно противоположный эффект. Кроме того, стоимость производства растет примерно в 2.5 раза на каждый шаг от одного техпроцесса к другому. Как здесь поможет 3d интеграция?
Что касается размеров, исполнение того же количества транзисторов в нескольких вертикально расположенных слоях – более привлекательно с точки зрения линейных размеров. Тут всё просто.
Что касается цены – заметим, что хоть суммарная площадь кремния, используемого в устройстве, остается практически неизменной, но размер каждого отдельного кристалла уменьшается в разы. Это влияет на такой важный параметр, как долю выхода годных кристаллов. Поясню на примере: площадь кристалла процессора Itanium 2 составляет примерно 430мм2. Из-за столь внушительных размеров, лишь ~15% кристаллов, произведенных на одной кремниевой пластине («вафле») (~10 штук), функционируют. Чем больше площадь, тем больше вероятность того, что на ней встретится хотя бы один дефект изготовления. А стоимость изготовления одной пластины составляет порядка $6000. Нетрудно посчитать себестоимость одного кристалла для серверного микропроцессора. Для микропроцессоров, не относящихся к серверному рынку, выпуск целесообразен, если доля годных составляет не менее 90%. Что не в последнюю очередь достигается за счет гораздо меньшей площади. Таким образом, использование 3d интеграции позволит радикально снизить стоимость, в первую очередь для сложных устройств.
Intel Atom (Diamondville). Площадь 25мм2
Следующий фактор: соотношение производительности и энергопотребления. Рост вычислительной мощности приводит к росту требований к пропускной способности шины памяти. Что особенно актуально, например, для видеообработки и других мультимедиа задач. Чем ближе память физически расположена к микропроцессору, тем меньших усилий требует взаимодействие с ней: меньше задержки передачи данных и меньше помех, что позволяет расходовать меньше энергии на передачу данных. Сложно представить микросхему памяти, расположенную ближе к процессору, чем лежащую на нем сверху.
Немаловажный аргумент в пользу именно 3d TSV, а не просто 3d stacking'а: ширина шины памяти. Это обычно десятки, или даже сотни бит, и расположение шины такой разрядности в специально предназначенных для I/O областях – непростая задача. Использование же TSV дает в десятки раз большую плотность размещения выводов и позволяет «сэкономить» как на занимаемой площади, так и на потребляемой мощности. А еще, можно, например, увеличить разрядность шины и за счет этого понизить частоту, оставаясь на том же уровне производительности.
Новый стандарт памяти DRAM – Wide I/O, использующий TSV для соединения с памятью через 512-битную шину, практически удваивает пропускную способность по сравнению со стандартом LPDDR2 (Low-Power Double Data Rate 2), оставаясь на том же уровне энергопотребления.
Гетерогенная интеграция. Если речь идет об изготовлении какого-то устройства на поверхности кремниевой пластины, то встает вопрос о выборе технологических параметров. В рамках одной и той же технологии можно делать выбор между, например, быстродействием транзисторов и величиной тока утечки. Кроме того, если речь идет о чем-то более мелкосерийном, чем микропроцессоры, то вопрос выбора технологии тоже непрост. Использование новейшего техпроцесса влекут за собой необходимость переделывать проектирование на физическом уровне для уже использовавшихся ранее IP блоков. Это ухудшает такой показатель, как переиспользование IP, влечет денежные и, что важнее, временные затраты.
Использование 3d интеграции позволяет объединять в одно устройство части, изготовленные с разными технологическими параметрами, или даже с использованием разных технологических процессов. Это позволяет во многих случаях получить преимущество. Для сравнения, приведу таблицу, показывающую оптимальные характеристики для собственно ячеек памяти и связанной с ними логики. Как видно, отличий множество.
На этом пока всё. В следующей части я постараюсь рассказать о проблемах связанных с 3d интеграцией (а то преимуществ много, а где же их воплощение?) и закончить рассказ.
Автор: yurav