Рубрика «xeon» - 2

В 2017 году AMD в очередной раз приоткрыла ящик Пандоры, выпустив на рынок mainstream процессоры с количеством ядер больше четырёх, при этом с производительностью на ядро хотя бы сравнимой с современными процессорами Intel при равных частотах. Полного паритета не вышло, но полутора-двукратного разрыва в зависимости от типа нагрузки, как во времена FX-ов, уже нет. В синтетике производительность ядер Ryzen примерна равна производительности ядер Ivy Bridge (3xxx). Ход оказался довольно таки сильным, так что синей команде пришлось спешно выпускать шестиядерники на обновлённом 1151. К чему это я? А собственно к тому, что с прошлого года шести и более ядерные процессоры с быстрыми ядрами перебрались в потребительский сегмент из узкой HEDT ниши. Кроме всего прочего это значит, что массовое ПО наконец всё же начали оптимизировать под многоядерные многопоточные CPU.

Что такое современный массовый 6-8-ядерный процессор? Это частота 3.5-4.5GHz, относительно быстрая межъядерная шина той или иной архитектуры, двухканальная память DDR4 с частотой 2.4+ GHz. При этом ядра того же Ryzen рекордов производительности на такт не бьют. А что если… вместо современной и достаточно дорогой платформы взять старую 2011 платформу Intel, благо сейчас предложение списанных серверных процессоров линеек E5 v1 и v2 под этот сокет явно превышает спрос? Тем более предприимчивые китайцы, увидев такую ситуацию, оперативно освоили массовый выпуск материнских плат под эту платформу, а остальные комплектующие, процессор с памятью, стоят на вторичном рынке сравнительно недорого да и старению особо не подвержены. Пропускная способность регистровой DDR3 памяти пониже будет на один канал, чем у DDR4, но зато и каналов памяти на этой платформе четыре.

Платформы Ryzen у меня под рукой нет, поэтому будем сравнивать имеющиеся конфиги, все относящиеся к поколения Ivy Bridge. В общем-то сравниваются малосравнимые в своё время (по крайней мере по цене) платформы, но время всех уравнивает.Читать полностью »

Не так давно у меня произошёл очередной разговор с коллегой на извечную тему: "по ссылке, или по значению". В результате возникла данная статья. В ней я хочу изложить результаты моего исследования по этой и смежным темам. Далее будут рассмотрены:

  • Регистры и их назначение при вызове функций.
  • Передача и возврат простых типов и структур.
  • Как передача по ссылке и по значению влияют на оптимизации тела функции компилятором.
  • Как используется место при многочисленных вызовах функций.
  • Механизм виртуальных вызовов.
  • Оптимизация хвостовых вызовов и рекурсии.
  • Инициализация структур, массивов и векторов.

Осторожно! Статья содержит большое количество кода на C++ и ассемблере (с комментариями), а также множество таблиц с оценками производительности.

Читать полностью »

Вдвое мощней за те же деньги! Intel Xeon E5 против E3-серии - 1Не так давно мы публиковали статью Сравнение производительности процессоров Intel разных поколений, в которой представлены результаты тестирования 8-ядерных процессоров Intel Xeon E5. С тех пор, по акции, было продано несколько сотен серверов на базе процессоров V1/V2, которые стали достойным аналогом E5-2620V4/2630V3 в таких задачах как: сервер баз данных, терминальный сервер, видеонаблюдение и пр. Но, к сожалению, модельный ряд был ограничен только 2-процессорными платформами, что накладывало дополнительную финансовую нагрузку при использовании 1-процессорных конфигураций. Большое количество запросов побудило нас разработать бюджетную модель 1-процессорного сервера/рабочей станции, которая должна существенно выигрывать по производительности у платформ на базе Xeon E3/Core i7, и при этом конкурировать с ними по цене.
Читать полностью »

Когда компания производит новые железки и обеспечивает гиков по всему миру всякой хай-тэк вкусняшкой с высокими скоростями, низкими задержками и прочими прелестями высокопроизводительного рая — это, безусловно, круто и двигает всё IT в целом вперёд.

Новые пушки для старого дредноута: сверхбыстрая DDR3 в 2017 году - 1

Но знаете, что ещё круче? Когда крупные производители не забывают про платформы прошлого поколения, которые до сих пор актуальны. Набор высокоскоростной HyperX Predator DDR 3 работает на частотах до 2400 МГц из коробки — не у всякой DDR4 такие скорости есть. Посмотрим, что внутри. ;)
Читать полностью »

AMD анонсировала 32-ядерный серверный процессор Naples - 1
Двухпроцессорный сервер AMD Naples поддерживает до 4 ТБ оперативной памяти (по 16 модулей DIMM на процессор), обмен данными между памятью и одним ЦПУ происходит на скорости 170 ГБ/с

Две недели назад компания AMD представила семейство десктопных процессоров Ryzen 7, которые уже поступили в продажу. Вторым этапом применения архитектуры Zen должны стать серверные процессоры, а третьим этапом — мобильные APU со встроенными видеоускорителями.

Сейчас пришло время для этапа № 2. На серверном рынке и в дата-центрах AMD собирается так же всколыхнуть рынок и потеснить гегемонию Intel Xeon, как она сделала с десктопными процессорами. Вчера AMD анонсировала высокопроизводительные серверные процессоры Naples на той же архитектуре Zen x86.
Читать полностью »

Оценка и оптимизация производительности вычислений на многоядерных системах. Часть 2 - 1
Данная публикация является переводом второй части статьи Characterization and Optimization Methodology Applied to Stencil Computations инженеров компании Intel. В предыдущей части была описана методология для оценки максимальной производительности, которая может быть получена при использовании какого-либо алгоритма на конкретной платформе на примере довольно распространенного вычислительного ядра, используемого при решении 3D акустического изотропного волнового уравнения. Эта часть описывает серию шагов по оптимизации исходного кода для получения производительности, близкой к ожидаемой отметке.
Читать полностью »

Оценка и оптимизация производительности вычислений на многоядерных системах - 1
Данная публикация является переводом первой части статьи Characterization and Optimization Methodology Applied to Stencil Computations инженеров компании Intel. Эта часть посвящена анализу производительности и построению roofline модели на примере довольно распространенного вычислительного ядра, которая позволяет оценить перспективы оптимизации приложения на данной платформе.
Читать полностью »

Xeon Phi: Почему сопроцессоры используют для создания торговых приложений - 1

В нашем блоге на Хабре мы много пишем о разработке торговых роботов и построении инфраструктуры для онлайн-трейдинга. В прошлых материалах мы рассмотрели тему использования FPGA и GPU, а сегодня, речь пойдет о создании торговых приложений с помощью сопроцессоров Xeon Phi.

Современные фондовые биржи транслируют информацию о ситуации на рынке с помощью специальных обработчиков потоков (feed handlers), которые содержат информацию о котировках акций и приказах на покупку и продажу. С ростом числа заявок и количества торгуемых финансовых инструментов, производительность торговых систем также должна драматическим образом увеличиваться — иначе неизбежны задержки в торговле, что часто неприемлемо.

Кроме того многие биржи транслируют данные в различных форматах, включая мультикаст-трансляцию и point-to-point передачу по TCP/IP. Сложность работы с проприетарными финансовыми протоколами приводит к тому, что в некоторых случаях финансовые компании и частные HFT-трейдеры предпочитают не разрабатывать собственные программные обработчики потоков финансовых данных, а использовать коммерческие «железные» решения для повышения производительности своих приложений.Читать полностью »

Новинки от Intel - 1С 18 августа на Intel Developer Forum 2015 было представлено сразу несколько новинок: это новая микроархитектура Skylake, накопители Optane, новый форм-фактор материнских плат 5×5 и несколько устройств Интернета вещей.

Skylake

5 августа были продемонстрированы два процессора — первые представители новой микроархитектуры Skylake. Это был не полноценный анонс, а два продукта линейки. Вторую (но не последнюю) порцию данных о Skylake Intel выдала 18 августа. «Скайлейк» — это «так» 14-нанометрового техпроцесса. «Тиком» был Broadwell, в котором в основном шло уменьшение размера элементов на схеме и переход с 22 нм на 14.
Читать полностью »

До сих пор этот год был интересным на рынке серверного оборудования. Мы с любопытством наблюдали за тем как лидирующие производители отрасли наращивали мощности и улучшали масштабируемость своих продуктов, желая заработать на рыночном конвейере и жажде клиентов понизит свои затраты.

Десятка топовых серверов и обновлений 2015-го года - 1

В первом полугодии многие корпоративные гиганты (Dell, EMC, Lenovo, IBM и Oracle) представили общественности свои новые, порой даже революционные продукты. Давайте же ознакомимся с тем, чем же они хотели нас поразить на этот раз.Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js