Данная публикация является переводом второй части статьи Characterization and Optimization Methodology Applied to Stencil Computations инженеров компании Intel. В предыдущей части была описана методология для оценки максимальной производительности, которая может быть получена при использовании какого-либо алгоритма на конкретной платформе на примере довольно распространенного вычислительного ядра, используемого при решении 3D акустического изотропного волнового уравнения. Эта часть описывает серию шагов по оптимизации исходного кода для получения производительности, близкой к ожидаемой отметке.
Читать полностью »
Рубрика «roofline»
Оценка и оптимизация производительности вычислений на многоядерных системах. Часть 2
2016-03-23 в 5:59, admin, рубрики: c++, HPC, roofline, software optimization, xeon, xeon phi, Блог компании Intel, высокая производительность, ПрограммированиеОценка и оптимизация производительности вычислений на многоядерных системах
2016-02-29 в 6:09, admin, рубрики: HPC, roofline, software optimization, xeon, xeon phi, Блог компании Intel, высокая производительность, параллельное программирование, Программирование
Данная публикация является переводом первой части статьи Characterization and Optimization Methodology Applied to Stencil Computations инженеров компании Intel. Эта часть посвящена анализу производительности и построению roofline модели на примере довольно распространенного вычислительного ядра, которая позволяет оценить перспективы оптимизации приложения на данной платформе.
Читать полностью »