Самый быстрый компилятор aka compiler-benchmark

От переводчика: все началось с топика ^[1]на форуме D.

После оценки скорости компиляции D по сравнению с другими языками ^[2] мне было интересно, существует ли какой-нибудь язык, который компилируется в нативный код почти так же быстро или быстрее, чем D, за исключением C?
Если да, то скорее всего, он должен использовать бэкэнд, отличный от LLVM.
Я думаю, что Jai способен на это, но он еще не вышел в релиз.

Бенчмарки скорости компиляции различных комбинаций языков и компиляторов. Поддерживаемые языки:

Компиляторы в нативный код

C ^[3](gcc, clang и cproc ^[4]),
C++ ^[5] (g++ и clang++),
D ^[6](dmd ldmd2, и gdc),
Go ^[7](go и gccgo),
Swift ^[8](swiftc),
Rust ^[9](rustc),
Julia ^[10](julia).
Ada ^[11](gnatgcc),
Zig ^[12](zig),
V ^[13](v),
Vox ^[14](vox),
C3 ^[15](c3c),

Компиляторы в байт-код

OCaml ^[16](using ocamlopt),
C# ^[17] (mcs),
Java ^[18](javac).

Сколько-то из них может быть установлено на Ubuntu (проверено на 20.04) скриптом ./install-compilers-on-ubuntu-20.04.sh из этого репозитория.

Как это сделано

Бенчмарк запускается так

./benchmark 
    --function-count=$FUNCTION_COUNT 
    --function-depth=$FUNCTION_DEPTH 
    --run-count=5

для подходящих значений $FUNCTION_COUNT и $FUNCTION_DEPTH или просто

./benchmark

для значений по умолчанию.
Можно указать тесты выборочно, например

./benchmark --languages=C++,D,Rust

Это сгенерирует код в каталог generated и затем для каждой комбинации языка, типа операции и компилятора запустит поддерживаемые бенчмарки. В итоге на стандартный вывод выдается таблица в формате Markdown, показывающая результаты бенчмарка. Обратите внимание, что время компиляции в этой таблице в столбце Time [us/#fn] является нормализацией микросекунд к количеству сгенерированных тестовых функций, т.е делится на (args.function_count * args.function_depth).

GCC и Clang не выполняют все семантические проверки для C++ (потому что это слишком дорого). Это контрастирует с компиляторами D и Rust, которые выполняют все из них.

Пример сгенерированного кода

Чтобы понять, как работает генерация кода, мы можем, например, сделать следующее

./benchmark --function-count=3 --function-depth=2 --run-count=5

Это для C, сгенерирует файл generated/c/main.c содержащий

long add_long_n0_h0(long x) { return x + 15440; }
long add_long_n0(long x) { return x + add_long_n0_h0(x) + 95485; }

long add_long_n1_h0(long x) { return x + 37523; }
long add_long_n1(long x) { return x + add_long_n1_h0(x) + 92492; }

long add_long_n2_h0(long x) { return x + 39239; }
long add_long_n2(long x) { return x + add_long_n2_h0(x) + 12248; }

int main(__attribute__((unused)) int argc, __attribute__((unused)) char* argv[]) {
    long long_sum = 0;
    long_sum += add_long_n0(0);
    long_sum += add_long_n1(1);
    long_sum += add_long_n2(2);
    return long_sum;
}

Кэширование компиляторами

Числовые константы рандомизируются при каждом вызове. Это делает невозможным для любого компилятора использовать какой-либо механизм кэширования при последовательных вызовах с одними и теми же опциями компиляции. Это делается для того, чтобы сделать более справедливым сравнение между компиляторами с различными уровнями кэширования.

Например, механизм кэширования эталонного компилятора Go больше не может быть отключен опциями.

Дженерики

Для каждого языка $LANG, поддерживающего дженерики, наряду с main.$LANG будет сгенерирован дополнительный шаблонный исходный файл main_t.$LANG, эквивалентный содержимому main.$LANG, за исключением того, что все функции (кроме main) являются шаблонами. Этот шаблонный исходный файл также будет пробенчмаркан. Колонка Templated в таблице ниже показывает, использует ли компиляция шаблонированные функции или нет.

Прим.пер. Здесь не различаются дженерики и шаблоны, что есть большая разница, как справедливо заметили на форуме. Но пользователю языка это неважно — обычно в языке присутствует единственный механизм.

Выводы (из приведенного ниже проведенного бенчмарка)

Проверка и сборка Vox, по большому счёту, самая быстрая. В 3-4 раза быстрее своего ближайшего конкурента, dmd. Обратите внимание, что Vox, однако, является высокоэкспериментальным языком, не имеющим статуса официального релиза, с бэкэндом только для Windows и обладающим меньшим количеством языковых возможностей, чем большинство других языков, прошедших бенчмаркинг.

На втором месте находятся эталонный компилятор D dmd и cproc. Однако, обратите внимание, что cproc — это высокоэкспериментальный компилятор Си без встроенной поддержки препроцессора Си.

Производительность как GCC, так и Clang значительно ухудшается с каждым новым релизом (в настоящее время 8, 9, 10 в таблице ниже).

Шаблонный (дженерик) исходный код C++ проверяется примерно в 3 раза медленнее, чем не-шаблонный при использовании gcc-8, и примерно в 2.3 раза медленнее для gcc-10. Для clang++-10 замедление составляет примерно 1.6. Соответствующее замедление для шаблонов D (dmd) примерно в 2.5 раза. С другой стороны, интересно, что версию с дженериками Rust обрабатывает в 2-3 раза быстрее, чем не-дженерик версия.

JIT-компилятор Джулии (в настоящее время) очень нуждается в памяти. Максимально рекомендуемое произведение function-count и function-depth для Julia — 5000. Таким образом, при достижении этого максимума Джулия будет исключена из бенчмарка.

Оптимизирующий нативный компилятор OCaml ocamlopt очень медленный для больших входных файлов и поэтому отключается, когда произведение function-count и function-depth превышает 10000.

Пример запуска бенчмарка

Вывод на моем Intel Core i7-4710HQ CPU @ 2.50GHz × 8 с 16 GB памяти под Ubuntu 20.04 для вызова

./benchmark --function-count=200 --function-depth=450 --run-count=3

или же, используя для более быстрой генерации кода Pypy ^[19]3

pypy3 ./benchmark --function-count=200 --function-depth=450 --run-count=3

Результаты вывода в таблице ^[20]

От переводчика. Таблица, где свалено все подряд, показалась мне малочитаемой — пришлось даже порыть исходники, чтобы понять смысл. Потому я рассортировал и сделал графики различных сущностей — время полной сборки с генерацией объектных файлов отдельно от проверки синтаксиса против шаблонного/дженерик кода отдельно от нешаблонного. Итого 4 графика.
Посередине графика строка с коэффициентом относительно лидера. Этот коэффициент приведен отдельно среди всех проверок синтаксиса (с и без дженериков), и аналогично среди всех полных компиляций в бинарник.
Самый быстрый компилятор aka compiler-benchmark - 1

Самый быстрый компилятор aka compiler-benchmark - 2

Самый быстрый компилятор aka compiler-benchmark - 3
Значение для Ады — 5746,1

Шкала логарифмическая

Доделать

поддержку языка C3 ^[21]
время полной сборки и проверки синтаксиса собрать в одну строку в разные столбцы
добавить измерение потребляемой памяти с помощью Питоновского Subprocess
распараллелить вызовы проверки и сборки
добавить Fortran
добавить Pony

Ссылки

Время компиляции Go по сравнению с C++, D, Rust, Pascal (кросс-пост) ^[22]

Мнение от переводчика

Данный бенчмарк показывает только синтетический результат, бесконечно далекий от реальности. К примеру в том же D стандартная библиотека Phobos абсолютно шаблонизирована, что замедляет компиляцию даже простых программ, и чем больше кода — тем медленнее, притом нелинейно.

С другой стороны — не учитывается медлительность систем сборки при перепроверках билда, и кроме того — я переводил пример ^[23], где одна и та же программа потребовала 12 пакетов зависимостей для D и около 230 для Rust, что делает сравнение времени в общем случае невозможным.

По ссылке же из соответствующего раздела можно увидеть не только сравнение с другими языками, отсутствующими тут, но и то, как далеко шагнуло компиляторостроение за 4 года в плане сборки огромных программ.

Автор: Siemargl

Источник ^[24]

Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/programmirovanie/358813

Ссылки в тексте:

[1] топика : https://forum.dlang.org/post/peqlrnqtinuuuokfixts@forum.dlang.org

[2] оценки скорости компиляции D по сравнению с другими языками: https://github.com/nordlow/compiler-benchmark

[3] C : https://en.wikipedia.org/wiki/C_(programming_language)

[4] cproc: https://github.com/michaelforney/cproc

[5] C++: http://www.cplusplus.org/

[6] D : https://dlang.org/

[7] Go : https://golang.org/

[8] Swift : https://swift.org/

[9] Rust : https://www.rust-lang.org/

[10] Julia : https://julialang.org/

[11] Ada : https://en.wikipedia.org/wiki/Ada_(programming_language)

[12] Zig : https://ziglang.org/

[13] V : https://vlang.io/

[14] Vox : https://github.com/MrSmith33/vox

[15] C3 : https://github.com/c3lang/c3c

[16] OCaml : https://ocaml.org/

[17] C#: https://docs.microsoft.com/en-us/dotnet/csharp/

[18] Java : https://www.oracle.com/java/

[19] Pypy : https://www.pypy.org/

[20] таблице: https://github.com/nordlow/compiler-benchmark#sample-run-output

[21] C3: https://www.c3-lang.org/setup/

[22] Время компиляции Go по сравнению с C++, D, Rust, Pascal (кросс-пост): https://www.reddit.com/r/golang/comments/55k7n4/go_compilation_times_compared_to_c_d_rust_pascal/

[23] переводил пример: https://habr.com/ru/post/517790/

[24] Источник: https://habr.com/ru/post/527874/?utm_source=habrahabr&utm_medium=rss&utm_campaign=527874

Нажмите здесь для печати.