Рубрика «CUDA»

Бэктестинг торговых стратегий на Python с помощью Numba. Когда перевод расчетов на GPU действительно оправдан?

2025-03-24 в 9:24, admin, рубрики: backtesting, CUDA, gpu, numba, python, производительность

Введение

Бэктестинг — ключевой процесс в алгоритмической торговле. Он позволяет проверить стратегию на исторических данных, прежде чем запускать её в реальной торговле. Однако, чем больше данных и сложнее логика стратегии, тем дольше времени занимают вычисления. Особенно если стратегия анализирует тиковые данные и требуется протестировать множество комбинаций гиперпараметров стратегии, время вычислений может расти экспоненциально.

В этой статье мы разберем, как реализовать бэктестинг на чистом Python, посмотрим сколько времени могут занимать вычисления, а также попробуем найти разные способы оптимизации.

Читать полностью »

Разгон Мандельброта: SIMD с бубнами, OpenMP и CUDA

2025-03-22 в 10:16, admin, рубрики: c++, CUDA, openmp, simd, мандельброт, оптимизация

Построение множества Мандельброта — классический пример чрезвычайно параллельной задачи (embarrassingly parallel problem).

Вначале мы разберем наивную реализацию, поиграемся с интринсиками (intrinsics) и, не теряя переносимости, заставим компилятор генерировать нам SIMD-инструкции. Далее добавим многопоточность и в заключение обесценим все наши старания несколькими строчками на CUDA.

Разгон Мандельброта: SIMD с бубнами, OpenMP и CUDA - 1

Читать полностью »

Сортировка слиянием на CUDA

2025-03-19 в 13:01, admin, рубрики: CUDA, merge sort, Nvidia, ruvds_переводы, алгоритмы сортировки, сортировка слиянием

Я решил изучить, как повысится производительность алгоритмов сортировки при их реализации на CUDA. Моя цель — понять, как можно использовать мощь параллельных вычислений для ускорения алгоритмов сортировки.

В качестве тестового я возьму алгоритм сортировки слиянием (merge sort), потому что он удобно разбивает задачу на меньшие подзадачи с двумя равными половинами, что хорошо подходит для параллельных вычислений.Читать полностью »

Как взломать Harley Davidson. Часть 2

2025-01-15 в 0:00, admin, рубрики: crc64, CUDA, exploit, Nvidia, obd2, uds

В прошлой части дизассемблировали код прошивки ECM последнего поколения мотоциклов в Ghidra, подправили его и запустили на тестовой плате Aurix TC275 Lite Kit, получили возможность обмениваться с ним сообщениями CAN и отлаживать его в winIDEA. Теперь настало время посмотреть, что же там интересного.

Глава 1. Цифровая шина мотоцикла

Читать полностью »

Intel oneAPI: обзор амбизициозной платформы для ИИ и научных вычислений от Intel для всех архитектур и производителей

2024-12-18 в 10:10, admin, рубрики: CUDA, GPU вычисления, intel, oneapi, oneapi toolkit, ruvds_статьи, гетерогенные вычисления, искусственный интеллект, платформа для разработчиков, портирование приложений

Представьте, что вы можете запустить одну и ту же программу на любом компьютере, будь то ваш домашний ПК, игровая консоль или даже суперкомпьютер. Звучит фантастично? Intel с 2020 года работает над тем, чтобы сделать это реальностью с помощью платформы oneAPI. Эта инновация обещает не только изменить то, как мы используем искусственный интеллект, но и упростить процесс разработки программного обеспечения. Вместо того чтобы адаптировать код под каждую платформу, разработчики смогут писать универсальные приложения, которые будут эффективно работать на самых различных устройствах, обеспечивая при этом высокую производительность. Более того, уже сейчас на платформу портируют код CUDA, вроде проектов как интерфейс Stable Diffusion 1111.

Но что это значит для обычного пользователя?Читать полностью »

Интеграция поддержки Nvidia в контейнерах

2024-12-10 в 10:30, admin, рубрики: cdi, container runtime, cri-o, CUDA, intel, kubernetes, Nvidia, runtimeclass, Видеокарты, контейнеры

Видеокарты играют важную роль в современных компьютерах и используются не только для игр, но и других задач. Видеокарты в современном мире применяются как ускорители вычислений. В них одновременно выполняется множество вычислений, что делает их особенно эффективными для специфических задач, таких как нейронные сети. Поэтому видеокарты сейчас востребованы и активно применяются. В dBrain.cloud мы используем видеокарты Nvidia с платформой CUDA, которая позволяет писать код, исполняемый на графическом адаптере.

Читать полностью »

Оптимизация ядра WebGPU для перемножения матриц и достижения производительности свыше 1ТФЛОПС

2024-12-05 в 21:57, admin, рубрики: CUDA, высокая производительность, оптимизация, шейдеры

Пишем Surfgrad, высокопроизводительную библиотеку для автоматического дифференцирования выражений при помощи WebGPU.

Я работаю в компании Nomic, и многие из моих коллег заняты созданием больших TSNE-подобных визуализаций, работающих в браузере. При визуализации таких двумерных карт возникает две проблемы: проецировать эти конструкции (напр. TSNE и UMAP Читать полностью »

Практика: мой опыт интеграции более 50 нейронных сетей в один проект

2024-11-07 в 8:30, admin, рубрики: CUDA, github, lifehack, onnxruntime, python, torch, исскуственный интеллект, лайфхаки, нейронные сети, опыт

Полтора года назад я начал работу над проектом с открытым исходным кодом, который постепенно рос и развивался. Вдохновившись проектом AUTOMATIC1111, на тот момент только появившимся, я добавлял всё больше функционала и возможностей. Сегодня мой проект включает более 50 нейронных сетей, каждая из которых выполняет свою уникальную задачу. В этой статье я делюсь практическими лайфхаками и выводами, которые помогли мне на этом пути. Надеюсь, что они будут полезны и вам.

Читать полностью »

Как AMD выкрутилась и научилась воспроизводить операции ядер CUDA на своих видеокартах. История ROCm

2024-11-05 в 13:01, admin, рубрики: amd, CUDA, radeon, rocm, ruvds_статьи, аппаратное обеспечение

Как AMD смогла обойти монополию NVIDIA в мире ИИ? История о том, как команда AMD создала ROCm — технологию, позволяющую запускать CUDA-приложения на своих видеокартах. Как компании удалось совершить этот технологический прорыв? Разберём путь от первых экспериментов с HSA до современных версий ROCm, поддерживающих самые популярные фреймворки для машинного обучения. А главное — в конце расскажу, как установить ROCm на Windows и Linux, избежав всех подводных камней. Читать полностью »

Вычисления с GPU-ускорением на Python

2024-10-26 в 8:05, admin, рубрики: c++, cpu, CUDA, gpu, Nvidia, pycuda, python, timeweb_статьи_перевод, Процессоры

❯ Для чего нужен GPU?

Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «CUDA»

Бэктестинг торговых стратегий на Python с помощью Numba. Когда перевод расчетов на GPU действительно оправдан?

Введение

Разгон Мандельброта: SIMD с бубнами, OpenMP и CUDA

Читать полностью »

Сортировка слиянием на CUDA

Как взломать Harley Davidson. Часть 2

Глава 1. Цифровая шина мотоцикла

Intel oneAPI: обзор амбизициозной платформы для ИИ и научных вычислений от Intel для всех архитектур и производителей

Интеграция поддержки Nvidia в контейнерах

Оптимизация ядра WebGPU для перемножения матриц и достижения производительности свыше 1ТФЛОПС

Практика: мой опыт интеграции более 50 нейронных сетей в один проект

Как AMD выкрутилась и научилась воспроизводить операции ядер CUDA на своих видеокартах. История ROCm

Вычисления с GPU-ускорением на Python

❯ Для чего нужен GPU?

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «CUDA»

Введение

Глава 1. Цифровая шина мотоцикла

❯ Для чего нужен GPU?

Новости

Актуальные темы

Архив