Stencil buffer используется для маскировки отражений в тех местах где их на самом деле нет. Техника Stencil используется в OpenGL и DirectX. Перед применением алгоритма производится Stencil тест и в тех местах где нет изображения пиксельный шейдер не будет рендерится. Таким образом мы пресекаем лишнюю работу.
Читать полностью »
Рубрика «CUDA» - 7
Пример реализации Stencil буфера с помощью CUDA
2012-09-17 в 15:38, admin, рубрики: CUDA, stencil, Анимация и 3D графика, метки: CUDA, stencilУскоряем node.js: нативные модули и CUDA
2012-09-10 в 5:55, admin, рубрики: CUDA, high performance, node.js, nodejs, Веб-разработка, высокая производительность, метки: CUDA, high performance, nodejsИногда разработчики различных веб-проектов сталкиваются с необходимостью обработки больших объемов данных или использованием ресурсозатратного алгоритма. Старые инструменты уже не дают необходимой производительности, приходится арендовать/покупать дополнительные вычислительные мощности, что подталкивает к мысли переписать медленные участки кода на C++ или других быстрых языках.
В этой статье я расскажу о том, как можно попробовать ускорить работу Node.JS (который сам по себе считается довольно быстрым). Речь пойдет о нативных расширениях, написанных с помощью C++.
Читать полностью »
Два гиганта в одной программе — Nvidia CUDA и MPI
2012-09-02 в 14:38, admin, рубрики: CUDA, linux, mpi, ubuntu 12.04, Программирование, метки: CUDA, linux, mpi, ubuntu 12.04 Здравствуйтее, в этой статье я хочу рассказать о взаимодействии двух технологий MPI(mpich2) и NVIDIA CUDA. Упор я хочу сделать именно на саму структуру программы и настройку вышеописанных технологий для работы в одной программе. И так поехали…
Читать полностью »
Запускаем Java-программы на GPU
2012-08-14 в 11:17, admin, рубрики: CUDA, gpgpu, gpu, java, Компиляторы, Параллелизм, метки: CUDA, gpu, java, ПараллелизмНа Github выложен исходный код компилятора Rootbeer, с помощью которого можно почти любой Java-код запустить на графическом процессоре, а также легко разделить Java-программу на фрагменты для CPU/GPU.
Компилятор опубликован под свободной лицензией GNU GPLv3, он прошёл тщательное тестирование и вполне пригоден для использования. По словам автора, это самый продвинутый транслятор байткода Java на платформу CUDA. Судя по всему, OpenCL тоже поддерживается.
Автор программы — преподаватель Сиракузского университета Фил Пратт-Желига (Phil Pratt-Szeliga).
Читать полностью »
Анализ возможностей массового аудита на основе утечки хешей из LinkedIn
2012-06-14 в 18:31, admin, рубрики: CUDA, sha1, Алгоритмы, брутфорс, информационная безопасность, перебор, радужные таблицы, релевантность, Соль, частотный анализ, метки: CUDA, sha1, брутфорс, перебор, радужные таблицы, релевантность, Соль, частотный анализНеделю назад утекла база хешей с LinkedIn, для других это событие может быть примечательным само по себе, но для меня, в первую очередь, это означает возможность провести анализ современных возможностей взлома паролей. И я не собираюсь рассказывать о том сколько раз слово «password» было встречено среди паролей и о том, сколько времени занимает перебор шестисимвольных комбинаций. Скорее буду пугать пользователей тем, насколько сложные пароли можно «взломать» за несколько часов. А программистам расскажу как это возможно эффективно реализовать, и в качестве небольшого подарка приложу программу, которую я написал для массового аудита. Присутствует и некоторый ликбез по использованию радужных таблиц с простыми выводами.
И так, за час удалось «восстановить» около 2.5 миллионов паролей на средней рабочей конфигурации, без специальных словарей и радужных таблиц. Среди найденных паролей присутствуют 16-символьные алфавитно-цифровые комбинации, и далеко не в единственном экземпляре.
Читать полностью »
Новый виток архитектуры CUDA
2012-05-26 в 20:44, admin, рубрики: CUDA, gpgpu, Kepler, высокая производительность, метки: CUDA, Kepler Всем привет!
В начале апреля я увидел анонс новой видеокарты от nVidia, с новым мажорным индексом compute capability – 3.0. Внимательно изучив спеки был удивлён – по всему выходило, что теперь ветвления будут приводить к самым худшим последствиям: большим потерям производительности. Мне нравилось, что от версии к версии ветвления играют всё меньшую роль, а Kepler показался в этом плане шагом назад. Мозгом я понимал, что такое вряд ли возможно и решил немного выждать.
И вот на этой неделе мне пришёл whitepaper по новой числодробилке на архитектуре Kepler и многое прояснил.
Читать полностью »
Nvidia для профессиональных 3D приложений
2012-04-23 в 10:47, admin, рубрики: CUDA, DirectX, firepro, firestream, GeForce, glsl, gpgpu, gpu, Nvidia, opencl, OpenGL, radeon, tesla, Анимация и 3D графика, видеокарта, высокая производительность, Железо, рендеринг, метки: CUDA, DirectX, firepro, firestream, GeForce, glsl, gpgpu, gpu, Nvidia, opencl, OpenGL, radeon, tesla, видеокарта, рендерингПол года назад я искал себе видеокарту, на которой я смог бы заниматься 3d моделированием, и рендерингом на GPU. В связи с появлением на рынке большого числе рендеров на CUDA мне не терпелось приобрести видеокарту с поддержкой CUDA, а именно Nvidia.
Как некоторые уже знают, Nvidia выставляет на продажу видеокарты нескольких моделей Geforce, Quadro, Tesla, ION, Tegra. В этом коротком сравнении упустим ION и Tegra, т.к. предназначены для мобильных устройств и слабые по производительности.
Нам нужна мощь!
Nvidia power...
Быстрое сжатие изображений по алгоритму JPEG на CUDA
2012-03-14 в 14:35, admin, рубрики: benchmark, cpu, CUDA, DCT, fpga, GeForce, gpgpu, gpu, HPC, Nvidia, opencl, parallel computations, RLE, высокая производительность, высокопроизводительные вычисления, обработка изображений, параллельные вычисления, метки: benchmark, cpu, CUDA, DCT, fpga, GeForce, gpgpu, gpu, HPC, Nvidia, opencl, parallel computations, RLE, высокопроизводительные вычисления, параллельные вычисленияКраткое содержание: Создан быстрый кодер FVJPEG для сжатия изображений по алгоритму JPEG на видеокартах NVIDIA. Значительное ускорение получено при распараллеливании алгоритма, его реализации и оптимизации с помощью технологии CUDA. По скорости сжатия кодер FVJPEG превосходит все существующие в настоящее время программные и аппаратные решения для компрессии изображений по алгоритму Baseline JPEG.
При сравнении алгоритмов сжатия изображений с потерями, практически всегда обсуждаются степень сжатия и качество получаемой картинки, а вот время компрессии почему-то считается второстепенным показателем. По всей видимости, для большинства приложенийЧитать полностью »