Рубрика «gpu» - 2

Как подружить PyTorch и видеокарты AMD с помощью pytorch_dlprim

2024-08-20 в 9:00, admin, рубрики: amd, gpu, opencl, pytorch, ruvds_статьи

Когда начинаешь изучать или использовать машинное обучение, то думаешь, как приспособить те устройства, которые есть в наличии, чтобы снизить свои траты на вход. И, в частности, обладатели довольно мощных старых карт AMD (типа AMD Fury), на которых легко идут довольно тяжёлые игры типа Cyberpunk 2077 или Atomic Heart, сталкиваются с тем, что эти GPU бесполезны для PyTorch и других фреймворков машинного обучения. Да и самые современные карты AMD 7900-й серии работают с PyTorch только из под Linux. Также есть редкие карты других брендов, типа Intel Arc или китайские, которые хотелось бы использовать для машинного обучения.

Итак, в этой статье я приведу подход, который в некоторых случаях может помочь. Он сыроват, но других работающих вариантов под PyTorch я не нашёл. Итак, речь пойдёт о проекте израильского разработчика Артёма Бейлиса (Тонких) pytorch_dlprim.
Читать полностью »

Как управлять миром шестиугольных призм на GPU

2024-07-08 в 9:01, admin, рубрики: 3d, c++, glsl, gpu, GPU вычисления, minecraft

Как управлять миром шестиугольных призм на GPU - 1

Недавно я реализовал очень необычную задумку — демонстрацию Minecraft-подобного движка с игровой логикой, выполняющейся полностью на GPU.

Как и зачем я это сделал, и как дошёл до жизни такой, я поведаю в этой статье.

Внимание, в статье есть много скриншотов!

Читать полностью »

Яндекс разработал и выложил в опенсорс YaFSDP — инструмент для ускорения обучения LLM и сокращения расходов на GPU

2024-06-11 в 9:00, admin, рубрики: gpu, llm, ml, open source, машинное обучение, опенсорс яндекса, языковые модели, яндекс

Сегодня мы выкладываем в опенсорс наш новый инструмент — алгоритм YaFSDP, который помогает существенно ускорить процесс обучения больших языковых моделей.

В этой статье мы расскажем о том, как можно организовать обучение больших языковых моделей на кластере и какие проблемы при этом возникают. Рассмотрим альтернативные методы ZeRo и FSDP, которые помогают организовать этот процесс. И объясним, чем YaFSDP отличается от них.

Читать полностью »

В поисках самой мощной видеокарты! Тестируем А100 и А6000 Ada на большой языковой модели

2024-03-12 в 12:27, admin, рубрики: gpu, selectel, Видеокарты, выделенные серверы

Большие языковые модели (LLM) произвели настоящую революцию в мире ML. Все больше компаний стремятся так или иначе извлечь из них пользу. Например, в Selectel мы оцениваем рациональность развертывания частной LLM для помощи сотрудникам техподдержки в поиске ответов на вопросы клиентов. Эту задачу мы решили совместить с тестом нового железа — видеокарты Ada с 48 ГБ RAM. В соперники ей выбрали А100 на 40 ГБ.

Сразу оговоримся, что нормально обучить LLM на одной GPU практически невозможно, но в качестве теста производительности такая задача вполне подходит. Под катом рассказываем, как мы проводили тест-драйв двух GPU и к каким выводам пришли.Читать полностью »

Сам написал, сам погонял: Как я написал 3D-гонки «на жигулях» за неделю, полностью с нуля?

2023-10-06 в 8:01, admin, рубрики: 3d, 3d графика, bodyawm_ништячки, bodyawm_программирование, d3d, direct3d9, DirectX, Gamedev, gpu, OpenGL, timeweb_статьи, автоваз, ваз, геймдев, гонки, графика, жигули, игры, ненормальное программирование

Статьи про инди-разработку игр — это всегда интересно и занимательно. Но статьи про разработку игр с нуля, без каких-либо игровых движков — ещё интереснее! У меня есть небольшой фетиш, заключающийся в разработке минимально играбельных 3D-демок, которые нормально работали бы даже на железе 20-летней давности. Полтора года назад, в мае 2022 года, я написал демку гоночной игры с очень знакомым всем нам сеттингом — жигули, девятки, десятки, и всё это даже с тюнингом! В этой статье я расскажу вам о разработке 3D-игр практически с нуля: рендерер, менеджер ресурсов, загрузка уровней и граф сцены, 3D-звук, ввод и интеграция физического движка. Интересна подробнейшая хаброторная статья о разработке игры с нуля? Тогда добро пожаловать!Читать полностью »

Июньский дайджест нового серверного оборудования

2023-07-07 в 10:58, admin, рубрики: gpu, selectel, Блог компании Selectel, диски, железо и электроника, Компьютерное железо, облачные сервисы, оперативная память, Процессоры

Производители оборудования каждый день засыпают нас новостями о новинках и изменениях в продуктах. Для того, чтобы оставаться на волне, мы в Selectel следим за этими новостями, а подходящее и актуальное железо внедряем и используем в наших дата-центрах.
Мне показалось интересным рассмотреть ряд «‎железных» новостей, а также кратко рассказать об опыте и планах использования некоторых новинок.

Заинтересовало? Тогда приглашаю под кат.
Читать полностью »

FlexGen на практике: получится ли запустить тяжелую модель без мощной видеокарты

2023-05-04 в 10:12, admin, рубрики: flexgen, gpu, Блог компании Selectel, Видеокарты, инструмент, Компьютерное железо, машинное обучение, оптимизация, текстовые модели

От таких штук нас обещает избавить FlexGen при работе с текстовыми моделями.

Ранее я рассказывал про создание виртуальной подруги на основе текстовой модели GPT-J, которую можно развернуть локально. Ожидаемый недостаток этой идеи — большие «аппетиты» текстовых моделей по отношению к вычислительным ресурсам. Собственно, мой последний эксперимент состоялся только благодаря карточке A100 в сервере.

В конце февраля группа исследователей опубликовала FlexGen — решение для запуска масштабных текстовых моделей в среде с ограниченными ресурсами. В теории оно должно помочь обойтись ресурсами персонального ПК, без добавления мощных видеокарт. Под катом расскажу о FlexGen и его применимости в существующем проекте.Читать полностью »

Название имеет значение: как получить оптимизацию, переименовав браузер

2023-03-16 в 9:01, admin, рубрики: amd, chromium, gpu, Блог компании Яндекс, браузер, браузеры, Видеокарты, Драйвер, Клиентская оптимизация, Компьютерное железо, оптимизация

Читать полностью »

Сколько стоит содержать виртуальную девушку? Создаем подругу, записывающую кружочки в Telegram, с помощью 4 нейросетей

2023-02-21 в 9:37, admin, рубрики: AI, c++, gpu, python, Блог компании Selectel, боты для мессенджеров, Видеокарты, виртуальный друг, искусственный интеллект, нейросети

Не так давно в интернете появилась душещипательная история, как пользователь hackdaddy8000 сперва создал виртуальную девушку, а затем усыпил ее. Моральный и мемный аспект этого события обсуждали в комментариях под новостями.

Поговорим о технической стороне. Как повторить этот шедевр и можно ли обойтись без сервисов OpenAI, которые сложно оплатить в России? И главное — сколько придется инвестировать в виртуальную подругу.
Читать полностью »

Как можно ускорить Python сегодня

2022-12-31 в 10:00, admin, рубрики: cupy, gpgpu, gpu, intel, numba, python, ruvds_перевод, scikit-learn, Блог компании RUVDS.com, многопоточность, ускорители вычислений

Python не перестаёт удивлять многих своей гибкостью и эффективностью. Лично я являюсь приверженцем С и Fortran, а также серьёзно увлекаюсь C++, поскольку эти языки позволяют добиться высокого быстродействия. Python тоже предлагает такие возможности, но дополнительно выделяется удобством, за что я его и люблю.

Этот инструмент способен обеспечивать хорошее быстродействие, поскольку имеет в арсенале ключевые оптимизированные библиотеки, а также возможность динамической компиляции основного кода, который предварительно не компилировался. Однако скорость Python значительно падает, когда дело доходит до обработки крупных датасетов или более сложных алгоритмов. В текущей статье мы разберём:

Почему столь важно думать о «будущем разнородных вычислений».
Две ключевых сложности, которые необходимо преодолеть в открытом решении.
Параллельное выполнение задач для более эффективного задействования CPU.
Использование ускорителя для дополнительного повышения быстродействия.

Один только третий пункт позволил увеличить быстродействие в 12 раз притом, что четвёртый позволяет добиться ещё большего за счёт ускорителя. Эти простые техники могут оказаться бесценными при работе с Python, когда требуется добиться дополнительного ускорения программы. Описанные здесь приёмы позволяют нам уверенно продвигаться вперёд без длительного ожидания результатов.Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «gpu» - 2

Как подружить PyTorch и видеокарты AMD с помощью pytorch_dlprim

Как управлять миром шестиугольных призм на GPU

Яндекс разработал и выложил в опенсорс YaFSDP — инструмент для ускорения обучения LLM и сокращения расходов на GPU

В поисках самой мощной видеокарты! Тестируем А100 и А6000 Ada на большой языковой модели

Сам написал, сам погонял: Как я написал 3D-гонки «на жигулях» за неделю, полностью с нуля?

Июньский дайджест нового серверного оборудования

FlexGen на практике: получится ли запустить тяжелую модель без мощной видеокарты

Название имеет значение: как получить оптимизацию, переименовав браузер

Сколько стоит содержать виртуальную девушку? Создаем подругу, записывающую кружочки в Telegram, с помощью 4 нейросетей

Как можно ускорить Python сегодня

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «gpu» - 2

Новости

Актуальные темы

Архив