Рубрика «gpu»

Железный голод: почему ИИ съедает GPU и память

2025-12-26 в 13:48, admin, рубрики: AI, gpu, HBM, OpenAI, Samsung, ssd, дефицит, ИИ, нейросеть, ОЗУ

Потихоньку приближается 2026 год, который принесет много интересных событий в сфере ИИ (по крайней мере, так думаю я). Но и за 2025-й мы получили огромное количество отличных моделей в свое распоряжение. С одной стороны, здорово, что теперь можно легко создать текст, программу, изображение, видео и звук. С другой же стороны, такой стремительный прогресс в области искусственного интеллекта существенно повлиял и на аппаратное обеспечение - особенно на видеокарты и память.

Читать полностью »

NVIDIA открыла исходный код KAI Scheduler — планировщика, ранее использовавшегося в платформе Run:ai

2025-12-24 в 13:38, admin, рубрики: AI, gpu, kubernetes, machinelearning, mlops, Nvidia, opensourse, runai, scheduler

Читать полностью »

Как TPU от Google меняют экономику масштабного ИИ и ставят под угрозу монополию NVidia

2025-12-11 в 14:57, admin, рубрики: blackwell, Google, gpu, ironwood, Nvidia, TPU, ИИ, искусственный интеллект

Читать полностью »

Гайд по базовому окружению для AI без знаний в MLOps

2025-11-28 в 8:21, admin, рубрики: AI, cioud, dedicated, gpu, selectel, выделенные серверы, инфраструктура, облачные сервисы, серверы

Слышите из каждого утюга про «эй-ай» и хотите разобраться в этом тренде? Или просто собрались попробовать запустить ML- или AI-проект, но вас пугают настройки серверов и облаков?

Читать полностью »

GPU Intel Arc на Raspberry Pi и non-x86 платформах — запуск, настройка и анализ производительности

2025-11-16 в 12:00, admin, рубрики: gpu, intel, linux, llm, Raspberry Pi, selectel

*Intel Arc Pi GPU B580 AI Llama.cpp LLM.*

Читать полностью »

«Золотая рыбка, хочу LLM без GPU»: как собрать Inference-сервер на CPU

2025-11-14 в 7:00, admin, рубрики: cpu, gpu, llm, ml, selectel, большие языковые модели, инференс, машинное обучение, Процессоры

Читать полностью »

Как работает компьютер. Простая статья для начинающих программистов

2025-11-09 в 15:58, admin, рубрики: api, gpu, векторные операции, виртуальная память, интерпретаторы, компиляция, кэш, Параллелизм, процессор, регистр

В этой статье изложено всё, что нужно знать об устройстве компьютера с точки зрения программиста. А именно:

для чего нужен тактовый генератор, регистры, кэши и виртуальная память
что такое архитектура процессора
что такое машинный код и код ассемблера
чем отличается компиляция в машинный код в C, C++ или Rust от компиляции в байт-код виртуальной машины в языках типа Java и C#; в чём их отличие от интерпретируемых языков вроде JavaScript или Python
что такое динамические и статические библиотеки (.dll/.so, .lib/.a); что такое фреймворк
что такое API и web-API
Читать полностью »

Production AI сервер за ₽0: полный гайд по сборке ML-станции для Stable Diffusion на б-у комплектующих

2025-10-31 в 14:20, admin, рубрики: AI, CUDA, deeplearning, DIY, gpu, hardware, machinelearning, python, pytorch, stablediffusion

Я это сделал. За один день.

Часть 1: Аппаратная часть

Выбор видеокарт: RTX 2060 vs RTX 1060

Читать полностью »

Как загрузить GPU на максимум. Разбираем узкие места в инфраструктуре для ИИ

2025-10-30 в 6:32, admin, рубрики: cpu, gpu, Видеокарты, диск, инфраструктура, оперативная память, пайплайн, производительность, Процессоры, сети

Представим, что вы запустили в облаке или на своем оборудованиии обучение модели. Выбрали конфигурацию с A100, H100 или L40S, может, даже с RTX 4090. Запускаете обучение модели, ждете, что процесс пойдет как по маслу. Но вместо э��ого в инструментах мониторинга видите, что GPU загружен на 40–60%, а то и меньше.

Причина не в «кривом коде» и не в том, что GPU «не тянут». Проблема глубже: производительность AI-кластера определяется не пиковыми терафлопсами, а самым слабым звеном в цепочке ввода-вывода. Даже самый быстрый GPU беспомощен, если данные не успевают до него «доехать». Он просто ждет.

Читать полностью »

Как я экономлю на инференсе LLM-модели в облаке и не теряю в качестве

2025-10-23 в 15:30, admin, рубрики: gpu, kv-cache, llm, vllm, VRAM, большие языковые модели, веса, инференс моделей, квантовые модели

Если вы читаете этот текст, скорее всего, вы уже пробовали запустить LLM самостоятельно и, вполне вероятно, столкнулись с одной из типичных проблем:

«Заказал GPU, загрузил модель, а она не влезла, хотя по расчетам памяти должно было хватить».

«Платим за A100, а реально используем лишь 30% ее мощности».

Привет, на связи Павел, ML-инженер в Cloud.ru. Я прошел через эти проблемы сам, поэтому не понаслышке знаю, как это может раздражать.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «gpu»

Железный голод: почему ИИ съедает GPU и память

NVIDIA открыла исходный код KAI Scheduler — планировщика, ранее использовавшегося в платформе Run:ai

Как TPU от Google меняют экономику масштабного ИИ и ставят под угрозу монополию NVidia

Гайд по базовому окружению для AI без знаний в MLOps

GPU Intel Arc на Raspberry Pi и non-x86 платформах — запуск, настройка и анализ производительности

«Золотая рыбка, хочу LLM без GPU»: как собрать Inference-сервер на CPU

Как работает компьютер. Простая статья для начинающих программистов

Production AI сервер за ₽0: полный гайд по сборке ML-станции для Stable Diffusion на б-у комплектующих

Часть 1: Аппаратная часть

Выбор видеокарт: RTX 2060 vs RTX 1060

Как загрузить GPU на максимум. Разбираем узкие места в инфраструктуре для ИИ

Как я экономлю на инференсе LLM-модели в облаке и не теряю в качестве