Потихоньку приближается 2026 год, который принесет много интересных событий в сфере ИИ (по крайней мере, так думаю я). Но и за 2025-й мы получили огромное количество отличных моделей в свое распоряжение. С одной стороны, здорово, что теперь можно легко создать текст, программу, изображение, видео и звук. С другой же стороны, такой стремительный прогресс в области искусственного интеллекта существенно повлиял и на аппаратное обеспечение - особенно на видеокарты и память.
Рубрика «gpu»
Железный голод: почему ИИ съедает GPU и память
2025-12-26 в 13:48, admin, рубрики: AI, gpu, HBM, OpenAI, Samsung, ssd, дефицит, ИИ, нейросеть, ОЗУКак TPU от Google меняют экономику масштабного ИИ и ставят под угрозу монополию NVidia
2025-12-11 в 14:57, admin, рубрики: blackwell, Google, gpu, ironwood, Nvidia, TPU, ИИ, искусственный интеллектГайд по базовому окружению для AI без знаний в MLOps
2025-11-28 в 8:21, admin, рубрики: AI, cioud, dedicated, gpu, selectel, выделенные серверы, инфраструктура, облачные сервисы, серверы
Слышите из каждого утюга про «эй-ай» и хотите разобраться в этом тренде? Или просто собрались попробовать запустить ML- или AI-проект, но вас пугают настройки серверов и облаков?
GPU Intel Arc на Raspberry Pi и non-x86 платформах — запуск, настройка и анализ производительности
2025-11-16 в 12:00, admin, рубрики: gpu, intel, linux, llm, Raspberry Pi, selectel
«Золотая рыбка, хочу LLM без GPU»: как собрать Inference-сервер на CPU
2025-11-14 в 7:00, admin, рубрики: cpu, gpu, llm, ml, selectel, большие языковые модели, инференс, машинное обучение, ПроцессорыКак работает компьютер. Простая статья для начинающих программистов
2025-11-09 в 15:58, admin, рубрики: api, gpu, векторные операции, виртуальная память, интерпретаторы, компиляция, кэш, Параллелизм, процессор, регистрВ этой статье изложено всё, что нужно знать об устройстве компьютера с точки зрения программиста. А именно:
-
для чего нужен тактовый генератор, регистры, кэши и виртуальная память
-
что такое архитектура процессора
-
что такое машинный код и код ассемблера
-
чем отличается компиляция в машинный код в C, C++ или Rust от компиляции в байт-код виртуальной машины в языках типа Java и C#; в чём их отличие от интерпретируемых языков вроде JavaScript или Python
-
что такое динамические и статические библиотеки (.dll/.so, .lib/.a); что такое фреймворк
-
что такое API и web-API
Production AI сервер за ₽0: полный гайд по сборке ML-станции для Stable Diffusion на б-у комплектующих
2025-10-31 в 14:20, admin, рубрики: AI, CUDA, deeplearning, DIY, gpu, hardware, machinelearning, python, pytorch, stablediffusion
Я это сделал. За один день.
Часть 1: Аппаратная часть
Выбор видеокарт: RTX 2060 vs RTX 1060
Как загрузить GPU на максимум. Разбираем узкие места в инфраструктуре для ИИ
2025-10-30 в 6:32, admin, рубрики: cpu, gpu, Видеокарты, диск, инфраструктура, оперативная память, пайплайн, производительность, Процессоры, сетиПредставим, что вы запустили в облаке или на своем оборудованиии обучение модели. Выбрали конфигурацию с A100, H100 или L40S, может, даже с RTX 4090. Запускаете обучение модели, ждете, что процесс пойдет как по маслу. Но вместо э��ого в инструментах мониторинга видите, что GPU загружен на 40–60%, а то и меньше.
Причина не в «кривом коде» и не в том, что GPU «не тянут». Проблема глубже: производительность AI-кластера определяется не пиковыми терафлопсами, а самым слабым звеном в цепочке ввода-вывода. Даже самый быстрый GPU беспомощен, если данные не успевают до него «доехать». Он просто ждет.
Как я экономлю на инференсе LLM-модели в облаке и не теряю в качестве
2025-10-23 в 15:30, admin, рубрики: gpu, kv-cache, llm, vllm, VRAM, большие языковые модели, веса, инференс моделей, квантовые моделиЕсли вы читаете этот текст, скорее всего, вы уже пробовали запустить LLM самостоятельно и, вполне вероятно, столкнулись с одной из типичных проблем:
«Заказал GPU, загрузил модель, а она не влезла, хотя по расчетам памяти должно было хватить».
«Платим за A100, а реально используем лишь 30% ее мощности».
Привет, на связи Павел, ML-инженер в Cloud.ru. Я прошел через эти проблемы сам, поэтому не понаслышке знаю, как это может раздражать.



