Рубрика «большие языковые модели»

А король-то голый! Как написать свой Claude Code в 200 строках кода

2026-01-10 в 12:54, admin, рубрики: claude code, cursor, github copilot, llm, большие языковые модели, ии-помощники, кодинг-агенты

Современные кодинг-помощники кажутся магией. Достаточно описать нужное вам на хотя бы немного понятными словами, после чего они сами читают файлы, редактируют проект и пишут работающий код.

Читать полностью »

Ускоряем LLM по максимуму. Как я создал кросс-платформенный Flash Attention с поддержкой Turing+ архитектур и не только

2025-12-16 в 18:37, admin, рубрики: attention, FlashAttention, llm, Transformers, triton, большие языковые модели, внимание, машинное обучение, оптимизация производительности, трансформеры

Читать полностью »

Ждёт ли OpenAI спасения от государства?

2025-12-09 в 13:29, admin, рубрики: Nvidia, OpenAI, аналитика рынка, большие языковые модели, БЯМ, инвестиции, компании, тренды, финансы, экономика

В последние недели на рынках усилилась тревога по поводу устойчивости бума искусственного интеллекта. Отчасти её подогрела та мысль, которую допустила Читать полностью »

Логический компас для искусственного интеллекта

2025-12-08 в 3:59, admin, рубрики: большие языковые модели, механизм внимания, рассуждения нейросети, сгенерированные тексты, трансформеры

Читать полностью »

Технический обзор моделей DeepSeek от V3 до V3.2

2025-12-06 в 11:04, admin, рубрики: deepseek, llm, архитектура llm-приложений, архитектуры AI, большие языковые модели, дипсик

Три самые постоянные вещи в мире — оливье с мандаринами на Новый год, желание начать новую жизнь с понедельника и то, что если выходит статья Себастьяна Рашки, то я делаю ее качественный перевод на русский.

Эта технически глубокая статья известного исследователя LLM о том, как эволюционировали флагманские модели с открытыми весами от DeepSeek и обзор DeepSeek V3.2.

Читать полностью »

За последний месяц я детально отслеживал каждую статью об искусственном интеллекте в ведущих западных tech-изданиях. 200 статей из TechCrunch, VentureBeat и MIT Technology Review за 26 дней — в среднем почти 8 новостей об ИИ каждый день. Цель эксперимента была проста: понять, совпадает ли то, о чём громче всего кричат медиа, с реальными возможностями ИИ-моделей.

Спойлер: не совпадает. И разрыв между медийным шумом и реальностью оказался весьма значительным.

Методология исследования

Я мониторил три ключевых источника tech-новостей:

TechCrunch — крупнейшее издание о стартапах и технологиях
VentureBeatЧитать полностью »

Как я экономлю на инференсе LLM-модели в облаке и не теряю в качестве

2025-10-23 в 15:30, admin, рубрики: gpu, kv-cache, llm, vllm, VRAM, большие языковые модели, веса, инференс моделей, квантовые модели

Если вы читаете этот текст, скорее всего, вы уже пробовали запустить LLM самостоятельно и, вполне вероятно, столкнулись с одной из типичных проблем:

«Заказал GPU, загрузил модель, а она не влезла, хотя по расчетам памяти должно было хватить».

«Платим за A100, а реально используем лишь 30% ее мощности».

Привет, на связи Павел, ML-инженер в Cloud.ru. Я прошел через эти проблемы сам, поэтому не понаслышке знаю, как это может раздражать.

Читать полностью »

RL (RLM): Разбираемся вместе

2025-10-19 в 20:24, admin, рубрики: llm, PPO, Proxi, reinforcement learning, RL, RLHF, Алгоритмы, большие языковые модели, искуственный интеллект, машинное обучение

Всем привет! Недавно я познакомился с курсом по глубокому обучению с подкреплением от HuggingFace Deep Reinforcement Learning Course и захотел сделать выжимку самого интересного. Эта статья — своего рода шпаргалка по основам Reinforcement Learning (RL) и одному из ключевых алгоритмов — PPO, который лежит в основе тонкой настройки современных LLM (Large Language Models).

Вы наверняка слышали про такие модели, как o1 от OpenAI или QwQ от Alibaba. Их "рассуждающие" способности во многом — результат применения RL. Давайте разберемся, как обычный принцип обучения, известный по играм вроде AlphaGo, помогает языковым моделям стать умнее.Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «большие языковые модели»

А король-то голый! Как написать свой Claude Code в 200 строках кода

Ускоряем LLM по максимуму. Как я создал кросс-платформенный Flash Attention с поддержкой Turing+ архитектур и не только

Ждёт ли OpenAI спасения от государства?

Логический компас для искусственного интеллекта

Технический обзор моделей DeepSeek от V3 до V3.2

Как LinkedIn масштабировал поиск людей на 1,3 млрд пользователей

«Золотая рыбка, хочу LLM без GPU»: как собрать Inference-сервер на CPU

Хайп vs реальность: что tech-медиа пишут об ИИ и кто реально лучший в 2025?

Методология исследования

Как я экономлю на инференсе LLM-модели в облаке и не теряю в качестве

RL (RLM): Разбираемся вместе