Рубрика «large language model»

Выбираем open-source эмбеддинг-модель для AI-консультанта на русском (RAG-подход)

2025-10-31 в 8:12, admin, рубрики: AI, embeddings, large language model, qdrant, rag

Разрабатывая AI-консультантов и ассистентов на базе RAG-архитектуры, работающих с корпоративными базами знаний на русском языке, мы столкнулись с вопросом: какие открытые эмбеддинг-модели дают лучший баланс качества семантического поиска на русском и скорости работы. Особенно это актуально, когда запросы и документы русскоязычные, но внутри часто попадаются фрагменты кода (например, SQL или Python) и англоязычной терминологии.

Мы прогнали 9 open-source эмбеддинг-моделей через несколько тестов, включающих проверки:

Умение распознать тематику близких по значению русских слов (омонимы);
Читать полностью »

Какой табличный формат LLM понимают лучше всего? (Результаты по 11 форматам)

2025-10-13 в 12:32, admin, рубрики: AI, csv, gpt-4, json, large language model, llms, markdown, OpenAI, XML, yaml

Команда AI for Devs подготовила перевод статьи о том, в каком формате лучше всего передавать таблицы LLM. Исследование охватило 11 популярных форматов — от CSV и JSON до YAML и Markdown. Результаты неожиданны: разница в точности достигает 16 процентных пунктов, а выбор формата напрямую влияет на стоимость инференса и стабильность RAG-пайплайнов.

Читать полностью »

Читаем вместе. ИИ в AppSec: могут ли LLM работать с уязвимым кодом

2025-10-01 в 10:59, admin, рубрики: claude, dataset, gpt-4, large language model, llm, reasoning, безопасная разработка, искусственный интеллект, промптинг, уязвимый исходный код

Привет!

Читать полностью »

Селективная генерализация: улучшение возможностей при сохранении alignment

2025-09-19 в 11:01, admin, рубрики: AI, alignment, Fine-tuning, large language model, llm, lora, ИИ, Парето

TL;DR: Мы провели бенчмаркинг семи методов, направленных на предотвращение эмерджентного рассогласования и других форм некорректного обобщения с использованием ограниченного объёма alignment-данных. Мы демонстрируем устойчивый трейдофф между способностями модели и согласованием, подчеркивая необходимость более эффективных методов для снижения этого конфликта. Простое включение alignment-данных в микс обучающих данных оказывается недостаточным для предотвращения рассогласования, однако простое наложение KL Divergence penalty на alignment-данные показывает лучшие результаты, чем более сложные подходы.

Читать полностью »

RAG и векторные БД: НЕ Сизифов LLM на Java и Spring Ai

2025-08-28 в 14:29, admin, рубрики: java, large language model, open AI, qdrant, retrieval augmented generation, ruvds_статьи, semantic search, spring ai, vector database, исскуственный интеллект

Привет! Меня зовут Бромбин Андрей, и сегодня я разберу на практике, что такое RAG-системы и как они помогают улучшать поиск. Покажу, как использовать Spring AI, векторные базы данных и LLM. Ты получишь теорию и пример реализации на Java и Spring Boot — от идеи до работающего сервиса. Без сложных формул — только чёткие объяснения и код.

Читать полностью »

Как строить умных AI-агентов: уроки Context Engineering от Manus

2025-08-28 в 11:00, admin, рубрики: AI, ai agent, ai assistants, few-shot prompting, large language model, llm, manus, MCP, nlp, rag

В самом начале проекта Manus перед нашей командой встал ключевой вопрос: обучать ли end-to-end агентную модель, используя open-source foundation-модели, или же строить агента поверх возможностей in-context learning Читать полностью »

ИИ под контролем: Guardrails как щит от рисков в агентных системах

2025-08-14 в 11:00, admin, рубрики: AI, ai agent, genai, large language model, llm, ИИ, ии чат-бот, ии-ассистент, искусственный интеллект

Вы когда-нибудь задавали вопрос AI-чатботу и получали в ответ что-то вроде: «Я не могу с этим помочь»Читать полностью »

Как мы построили свой инструмент для работы с LLM

2025-07-02 в 8:01, admin, рубрики: AI, large language model, llm, llm-модели, большие языковые модели, инструментарий, искусственный интеллект, обработка данных, языковые модели

Привет, Habr! Меня зовут Алексей Рудак, и я основатель компании Lingvanex — компании, которая уже 7 лет делает решения для машинного перевода и распознавания речи.

В этой статье я бы хотел рассказать про наш инструмент для тренировки языковых моделей, который шесть лет назад родился из простого набора скриптов. Но постепенно усложняяcь, он стал включать в себя функции разметки данных, фильтрации датасетов, генерации данных и тестирования. В какой-то момент инструмент стал настолько функциональный, что я решил сделать ему красивый UI и назвать его - Data Studio.

Итак, что же такое Data Studio ?

Data StudioЧитать полностью »

Возвращаюсь к работе мозгом после месяцев кодинга с LLM

2025-05-20 в 7:36, admin, рубрики: claude, deepseek, gemini, large language model, llm, большие языковые модели

TLDR: LLM неплохо справляются с кодингом, но в больших проектах они пишут запутанный сумбур. Я уменьшил объём использования ИИ при кодинге и вернулся к работе головой, ручке и бумаге.

Читать полностью »

Обзор техник RAG: Retrieval Augmented Generation

2025-04-24 в 11:15, admin, рубрики: deeplearning, DL, large language model, llm, machinelearning, ml, natural language processing, nlp, rag, retrieval augmented generation

Рассмотрим техники построения и улучшения RAG систем: от нарезания текстов на куски, до продвинутых способов улучшения качества ответа.

Этим блогом можно пользоваться как шпаргалкой для проектирования своего RAG-а и/или для подготовки к собеседованиям.

Все полезные ссылки и материалы, на которые я опирался будут в конце.

Что такое RAG и зачем нужен

RAG - это фреймворк взаимодействия предобученной LLM с базой знаний. То есть при ответе LLM на запрос пользователя модель отвечает используя актуальный контекст из базы и свои pre-trained знания.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «large language model»

Выбираем open-source эмбеддинг-модель для AI-консультанта на русском (RAG-подход)

Какой табличный формат LLM понимают лучше всего? (Результаты по 11 форматам)

Читаем вместе. ИИ в AppSec: могут ли LLM работать с уязвимым кодом

Селективная генерализация: улучшение возможностей при сохранении alignment

RAG и векторные БД: НЕ Сизифов LLM на Java и Spring Ai

Как строить умных AI-агентов: уроки Context Engineering от Manus

ИИ под контролем: Guardrails как щит от рисков в агентных системах

Как мы построили свой инструмент для работы с LLM

Возвращаюсь к работе мозгом после месяцев кодинга с LLM

Обзор техник RAG: Retrieval Augmented Generation

Что такое RAG и зачем нужен