Рубрика «llm» - 5

Привет! Мы — команда Memory‑Augmented models в составе лаборатории Cognitive AI Systems AIRI. В ходе своих исследований мы стараемся разобраться, насколько хорошо LLM могут обрабатывать большой объем данных и решать задачи на основе них.

Разработчики современных языковых моделей соревнуются в длине контекста, и счёт уже идёт на миллионы токенов. Но насколько эффективно LLM пользуются информацией из этого контекста?

Чтобы выяснить это, мы вместе с коллегами из МФТИ и Лондонского института Математических Наук создали новый бенчмарк под названием BABILong, который привезлиЧитать полностью »

SLAVA: бенчмарк социально-политического ландшафта и ценностного анализа.

SLAVA: бенчмарк социально-политического ландшафта и ценностного анализа.

В предыдущей статье мы обсудили важный вопросЧитать полностью »

Как выбрать лучшую модель для кодирования: использование SLM и локальных LLM - 1

Привет, на связи Юлия Рогозина, аналитик бизнес-процессов Шерпа Роботикс. Сегодня я перевела для вас статью, посвященную использованию SLM и локальных LLM. Читать полностью »

В нашей работе с большими языковыми моделями (LLMs), один из самых популярных вопросов касается их дообучения. Каждый второй клиент спрашивает, нужно ли проводить дополнительное обучение модели.

В большинстве случаев ответ — нет, это не требуется. Современные LLM достаточно хороши для многих коммерческих задач даже без до-обучения. Например, для бота, который помогает заказывать цветы в цветочном магазине. Более того, у них обычно нет данных для этого, и нет, 20 примеров диалогов которые у них есть (и даже 200) не подходят.

Читать полностью »

Вы знали, что промпт — это не просто текст, который вы вводите в строку? Каждый запрос - это почти магия, где буквально каждое слово влияет на результат. В этой статье — практическое руководство, как стать настоящим волшебником

Промптинг: действительно полезное руководство - 1

Введение

Читать полностью »

5 лучших фреймворков с открытым исходным кодом для оценки больших языковых моделей (LLM) в 2024 году - 1

Коротко о главном

«У меня такое чувство, что решений для оценки LLM больше, чем проблем, связанных с их оценкой», — сказал Дилан, руководитель отдела ИИ в компании из списка Fortune 500.

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js