Главная

Рубрика «llm» - 5

BABILong — бенчмарк для оценки LLM на больших контекстах

2024-12-16 в 7:24, admin, рубрики: benchmark, llm, бенчмарки, длинный контекст

Привет! Мы — команда Memory‑Augmented models в составе лаборатории Cognitive AI Systems AIRI. В ходе своих исследований мы стараемся разобраться, насколько хорошо LLM могут обрабатывать большой объем данных и решать задачи на основе них.

Разработчики современных языковых моделей соревнуются в длине контекста, и счёт уже идёт на миллионы токенов. Но насколько эффективно LLM пользуются информацией из этого контекста?

Чтобы выяснить это, мы вместе с коллегами из МФТИ и Лондонского института Математических Наук создали новый бенчмарк под названием BABILong, который привезли Читать полностью »

Бенчмарк SLAVA: шаг к мировоззренческому суверенитету

2024-12-15 в 12:27, admin, рубрики: llm, LLM в социальной инженерии, nlp

SLAVA: бенчмарк социально-политического ландшафта и ценностного анализа.

В предыдущей статье мы обсудили важный вопрос Читать полностью »

Как выбрать лучшую модель для кодирования: использование SLM и локальных LLM

2024-12-12 в 16:30, admin, рубрики: llm, SLM, большие языковые модели, локально размещённые LLM, малые языковые модели

Привет, на связи Юлия Рогозина, аналитик бизнес-процессов Шерпа Роботикс. Сегодня я перевела для вас статью, посвященную использованию SLM и локальных LLM. Читать полностью »

Обучение и fine-tuning моделей простым языком: зачем, как, где

2024-12-12 в 15:01, admin, рубрики: Fine-tuning, llm, lora, lora-адаптеры, дообучение, квантизация

В нашей работе с большими языковыми моделями (LLMs), один из самых популярных вопросов касается их дообучения. Каждый второй клиент спрашивает, нужно ли проводить дополнительное обучение модели.

В большинстве случаев ответ — нет, это не требуется. Современные LLM достаточно хороши для многих коммерческих задач даже без до-обучения. Например, для бота, который помогает заказывать цветы в цветочном магазине. Более того, у них обычно нет данных для этого, и нет, 20 примеров диалогов которые у них есть (и даже 200) не подходят.

Читать полностью »

Генерация кода при помощи ИИ сделает вас плохим программистом

2024-12-12 в 14:02, admin, рубрики: AI, ai-ассистент, chatgpt, copilot, llm, автоматизация, будущее программирования, ии-помощники, искусственный интеллект, Программирование

Читать полностью »

Оценка RAG: Полное руководство по модульному тестированию RAG в CI-CD

2024-12-12 в 9:59, admin, рубрики: DeepEval, llm, rag, RAGA

Читать полностью »

Промптинг: действительно полезное руководство

2024-12-12 в 8:31, admin, рубрики: AI, gpt, llm, prompt, tutorial, ИИ, промптинг

Вы знали, что промпт — это не просто текст, который вы вводите в строку? Каждый запрос - это почти магия, где буквально каждое слово влияет на результат. В этой статье — практическое руководство, как стать настоящим волшебником

Промптинг: действительно полезное руководство - 1

Введение

Читать полностью »

Сможет ли ИИ принять правильное решение? Ответы нейросетей на моральные вызовы

2024-12-11 в 13:31, admin, рубрики: gemini, GigaChat, gpt, llama, llm, qwen, yandexgpt, искусственный интеллект

Читать полностью »

ACM RecSys — 2024: тренды и доклады с крупнейшей конференции по ML в рекомендательных системах

2024-12-11 в 7:00, admin, рубрики: llm, recsys, конференция, нейросети, рекомендательные системы

Читать полностью »

5 лучших фреймворков с открытым исходным кодом для оценки больших языковых моделей (LLM) в 2024 году

2024-12-10 в 9:30, admin, рубрики: arize ai, DeepEval, llm, mlflow, rag, ragas

Коротко о главном

«У меня такое чувство, что решений для оценки LLM больше, чем проблем, связанных с их оценкой», — сказал Дилан, руководитель отдела ИИ в компании из списка Fortune 500.

Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Обсуждаемое

Рекомендуем

Рубрика «llm» - 5

BABILong — бенчмарк для оценки LLM на больших контекстах

Бенчмарк SLAVA: шаг к мировоззренческому суверенитету

Как выбрать лучшую модель для кодирования: использование SLM и локальных LLM

Обучение и fine-tuning моделей простым языком: зачем, как, где

Генерация кода при помощи ИИ сделает вас плохим программистом

Оценка RAG: Полное руководство по модульному тестированию RAG в CI-CD

Промптинг: действительно полезное руководство

Введение

Сможет ли ИИ принять правильное решение? Ответы нейросетей на моральные вызовы

ACM RecSys — 2024: тренды и доклады с крупнейшей конференции по ML в рекомендательных системах

5 лучших фреймворков с открытым исходным кодом для оценки больших языковых моделей (LLM) в 2024 году

Коротко о главном

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «llm» - 5

Введение

Коротко о главном

Новости

Актуальные темы

Архив