Главная

Рубрика «Fine-tuning»

Обучение и fine-tuning моделей простым языком: зачем, как, где

2024-12-12 в 15:01, admin, рубрики: Fine-tuning, llm, lora, lora-адаптеры, дообучение, квантизация

В нашей работе с большими языковыми моделями (LLMs), один из самых популярных вопросов касается их дообучения. Каждый второй клиент спрашивает, нужно ли проводить дополнительное обучение модели.

В большинстве случаев ответ — нет, это не требуется. Современные LLM достаточно хороши для многих коммерческих задач даже без до-обучения. Например, для бота, который помогает заказывать цветы в цветочном магазине. Более того, у них обычно нет данных для этого, и нет, 20 примеров диалогов которые у них есть (и даже 200) не подходят.

Читать полностью »

Оптимизируем дообучение LLM: теория + гайд

2024-11-24 в 13:15, admin, рубрики: Fine-tuning, llm, PEFT, гайд, файнтюнинг

В эпоху стремительного развития искусственного интеллекта большие языковые модели (Large Language Models, LLM) становятся неотъемлемой частью множества приложений – от интеллектуальных чат-ботов до систем анализа данных.

Так уж сложилось, что эффективное применение больших языковых моделей не обходится без тонкой настройки, потому что базовые модели, обученные на обобщенных данных, могут не учитывать уникальные особенности конкретных задач или доменов. Тонкая настройка позволяет адаптировать модель к специфическим требованиям приложения, что улучшает ее точность [1].

Читать полностью »

От промптов к дообучению: четыре уровня адаптации open-source моделей

2024-08-22 в 13:26, admin, рубрики: Fine-tuning, genai, open-source llm, rag, искусственный интеллект, машинное обучение, промпт-инжиниринг

Привет! Меня зовут Анна Щеникова, я аналитик в Центре RnD в МТС Диджитал. Ко мне часто приходят задачи, где нужно использовать open-source LLM. Сразу же встает вопрос: а как адаптировать имеющуюся модель под конкретный кейс?

Читать полностью »

Как дообучать LLM с помощью Supervised Fine-Tuning

2024-08-12 в 13:34, admin, рубрики: data annotation, data labeling, dataset, Fine-tuning, llm, SFT, машинное обучение, разметка данных

Обычно большие языковые модели (large language model, LLM) обучают в несколько этапов, включающих предварительное обучение и множество этапов fine-tuning (см. ниже). Предварительное обучение — это дорогостоящий процесс (например, требующий многих сотен тысяч долларов на вычислительные ресурсы), однако fine-tuning модели LLM (или контекстное обучение) по сравнению с этим гораздо дешевле (например, сотни долларов или даже меньше). Учитывая широкую доступность и бесплатность (даже для коммерческого использования) предварительно обученных LLM (например, MPT, Falcon или LLAMA-2), мы можем создавать большой спектр мощных приложений благодаря fine-tuning моделей под нужные задачи.

Как дообучать LLM с помощью Supervised Fine-Tuning - 2

Этапы обучения LLM

На текущем этапе исследований ИИ одним из самых широко применяемых видов fine-tuning моделей LLM стал supervised fine-tuning (SFT). При этой методике курируемый датасет высококачественных выходных данных LLM применяется для непосредственного fine-tuning модели. SFT прост и дёшев в использовании, это полезный инструмент выравнивания языковых моделей, ставший популярным даже за пределами исследовательского сообщества опенсорсных LLM. В этой статье мы вкратце расскажем о принципах SFT, рассмотрим исследования по этой теме и приведём примеры того, как практикующие специалисты могут с лёгкостью пользоваться SFT, написав всего несколько строк кода на Python.
Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Обсуждаемое

Рекомендуем

Рубрика «Fine-tuning»

Обучение и fine-tuning моделей простым языком: зачем, как, где

Оптимизируем дообучение LLM: теория + гайд

От промптов к дообучению: четыре уровня адаптации open-source моделей

Как дообучать LLM с помощью Supervised Fine-Tuning

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «Fine-tuning»

Обучение и fine-tuning моделей простым языком: зачем, как, где

Оптимизируем дообучение LLM: теория + гайд

От промптов к дообучению: четыре уровня адаптации open-source моделей

Как дообучать LLM с помощью Supervised Fine-Tuning

Новости

Актуальные темы

Архив