Рубрика «supervised fine-tuning»

Законы масштабирования – архитектура O1 Pro — Инфраструктура синтетических данных, RLAIF, токеномика вычислений

2024-12-27 в 11:09, admin, рубрики: AI Lab, Claude 3.5 Opus, llm, O1 Pro, OpenAI, RLAIF, RLHF, supervised fine-tuning, Законы масштабирования, синтетические данные

С каждым днем растут страхи и сомнения относительно законов масштабирования ИИ. Большинство предсказателей отрасли ИИ Читать полностью »

Дообучаем Llama 3.1 у себя дома

2024-08-28 в 7:07, admin, рубрики: huggingface, llama, llama3.1, supervised fine-tuning, weights & biases

Привет, чемпионы! С каждым днем появляется все больше и больше LLM, их показатели растут с таким же темпом. Но в определенных областях они до сих пор не слишком хороши, так как на этапе предобучения не выгодно охватывать узкие домены - легче модели скормить общие данные, а потом дообучить.

Секунду, слишком много терминов на один пиксель: что такое предобучение и "дообучение"? Практически все современные "чатовые" модели выпускаются не до конца обученные, чтобы в случае неудовлетворенности пользователя результатам генерации, он смог дообучить под свои данные.

ДообучениеЧитать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «supervised fine-tuning»

Законы масштабирования – архитектура O1 Pro — Инфраструктура синтетических данных, RLAIF, токеномика вычислений

Дообучаем Llama 3.1 у себя дома

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «supervised fine-tuning»

Законы масштабирования – архитектура O1 Pro — Инфраструктура синтетических данных, RLAIF, токеномика вычислений

Дообучаем Llama 3.1 у себя дома

Новости

Актуальные темы

Архив