Рубрика «compresia»

Как настроить LLM на локальном сервере? Краткое руководство для ML-специалистов

2024-09-27 в 13:10, admin, рубрики: compresia, compressa ai, llm, lora-адаптеры, selectel, большие языковые модели, квантование, машинное обучение

Привет! Все чаще коллеги из ML замечают, что компаниям нравятся возможности ChatGPT, но далеко не каждая готова передавать данные во внешние АРІ и жертвовать своей безопасностью. В результате команды начинают внедрять open source-LLM, развернутые локально. Чтобы осуществить этот процесс, инженерам нужно выполнить две задачи.

Сделать удобную «песочницу» для экспериментов, чтобы быстро проверять гипотезы для бизнеса.
Эффективно масштабировать найденные кейсы внутри компании, по возможности снижая затраты на ресурсы.

В статье рассказываем, какие есть проблемы у open source-LLM и как оптимизировать инференс модели с помощью квантизации и LoRA-адаптеров. Подробности под катом!

Автор: Алексей Гончаров, основатель платформы Compressa.ai для разработки GenAI-решений на своих серверах.
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «compresia»

Как настроить LLM на локальном сервере? Краткое руководство для ML-специалистов

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «compresia»

Как настроить LLM на локальном сервере? Краткое руководство для ML-специалистов

Новости

Актуальные темы

Архив