Рубрика «llm» - 7

Около двух недель назад китайская лаборатория DeepSeek представила свою новую AI модель DeepSeek-R1-Lite, которая специализируется на логических рассуждениях. Конечно, у всего AI-сообщества быстро загорелся огонь в глазах от заявленных возможностей модели.

И я один из них. Как обычно: раз новая модель - значит новые идеи и тесты...

Читать полностью »
Лама, поймавшая дзен после успешного ответа

Лама, поймавшая дзен после успешного ответа

Меня зовут Грибанов Никита, я Data Scientist в отделе R`n`D&ML компании Raft Digital Solutions, и сегодня я расскажу о больших языковых моделях. На данный момент в мире их существует уже более 39 тысяч! Далее буду называть их хайповым названием LLM (Large Language Model).

Читать полностью »

Фреймворк с метриками и данными, сгенерированными LLM, для оценки производительности конвейера с дополненной генерацией данных.

Стилизованная панель мониторинга производительности для расширенной генерации данных.

Стилизованная панель мониторинга производительности для расширенной генерации данных.

Читать полностью »

Вызов функций в Ollama - 1

Для Ollama доступно множество интеграций. Одна из популярных — Open WebUI. Это веб-интерфейс для управления Ollama, предлагающий широкие возможности и гибкие настройки. Недавно в Open WebUI появилась поддержка плагинов Pipelines, которая позволяет вызывать функции.

Этот пример был протестирован на видеокарте AMD Radeon RX 7900 XTX и процессоре.

ЗапускЧитать полностью »

Tom Schaul, Google DeepMind London, UK tom@deepmind.com

https://arxiv.org/abs/2411.16905

АННОТАЦИЯ

 

Читать полностью »

Привет! Меня зовут Кирилл Воронин, я data scientist в Doubletapp. В статье расскажу вам, как мы автоматизировали рутинные процессы отсмотра и сверки документов для допуска подрядчиков к тендерам.

Как мы помогли сырьевой госкомпании ускорить и упростить подбор подрядчиков с помощью LLM - 1Читать полностью »
Как улучшить понимание чисел в языковых моделях? - 1

Привет, на связи Юлия Рогозина, бизнес-аналитик Шерпа Роботикс. Сегодня я перевела для вас статью про то, какие недостатки есть у языковых моделей в плане вычислений, а также, как учёные продолжают совершенствовать методы решения простейших задач. 

Читать полностью »

От теории из оригинальной академической статьи до ее реализации на Python с OpenAI, Weaviate и LangChain

Рабочий процесс генерации дополненного извлечения

Рабочий процесс генерации дополненного извлечения

Читать полностью »

Эффективный деплой многозадачного сервера с LLM - 1

Рисунок 1: Два типа стратегий онлайн-обслуживания. (a) Независимые модели для каждой задачи обучаются и разворачиваются отдельно. (b) Одна многозадачная модель обучается и разворачивается для всех задач.

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js