Рубрика «llm» - 6

В прошлом году Forbes опубликовал список из 10 предсказаний о том, что произойдет в сфере ИИ в 2024 году. Прошел почти год, и настала пора сравнить прогноз с реальным положением дел, а попутно понять, как за год изменилась расстановка сил на этом конкурентном рынке.

Дисклеймер: это вольный перевод колонкиЧитать полностью »

Запускаем 8B LLM в браузере: AQLM.rs - 1

Меня долгое время интересовал запуск больших языковых моделей на пользовательских устройствах: есть что‑то в том, чтобы запустить одну из лучших языковых моделей на обычном домашнем компьютере или на мобильном телефоне, помещающемся в карман.

В этом посте я расскажу о своём пет‑проекте AQLM.rsЧитать полностью »

Как развлечься настоящему программисту, когда есть время и хорошее настроение?

Написать эту статью меня побудило серьезное научное исследование, которое обосновало прекрасный и оригинальный метод Chain of Code (CoC) улучшения рассуждений моделей и точности их ответов.
Суть метода заключается в том, чтобы заставить модель написать подходящий программный код, соответствующий поставленной в промпте задаче, интерпретировать его выполнение и на основе полученного результата сформировать более логичный, точный и достоверный ответ.
Читать полностью »

Очередь за RAG'ом

Очередь за RAG'ом

Когда хайп захватывает умы, кажется, что любое техническое решение должно строиться вокруг новой модной технологии и что теперь-то мы ух заживем! Сегодня у нас на хайпе RAG (Retrieval-Augmented Generation), вчера — NFT, позавчера — блокчейн везде и всюду. Давайте попробуем разобраться, нужен ли RAG на самом деле, или это просто «новый блокчейн» и через год все набьют шишки и забудут о нем.

Читать полностью »

Введение

В постоянно развивающемся мире машинного обучения и искусственного интеллекта разработка приложений языковых моделей, в частности систем генерации дополненного извлечения (RAGЧитать полностью »

Одна из основных проблем использования больших языковых моделей (LLM) в бизнесе заключается в том, что LLM склонны к галлюцинациям. Как можно доверить своих клиентов чат-боту, который может слететь с катушек и в любой момент сказать что-то неуместное? Или как можно доверять корпоративному AI-ассистенту, если он рандомно придумывает факты?

Читать полностью »

Одна из основных проблем использования больших языковых моделей (LLM) в бизнесе заключается в том, что LLM склонны к галлюцинациям. Как можно доверить своих клиентов чат-боту, который может слететь с катушек и в любой момент сказать что-то неуместное? Или как можно доверять корпоративному AI-ассистенту, если он рандомно придумывает факты?

Читать полностью »

Дженсен Хуанг представляет NVIDIA GB200 NVL72.

Дженсен Хуанг представляет NVIDIA GB200 NVL72.

Введение 

Читать полностью »

Итак, друзья, продолжаем тему прогнозирования временных рядов с помощью Chronos.

Напомню, что Chronos это фреймворк от компании Amazon — простой, но эффективный фрэймворк для предобученных вероятностных моделей временных рядов.

Читать полностью »

Как мы сделали клиентскую поддержку интернет-магазина действительно умной: опыт внедрения RAG-бота - 1

Привет! Я — Андрей Богомолов, сооснователь и технический директор GenAI Lab. Мы помогаем компаниям из разных сфер внедрять генеративный искусственный интеллект для автоматизации и повышения качества работы.

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js