Главная

Рубрика «языковые модели»

От улыбки рейтинг наш светлей: Как фильтры стиля и настроения меняют рейтинг LLM

2025-04-24 в 13:33, admin, рубрики: chatgpt, DS, lmarena, OpenAI, внедрение ai, выбор модели, нейросети, языковые модели

Привет! Я Сергей, в Битрикс24 отвечаю за то, чтобы под капотом Copilot крутилась правильная LLM — та, что действительно помогает пользователю, а не просто разбрасывается смайликами.

Выбирая лучшие языковые модели, люди далеко не всегда руководствуются точностью ответов. Иногда внимание пользователей привлекает красивое оформление или эмоциональный стиль, а не фактическая польза. На LM Arena это стало особенно заметно в последнее время и заставило команду платформы изучить, как именно эмоции и оформление влияют на рейтинг моделей. Команда площадки решила отделить форму от содержания и запустила фильтрЧитать полностью »

Часть 2. Обзор технологий RAG для LLM: поиск и извлечение информации

2025-04-21 в 20:23, admin, рубрики: llm, llm-агент, llm-архитектура, llm-модели, llm-приложения, rag, terminology, языковые модели

Продолжаю адаптированный перевод статьи китайских исследователей Retrieval-Augmented Generation for Large Language Models: A Survey (первую часть см. здесь) Во второй части авторы разбирают технологии оптимизации поиска и извлечения данных. Поскольку материал я готовил в первую очередь для начинающих ИТ-переводчиков, сложные и специальные термины я сопровождал английским переводом и краткими пояснениями в инфобоксах (появляются по наведению курсора). Картинок не было, не обессудьте.

Читать полностью »

Оценка развития человечества на 1000 лет по версии DeepSeek и рефлексия

2025-04-18 в 17:43, admin, рубрики: llm, будущее, фантастика, языковые модели

Я знаю сейчас очень популярно хейтить статьи сгенерированные LLM. Но как по мне это огромное поле для исследований. Ведь с точки зрения технологий это фактически новый вид баз данных, которые определенным образом обобщают тот опыт который в них закладывается разработчиками. И так меньше флуда больше пользы...

Задал я тут вопрос Дипсику.

Как ты оцениваешь динамику популяции человечества в следующие 1000 лет. разбери этот вопрос по вехам, каждая по 250 лет.

Ответ:

Читать полностью »

Реализация AI агента на базе LLM с нуля – что включает цикл разработки

2025-03-27 в 13:16, admin, рубрики: AI, llm, llm-модели, ИИ, ии-модель, облачные сервисы, языковая модель, языковые модели

Разработка AI агента, использующего большие языковые модели (LLM) – это малоизвестный пока еще и потому интересный инженерный процесс, охватывающий весь цикл создания от идеи до финального развертывания. Технические стандарты разработки агентских систем пока еще формируются. В данной статье я поделюсь своим опытом и рассмотрю ключевые этапы, технологии и практические нюансы, которые встречаются при разработке такой системы с нуля.

Читать полностью »

Как дистилляция меняет индустрию искусственного интеллекта

2025-03-25 в 12:00, admin, рубрики: AI, искусственный интеллект, машинное обучение, языковые модели

Всем привет! Меня зовут Миша, я руковожу центром R&D Big Data в МТС Диджитал. В прошлый раз делился с вами подборкой книг по базам данных. Сегодня хочу обсудить, как дистилляция влияет на индустрию ИИ.

Читать полностью »

Уроки химии: AMORE проверит готовность химических языковых моделей

2025-03-14 в 9:04, admin, рубрики: ChemLM, llm, nlp, бенчмарки, химия, языковые модели

Привет! Мы, команда NLP‑исследователей из AIRI и Сбера, опубликовали недавно результаты исследования того, как языковые модели справляются с химическими задачами. Дело в том, что в последние годы интеграция методов обработки естественного языка в области химии неуклонно растёт, и это открывает новые горизонты для открытия лекарств. Однако возникает важный вопрос: действительно ли современные языковые модели научились понимать молекулы, или они просто запоминают их текстовые представления?

Чтобы выяснить это, мы создали ♡AMOREЧитать полностью »

Модели T-lite и T-pro: training report

2025-03-12 в 14:30, admin, рубрики: llm-модели, распознавание текста, языковые модели

Привет! Я Дима Стоянов, MLE в команде разработки фундаментальных моделей. Мы продолжаем рассказывать о наших моделях T-lite и T-pro. Общие характеристики и результаты бенчмарков описывали в предыдущей публикации. В этой статье раскроем детали предобучения: от подготовки данных до финальных экспериментов, а совсем скоро поделимся особенностями этапа post-training.

Читать полностью »

Русскоязычные LLM: отечественные разработки в сравнении с глобальными адаптациями

2025-03-06 в 13:11, admin, рубрики: api, chatgpt, cotype, GigaChat, llm-модели, нейросети, сравнение моделей, языковые модели

Современные языковые модели (они же LLM, они же Large Language Models) становятся все более востребованными практически во всех сферах. LLM уже не просто инструмент, а важнейшая часть технологического прогресса, позволяющая автоматизировать работу с текстами, проводить анализ данных, генерировать контент и даже серьезно помогать в обучении.

Читать полностью »

BotHub, GPTunnel, Chad AI — считаем где ChatGPT дешевле в России

2025-03-04 в 14:47, admin, рубрики: Bothub, ChadAI, chatgpt, gpt-4o, gptunnel, llm, tiktoken, языковые модели

Сейчас на фоне стремительной популяризации нейросетей, в России появилось достаточно много сервисов и агрегаторов, обеспечивающих удобный доступ к популярным языковым моделям без использования VPN. Однако при выборе подходящего решения мы зачастую сталкиваемся с проблемой разношерстной тарификация: у одних внутренняя валюта, у других стоимость за слова, третьи считают символы или количество токенов в запросе.

Читать полностью »