Рубрика «большие языковые модели»

Почему искусственный интеллект такой дорогой: пять причин от Bloomberg - 1

Стремление к созданию более масштабных моделей искусственного интеллекта, а также увеличение числа чипов и дата-центров для их разработки, оборачивается значительными расходами для технологических компаний.

Важное примечание

DeepSeek-R1 — это самый громкий релиз последних дней в области искусственного интеллекта. Для сообщества исследователей и разработчиков машинного обучения (ML R&D) эта модель имеет особое значение по ряду причин:

  1. Модель обладает открытыми весами и включает уменьшенные, дистиллированные варианты.

  2. Она делится и размышляет над методом обучения, позволяющим воспроизвести модель рассуждений, подобную OpenAI O1.

В этой публикации мы рассмотрим, как была создана DeepSeek-R1.

Дисклеймер: это вольный перевод статьиЧитать полностью »

В данной статье будет представлен укороченный и упрощенный перевод статьи “A Survey on Hallucination in Large Language Models: Principles, Taxonomy, Challenges, and Open Questions”. А именно перевод части, относящейся к причинам возникновения галлюцинаций. Упрощение состоит в том, что были опущены части, уходящие в конкретику. В этом переводе мы сосредоточимся на основных причинах возникновения галлюцинаций и примерах.


Виды причин галлюцинаций

Инструменты искусственного интеллекта могут заменить большую часть работы «белых воротничков» начального уровня на Уолл-стрит, поднимая непростые вопросы о будущем финансов.

Худшая часть карьеры на Уолл-стрит, возможно, подходит к концу Инвестиции, Трейдинг, Стартап, Акции, Кризис, Искусственный интеллект, Инвестиции в акции, Длиннопост

Читать полностью »

Может ли ИИ автоматизировать создание обзорных статей? - 1

Инструменты искусственного интеллекта отлично справляются с качественным анализом, но буксуют при работе с количественными показателями.

Читать полностью »

Основатель Moonshot AI Ян Чжилинь заявил, что компания фокусируется на обучении с подкреплением, которое имитирует рассуждения человека

Основатель Moonshot AI Ян Чжилинь заявил, что компания фокусируется на обучении с подкреплением, которое имитирует рассуждения человека

Читать полностью »

Привет! Меня зовут Федор Горбунов, руковожу в Doubletapp направлением автоматизации бизнес-процессов с помощью LLM. В статье расскажу, как мы помогли клиенту автоматизировать одну из операций в производственной цепочке, как эта автоматизация ускорила поставку итогового продукта, уменьшила количество ошибок за счет сокращения ручного труда и в конечном итоге сэкономила заказчику деньги.

Читать полностью »
Как выбрать лучшую модель для кодирования: использование SLM и локальных LLM - 1

Привет, на связи Юлия Рогозина, аналитик бизнес-процессов Шерпа Роботикс. Сегодня я перевела для вас статью, посвященную использованию SLM и локальных LLM. Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js