Робот Макс с LLM: история внедрения нейросетей в помощь миллионам пользователей Госуслуг

в 14:05, , рубрики: gpt, llm, большие языковые модели, госуслуги, искусственный интеллект, нейросети, робот макс, Управление продуктом
Робот Макс с LLM: история внедрения нейросетей в помощь миллионам пользователей Госуслуг - 1

Привет! На связи команда Робота Макса — цифрового ассистента Госуслуг.

В декабре 2024 года вышла бета-версия Робота Макса с генеративной нейросетью. После запуска мы анализировали обратную связь о новой версии. Сейчас решили рассказать, что сделали, чтобы Робот Макс отвечал точнее и обрабатывал большее количество вопросов.

Диалоговое окно с Роботом Максом в GPT-версии
Диалоговое окно с Роботом Максом в GPT-версии

Начнём с небольшой предыстории. На портале 1,5 тысячи услуг и 5 тысяч страниц с информацией. Больше 110 млн пользователей, 700 млн заказов услуг в год.

Робот Макс помогает получать услуги и рассказывает о них доступным языком. Например, с его помощью можно записаться в МВД, получить выписку об остатке материнского капитала, узнать про загранпаспорт нового образца, отключить радиоточку или подать лесную декларацию (ну а вдруг).

Роботу Максу четыре года. За это время он «подрос»:

  • в 2021 году провёл 93 млн консультаций, а в 2024 — 1 млрд

  • в 2021 году DAU — 0,5 млн, в 2024 — 2 млн

  • в 2022 году CSAT — 30%, в 2024 году — 68%. В 2021 году ещё не могли оценивать ответы, поэтому данные только с 2022 года

О том, как появился цифровой ассистент, какая у него цель и что скрыто под капотом, рассказывали ранее на Хабре. Также писали про конструктор диалогов: что это такое, к чему стремимся в ответах и как удалось сократить время на вывод новых текстов про услуги — читайте в статье.

Оглавление

  1. Какой путь прошли

    1.1. Провели качественное исследование аудитории

    1.2. Внедрили большую языковую модель

    1.3. Создали RAG-систему

  2. LLM vs Робот Макс: что в итоге изменилось

  3. Как переключиться на GPT-версию

Какой путь прошли

Мы поняли, что Робот Макс классный, но ещё несовершенный: точность его ответов — 80%. Но однозначный и шаблонный ответ не всегда подойдёт, тут как раз и нужны генеративные нейросети.

«Что ж, значит, пришло время меняться», — сказали мы на одной из стратсессий осенью 2023 года, когда решили «подружить» LLM и Робота Макса и обновить его внешний вид. После этого за несколько дней уже в январе 2024 года собрали первый прототип, защитили проект и приступили к работе.

Провели качественное исследование аудитории

Новый облик цифрового ассистента и внедрение большой нейросети неслучайны. Часть этих изменений — результат качественного глубинного исследования (JTBD) ключевых сегментов аудитории Госуслуг. Что в итоге:

  • опросили респондентов самых разных возрастов: 15-35 лет, 36-50 лет и 51+

  • подтвердили продуктовые гипотезы о том, что изменения нужны и будут ценны

  • конкретизировали проблемы пользователей и их причины

  • получили много инсайтов о том, как развивать Робота Макса дальше

  • поняли, что люди ценят и хотят сохранить в цифровом ассистенте, а что требует доработки

Мы ещё раз убедились в том, что пользователям важно как можно скорее и в одном месте получить услуги без бумажной волокиты, избежать стресса при взаимодействии с госорганами, сократить время на поиск ответа и уделить освободившееся время себе и семье. Также узнали, чем именно неудобен Робот Макс и как с помощью LLM мы можем решить эти проблемы.

Проблема

Как решили в новой версии

Не знает ответа на вопрос, либо плохо отвечает на низкочастотный уникальный вопрос

Использует агрегированную базу знаний из всех материалов на Госуслугах. В старой версии он обращается к готовым ответам и не создаёт что-то новое сам

Отвечает только заранее подготовленным текстом, не умеет отвечать конкретно

С помощью LLM извлекает информацию из текста для точного ответа

Непонятно, как пользоваться Роботом Максом

Добавили инструкции о том, как пользоваться новой версией, оценить качество ответов и переключиться на прошлую версию

Не всегда понимает запрос

Робот Макс с LLM понимает большее количество вопросов благодаря векторному поиску по контенту

Непонятные названия кнопок

Изменили подход к наименованию кнопок для ответов с LLM

После исследования аудитории, анализа потребностей и задач заметили, что не все задачи пользователей закрываются без проблем. Стало понятно, что нужно:

  • научить Робота Макса распознавать разные запросы: в утвердительной или вопросительной форме, только с ключевыми словами или в виде длинного предложения

  • повысить точность и качество ответов

  • внедрить генеративную нейросеть

  • расширить базу знаний и загрузить в неё все материалы с Госуслуг, чтобы при ответе у Робота Макса было больше данных

Внедрили большую языковую модель

Теперь генеративная нейросеть создаёт короткие и нешаблонные ответы, учитывает контекст диалога или создаёт пошаговые инструкции из разных источников. Это означает, что можно задать вопрос Роботу Максу так же, как спросили бы у человека.

Сначала модель выдавала некорректные ответы. Чтобы это исправить, внедрили Retrieval Augmented Generation (RAG).

Создали RAG-систему

Модель может отвечать неправильно на вопрос пользователя, потому что при создании ответа ориентируется на те данные, на которых она обучалась. В какой-то момент эти данные могут стать неактуальными. Во всех случаях это критично для пользователей, которые пришли получить точную информацию на Госуслугах.

Чтобы модель учитывала все нужные и актуальные материалы, мы создали RAG-систему и свою базу знаний. RAG — это технология, которая «подключает» языковые модели к дополнительной информации из внешних источников.

Базовая схема работы RAG. В реальности наша система сложнее

Базовая схема работы RAG. В реальности наша система сложнее

В свою базу загрузили все материалы с Госуслуг: новости с портала, информацию из раздела «Интересно и полезно» и ответы на популярные вопросы. Важная составляющая RAG-системы — это поиск документов, которые далее передаются в модель как контекст вопроса. Важно, чтобы эти документы были релевантные, иначе мы только запутаем модель и получим неверный ответ.

Мы сравнили несколько типов поиска документов — полнотекстовый, векторный и гибридный. Решили применять поиск с использованием векторизации от Яндекса.

В ходе векторизации выходные данные и текст преобразуются в числовой формат — векторы. Эта процедура нужна для семантического поиска информации в базе знаний. Такой поиск работает по принципу геометрической близости семантически близких элементов текста. Это работает так: в базе хранятся векторы документов, запрос векторизуется, мы ищем наиболее близкие документы к запросу.

В итоге Робот Макс отвечает на сложные и персонализированные вопросы с помощью LLM. Чтобы определить категорию вопроса, наша команда разработала собственный классификатор на основе нейронной модели, которая решает, стоит ли передавать запрос в разработанную RAG-систему. В этом процессе используется в том числе few-shot классификатор от Яндекса — он работает на модели YandexGPT 4 Pro.

Научились учитывать все вопросы пользователя

Теперь Робот Макс учитывает контекст сессии с пользователем. Для этого мы используем дообученную (fine-tuning, метод LoRA) модель YandexGPT 4 Lite. Она перефразирует вопрос, а затем большая модель последнего поколения генерирует ответ.

Например, если спросить об оформлении загранпаспорта для ребёнка, а в следующем вопросе узнать «а чем новый отличается от старого», то Робот Макс поймёт, о чём речь, и поддержит диалог.

В версии без GPT Робот Макс подобрал для ответа несколько материалов по ключевым словам «старый и новый» без учёта контекста.

GPT-версия: после вопроса про загранпаспорт продолжили диалог с Роботом Максом и спросили про отличия. Далее модель перефразировала вопрос с учётом контекста сессии, начался векторный поиск документов и их передача в модель, на входе модель получит более подходящие документы в контексте сессии

GPT-версия: после вопроса про загранпаспорт продолжили диалог с Роботом Максом и спросили про отличия. Далее модель перефразировала вопрос с учётом контекста сессии, начался векторный поиск документов и их передача в модель, на входе модель получит более подходящие документы в контексте сессии
В старой версии пользователь получит ответ на вопрос, если перейдёт по ссылке на материал из базы знаний Робота Макса

В старой версии пользователь получит ответ на вопрос, если перейдёт по ссылке на материал из базы знаний Робота Макса

LLM vs Робот Макс: что в итоге изменилось

Лаконично отвечает. Робот Макс научился извлекать информацию — теперь на конкретные вопросы он даёт ответ без лишней информации.

В старой версии ответ более подробный, в новой версии — конкретизированный

В старой версии ответ более подробный, в новой версии — конкретизированный

Не теряется при сложных вопросах. Например, потерять загранпаспорт в другой стране — стрессовая и нетипичная ситуация, и Робот Макс даёт сразу пошаговую инструкцию.

В старой версии цифровой ассистент не понял вопрос, поэтому просто рассказал о замене документа

В старой версии цифровой ассистент не понял вопрос, поэтому просто рассказал о замене документа

Создаёт инструкции по запросу. В GPT-версии Робот Макс создаёт инструкции, если понимает из вопроса, что пользователю нужен порядок действий. В старой версии он предлагает кнопки, для которых команда заранее пишет ответы и настраивает поиск. При таком подходе сложно покрыть все вопросы, особенно похожие.

Преимущество LLM — команде не нужно создавать контент для ответа на похожие вопросы

Преимущество LLM — команде не нужно создавать контент для ответа на похожие вопросы

Ссылается на источники. В нейросетевых ответах есть ссылки на источники — так пользователь сможет проверить или уточнить информацию. Также в кнопках появились ссылки на материалы по теме — это наша отдельная разработка.

Раньше кнопки в ответах добавлялись вручную и вели только на материалы в пределах базы знаний Госуслуг

Раньше кнопки в ответах добавлялись вручную и вели только на материалы в пределах базы знаний Госуслуг

Мы не отключаем прошлого Робота Макса: обе версии будут работать параллельно. GPT-версия ещё неидеальна, постепенно будем расширять аудиторию и к концу года эта версия будет работать как основной режим.

Наглядно сравнили две версии: у каждой есть свои преимущества и особенности

Наглядно сравнили две версии: у каждой есть свои преимущества и особенности

Как переключиться на GPT-версию

Авторизуйтесь на Госуслугах. В диалоге с Роботом Максом нажмите на переключатель вверху экрана. Если используете мобильное приложение, предварительно обновите его до последней версии и затем переключитесь на GPT-версию.

Если захотите отключить новую версию, появится форма обратной связи — напишите нам свои впечатления и расскажите, что понравилось, а что — нет. Обратная связь позволит нам дообучить эту версию и улучшить цифрового ассистента. Мы только в начале пути и видим большой потенциал в нейросетевой версии. А ещё скоро расскажем про новый облик Робота Макса: какие исследования проводили для этого, почему он изменился и как.

С вами были авторы статьи из команды Робота Макса: Аня Митрофанова, главред, Света Тихомирова, PO, и Никита Устриков, CPO.

Расскажите в комментариях, как вам обновлённый Робот Макс? Будете использовать GPT-версию? Также готовы ответить на ваши вопросы.

Автор: Nikita_Us

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js