Привет! На связи Анна Смирнова, руководитель по развитию технологий ИИ в К2Тех.
Сегодня поговорим об искусственном интеллекте без лишнего хайпа. Дело в том, что из новинки, которую все тестировали и примеряли, ИИ превращается в реального помощника в бизнесе. Компании уже осознанно внедряют нейросети в свои бизнес-процессы и оптимизируют производства, повышают безопасность, улучшают логистику и увеличивают продажи.
Также обсудим перспективы развития ИИ в России. Вы узнаете о государственной поддержке этой сферы, проблемах внедрения в разных отраслях и о том, как подготовиться к грядущей цифровой трансформации.
Термин «искусственный интеллект» стал настолько популярным, что потерял четкость. Его часто используют как маркетинговый инструмент. Поэтому важно сразу уточнить, о чем мы говорим. В этой статье речь пойдет о практическом применении технологий на базе нейросетей. Мы рассмотрим четыре основные группы технологий, которые уже сейчас приносят пользу:
-
речевые технологии;
-
компьютерное зрение и видеоаналитика;
-
машинное обучение и предиктивные системы;
-
большие языковые модели.
Развитие ИИ в России: особенности и тренды
За последние пять лет проекты, связанные с ИИ, привлекли внимание не только бизнеса, но и государства. Если свести национальную стратегию развития ИИ в России на 2024–2030 годы к трем тезисам, то это будут:
60 млрд прогнозируемый рост объема услуг в России по ИИ к 2030 гг. |
145 млрд вложений в развитие ИИ в России до 2030 г. |
95% прогнозируемый рост доли приоритетных отраслей экономики в стадии высокой готовности к внедрению ИИ. |
В России с 2021 года действуют экспериментально-правовые режимы для развития инновационных технологий. Это позволило начать внедрение ИИ в телемедицину, грузоперевозки, автономный транспорт и бизнес-аналитику больших данных.
Основные исследования в области ИИ проводятся в научных центрах: МФТИ, ИТМО, Институт AIRI, Сколтех и Институт системного программирования им. В.П. Иванникова РАН и др. В этих центрах команды ученых исследуют применение нейросетей для решения практических задач в промышленности, строительстве, транспорте и нефтегазовой отрасли.
Параллельно ведутся исследования в области доверенного искусственного интеллекта. Эта технология защищает ИИ-системы от злонамеренных или случайных воздействий, которые могут исказить результаты их работы. Исследователи также участвуют в разработке нормативно-правовой базы для обеспечения безопасности ИИ.
В результате появляются, например, предсказательные модели для анализа нефтяных месторождений или управления городским трафиком. Однако часто у ученых не хватает ресурсов для внедрения этих продуктов в реальных условиях. Из-за этого даже зрелые и передовые решения часто остаются невостребованными. C другой стороны, корпорации все чаще создают собственные центры исследований и разработок (R&D) и ищут для них задачи за пределами своей ниши.
В текущих условиях задача и роль интеграторов – быть популяризаторами ИИ, доказывать применимость и эффективность машинного обучения для решения задач бизнеса и помогать ученым коммерциализировать результаты разработок, занимаясь внедрением ИИ-технологий и их адаптацией под потребности, масштабы бизнеса и отраслевую специфику.
Сейчас доля отраслей в РФ, которые готовы к внедрению нейросетевых решений, всего около 12%. И здесь могут помочь интеграторы — связать ученых с конечными заказчиками, подготовить почву для новых технологий. То есть взять имеющиеся решения, пройти с ними дополнительную акселерацию, помочь с внедрением в бизнесе и обеспечить дальнейшую поддержку.
Что нужно бизнесу: запросы и подходы к решению задач с помощью ИИ
Из-за быстрого развития нейросетей руководители компаний не всегда понимают, как эти технологии могут решить их задачи. Особенно это касается малого бизнеса. Здесь приходится начинать с объяснения базовых принципов и решения простых задач. Например, показать, как видеоаналитика будет работать с одной камерой, и лишь затем рассказывать о масштабировании.
Производственные и промышленные компании часто не готовы сразу внедрять ИИ. Когда они обращаются к нам, кажется, что их устроят обычные алгоритмические решения. Оно и понятно – адаптировать нейросети под промышленность непросто.
Ритейл и финтех лидируют в освоении ИИ-технологий. Компании из этих отраслей хорошо разбираются в инновациях и часто запрашивают специфические решения. Например, они интересуются возможностью использовать большие языковые модели (LLM) локально в периметре компании (on-premise). Еженедельно мы получаем 10–15 запросов от клиентов по этой теме. Чаще всего их волнует зрелость технологий ИИ для применения в бизнесе, сложность и стоимость внедрения новых инструментов в бизнес-процессы.
Первое внедрение преодолевает скептицизм заказчика. Увидев точные прогнозы, снижение рисков и рост прибыли, компании стремятся расширить использование ИИ.
Внедрение ИИ начинается с подбора технологии и поставщика под конкретную задачу. На российском рынке достаточно компаний, которые имеют готовые продукты и реальный опыт внедрения, отвечающие потребностям ведущих отраслей. Приведу несколько конкретных примеров такой работы.
Речевые технологии: голосовые боты в складской логистике и не только
Технологии ИИ, позволяющие работать с человеческой речью, состоят из двух блоков – распознавание речи (Automatic Speech Recognition, ASR) и синтез речи (Text-to-Speech, TTS). Зачастую работают в связке с NLP. NLP (обработка естественного языка) – область технологий, позволяющая компьютерным системам анализировать и интерпретировать человеческий язык. Используется, например, в чат-ботах в клиентской поддержке, в поисковых системах при поиске текстов, для задач машинного перевода, в голосовых или текстовых ассистентах.
В целом, тренд речевых технологий — это оптимизация множества рутинных процессов и улучшение клиентского сервиса. Например, растет популярность сервисов для автоматического перевода аудиозаписей совещаний в точные протоколы встреч с клиентами, партнерами и коллегами в нужном формате. И мы явно видим, как отражается этот тренд на текущих запросах клиентов. В плане клиентского сервиса и персонализированного подхода существуют и уже востребованы решения, которые анализируют разговоры с клиентами и составляют скрипты для сотрудников call-центров или специалистов первой линии техподдержки, подсказывают новичкам, как лучше реагировать и что делать дальше. Это в значительной мере снижает эмоциональную нагрузку на операторов при общении с большим количеством требовательных, а то и токсичных клиентов, а вместе с тем позволяет обеспечить более высокий уровень сервиса.
Даже в такой, казалось бы, упорядоченной сфере, как складская логистика, голосовые технологии оказываются незаменимыми помощниками для работников склада: освобождают им руки, дают возможность быстро получать информацию и не отвлекаться от основного процесса. Решения для синтеза и распознавания речи позволяют операторам склада получать голосовые инструкции по сборке заказов через гарнитуру, запрашивать голосом дополнительную информацию по товарам и быстро заполнять электронные документы по мере сбора заказов. Это значительно сокращает количество ошибок при комплектации заказов и время на их сборку.
Компьютерное зрение: от помощи ритейлерам до безопасности городов
На промышленных и строительных объектах машинное зрение помогает анализировать эффективность процессов, выявлять нарушения и мониторить соблюдение техники безопасности.
Видеоаналитика позволяет моделировать цифровые аналоги объектов, определять их параметры и свойства, чтобы обнаруживать различные отклонения и дефекты. На складах устанавливаются системы видеонаблюдения и контроля, включающие монтаж видеокамер, установку датчиков, мобильных считывателей кодов и других средств объективного контроля. Для сложных распознаваний применяются нейросети, а собранные данные автоматически передаются в систему складского учета для анализа и контроля всех объектов.
Компьютерное зрение находит применение и в других сферах, например, в ритейле сервисы видеоаналитики осуществляют контроль посетителей. Это позволяет существенно снизить уровень воровства без увеличения штата охраны.
Машинное обучение: универсальные модели под разные задачи
В сложной и дорогой транспортной отрасли нужно было снизить затраты из-за простоя техники по причине поломок вспомогательной силовой установки. Необходимо предиктивное техническое обслуживание, позволяющее своевременно предотвращать поломку.
Для создания и обучения предсказательной модели понадобился целый набор условий и данных: 30 единиц техники, 200+ параметров, 400 рейсов в год, 3 года обучения и 6 месяцев тестирования. В результате удалось на 34% сократить потери от простоя техники из-за внезапных поломок, заранее предупреждать о некоторых типах неисправностей и с точностью до 90% выявлять поломки.
Важное направление машинного обучения — рост участия в науке и здравоохранении. В медицине ML используют для генерации результатов исследований здоровых пациентов и пациентов с патологиями. А также для помощи в диагностике заболеваний по результатам рентгенологических исследований, УЗИ и МРТ. В основном задачи таких моделей сводятся к предсказанию, болен ли человек в данный момент.
Главным трендом становится работа с более мощными и универсальными ML-моделями общего назначения. Появилась возможность генерировать решения с миллиардами параметров, увеличивая таким образом точность выполнения самых разных запросов. Такие высокопроизводительные модели способны обрабатывать разные виды данных и решать широчайший спектр задач.
Сюда можно отнести рекомендательные системы в различных сферах бизнеса. На базе анализа множества бизнес-данных ML-модели могут формировать рекомендации менеджерам для принятия оперативных управленческих решений.
Еще так работает предложение товаров, фильмов или новостей на основе предпочтений пользователей, а также прогнозирование спроса на продукцию и многое другое.
Большие языковые модели: банковский сектор и доверенный ИИ
Один из крупных банков для оптимизации работы захотел собственную систему вроде ChatGPT. Решением стала безопасная интеграция LLM-моделей (аналогов ChatGPT) в контур компании с дообучением под тематику на внутренних документах и базах знаний плюс выстраивание индивидуальных бизнес-процессов. Использовались следующие инструменты:
-
InsightStream – ИИ-ассистент для доступа к информации через умный поиск в виде чата по корпоративной базе знаний, структурирования и связи разрозненных данных.
-
DiDiBot для автоматической обработки материалов рабочих встреч, писем, переписок и транскрибации. А также умного поиска по протоколам встреч и перепискам, интеграции с системами трекинга задач.
-
VirtualGuru — помощник для автоматизации экспертных консультаций и внутренней/внешней техподдержки: разбор входящих обращений, автоматизация ответов на вопросы, смесь поиска по документам, в вебе и ответов LLM.
Результат — поиск информации в банке идет быстрее в 10 раз, в 5 раз быстрее обрабатываются материалы встреч и на 30% увеличилась скорость доставки результатов. В 5-7 раз выросла эффективность сотрудников поддержки и вдвое быстрее исполняются принятые решения. А корректность маршрутизации сложносоставных писем составляет 95%.
MTS AI утверждает, что ИИ-помощник за 3 секунды анализирует внутренние базы данных, финансовую отчетность, юридические документы и предоставляет краткий, четко сформулированный ответ на запрос сотрудника. Таким образом, например, менеджеру по кредитам не нужно каждый раз вспоминать условия предоставления займа для малого бизнеса или искать их во внутренних системах, а специалисту по вкладам всегда доступна информация об актуальных ставках и программах — ИИ-помощник предоставит всю нужную информацию по текстовому запросу. Решение позволяет получать краткие обзоры документов, автоматически сравнивать разные их версии. Кроме того, ИИ-помощник способен выявлять тренды и риски, создавать структурированные отчеты и формировать подсказки для сотрудников. Наши коллеги из MTS AI поделились, что поиск по внутренним базам знаний – один из самых популярных сценариев применения LLM.
По мере того как большие языковые модели становятся умнее, на первый план выходят вопросы обеспечения безопасности и надежности данных при их использовании. Для этого нужна отдельная система, доверенный ИИ — защитный слой между пользователем и открытым ПО, который проверяет код на ошибки, устраняет уязвимости и гарантирует, что данные остаются в безопасности. Но пока нет полностью готовых решений, которые можно было бы использовать в любой ситуации.
Один из самых актуальных инструментов больших языковых моделей — RAG (Retrieval-augmented generation, поисково-дополненная генерация). За счет временного обращения к внешним данным модели ИИ могут давать более точные и персонализированные ответы с возможностью проверки источников. При этом RAG сильно сокращает вычислительные мощности и необходимость в постоянном переобучении и обновлении LLM.
Также к трендам развития генеративного ИИ относится мультимодальность, которая дает больше возможностей моделям. Они могут работать с различными форматами: текстом, аудио и видео, аналогично естественному человеческому комплексному восприятию информации. Мультимодальные модели сами создают контент и эффективно взаимодействуют с AI-ассистентами.
Ожидания и перспективы: на что обратить внимание
Думаю, никто не сомневается, что скоро ИИ найдет множество применений в креативных индустриях. А вот внедрение нейросетевых решений в промышленное производство, логистику и бизнес-процессы широкого круга компаний — более сложный и продолжительный процесс. Многие компании сталкиваются с проблемами при интеграции новых технологий.
Конечно, использование больших языковых моделей, особенно для решения комплексных задач, вызывает сомнения. Пока результаты их работы недостаточно стабильны и предсказуемы. Однако развитие предсказательной аналитики и анализа данных сулят значительные перспективы. Ключевые вызовы здесь — нехватка качественных данных и квалифицированных специалистов.
Чтобы подготовиться к внедрению таких решений, бизнесу стоит уже сейчас инвестировать в сбор и структурирование данных. Качественный датасет внутри компании облегчит внедрение любой ИИ-технологии. Также важно развивать компетенции сотрудников в области работы с данными и машинного обучения.
Искусственный интеллект — это не волшебная палочка, а мощный инструмент. При грамотном подходе он способен значительно повысить эффективность самых разных процессов. Надеюсь, мне удалось показать это на примерах наших заказчиков. При наличии хорошей инфраструктуры и квалифицированных кадров препятствий для развития не остается.
О каких кейсах внедрения ИИ в россии вы бы хотели узнать больше? Поделитесь своими мыслями в комментариях.
Автор: AnnSmirnova