Первый металлургический ML-хакатон от ОМК ИТ. Погодите, что???

в 11:21, , рубрики: llm, металлургия, омк, промт, Промышленное программирование, промышленность, сталь, хакатон

Привет! На связи Объединенная металлургическая компания. 

У нас важная новость для всех ML-специалистов и тех, кто неравнодушен к теме ИИ.

Мы не сильно удивим вас, сказав, что ОМК ИТ уже давно использует искусственный интеллект в своей работе. Но вот хакатона по LLM у нас еще не было. Пришло время его объявить! 

Первый металлургический ML-хакатон от ОМК ИТ. Погодите, что??? - 1

Какую задачу решаем

В металлургии есть такое понятие как сортамент. Если по-простому – это список характеристик металлического изделия. Допустим: «широкополосный прокат (базовое исполнение), марка стали 09Г2С, толщина проката 25, класс прочности 325, категория 12 по ГОСТ 19281-2014». 

Зная, с каким изделием мы имеем дело, можно принять ряд решений по дальнейшей работе с ним. Например, определить перечень необходимых испытаний для соответствия изделия ГОСТу. Или обозначить и определить приемочные границы этих испытаний.

Все характеристики и действия строго зарегламентированы Нормативно-Технической Документацией (НТД), особой вариативности тут нет. 

Наша задача на первый взгляд очень простая. Нам нужна LLM, на вход которой мы подаем характеристики сортамента. А на выходе получаем список необходимых испытаний, свойств и допустимых границ. 

Эта задача имеет максимальное практическое применение. Используя подобную LLM получится автоматизировать процесс поиска по НТД. И, наверняка, это поможет избежать ошибок, связанных с человеческим фактором.

А как сейчас?

Сейчас эту задачу решают технологи и сотрудники ОТК, знающие ГОСТы если не наизусть, то близко к этому. Они собирают по всем текстам и табличкам нужные сведения и вносят в информационные системы. Когда что-то забывается, они берут на столе распечатку ГОСТа и сверяются с ней.

Зачем тут LLM

На первый взгляд может показаться, что ИИ в данной работе избыточен. Ведь задача линейная. По сути, нам нужен поисковик по справочнику, логически выглядящий как ряд входных условий. По этим условиям и находится нужная информация. 

Проблем тут две. 

Во-первых, у нас может быть огромное число вариантов того, что придет нам на вход. Прописать эту вариативность вручную часто нереально, нужна какая-то автоматизированная система, способная обучаться самостоятельно.

Во-вторых, НТД (т.е. набор ГОСТов) оцифрована очень неоднородно. Она точно есть в виде бумажных справочников, а вот в электронном виде как повезет. Может оказаться не текстом, а, скажем, PDF-файлом или вообще PNG-картинкой.

Таким образом нам нужно распознать характеристики сортамента и запрос, найти необходимые ГОСТы, достать из них нужную информацию и дать на выход. Уже тянет на искусственный интеллект, да? 

Пример связности характеристик сортамента и их механических свойств
Пример связности характеристик сортамента и их механических свойств

Только в реальности и характеристик больше, и колонок справа. А еще Заказчики могут эпистолярно в комментариях к заказу что-нибудь еще заковыристое написать.

Примеры промптов и ответы на них

Чуть-чуть примеров того, что мы хотим получить. 

Что может поступить на вход в составе промта

  • Марка стали;

  • Толщина проката;

  • Класс прочности (не для всех НТД требуется);

  • Категория металлопроката (не для всех НТД требуется);

  • НТД (нормативно-техническая документация на продукцию);

  • Дополнительная информация о типе проката и исполнении (в наших примерах прокат широкополосный).

Мы готовы получить и принять определённые условия от участников. Скажем, если ваша модель сможет работать только со стандартизированным промтом, в котором важна последовательность параметров – ОК, давайте обсуждать. Мы всю жизнь работаем с ГОСТами, для нас формы и правила не пустой звук. Мы готовы формулировать промты правильно.

Примеры промптов и правильных ответов LLM

Запрос № 1

Перечислите перечень испытаний для широкополосного проката (базовое исполнение), марка стали 09Г2С, толщина проката 25, класс прочности 325, категория 12 для ГОСТ 19281-2014.

Ответ

Временное сопротивление, предел текучести, относительное удлинение, ударная вязкость -40 (KCU), ударная вязкость (KCU) мех. старение при комнатной температуре.

Следующие запросы ориентированы на определение границ механического свойства. Свойство может ограничиваться только минимальным/максимальным или максимальным/минимальным значениями.

Запрос № 2

Какие границы для испытания на временное сопротивление для широкополосного проката (базовое исполнение), марка стали 09Г2С, толщина проката 25, класс прочности 325, категория 12 для ГОСТ 19281-2014?

Ответ

Минимальная граница 450 Мпа.

Запрос № 3

Какие границы для испытания на временное сопротивление для широкополосного проката, марка стали Ст3сп, толщина проката 20, категория 5 для ГОСТ 14637-89?

Ответ

Минимальная граница 370 Мпа. Максимальная граница 480 МПа.

Что даём взамен

Пока нам не удается решить задачу своими силами. Поэтому мы и хотим обратиться к помощи специалистов, которые, возможно, смогут найти какое-то свежее и рабочее решение. Мы не ожидаем, что вы сможете дать полностью готовую модель со стопроцентным попаданием в промт. Скорее, хакатон будет первым шагом в большой работе. Но, кто знает? Вдруг найдется тот, кто решит задачу сразу?

В любом случае, мы выберем трех победителей, которые получат каждый свой приз. 

  1. Первое место. Сертификат на покупки в Озоне на 75 тыс рублей.

  2. Второе место. Сертификат на покупки в Озоне на 50 тыс рублей.

  3. Третье место. Сертификат на покупки в Озоне на 25 тыс рублей.

С людьми или компаниями, добившимися наибольшего успеха в решении задачи, ОМК ИТ будет готов продолжить сотрудничество на коммерческих условиях.

Напоминаем, это крайне практическая задача. Подобные проблемы стоят не только перед ОМК ИТ, а перед всеми, кто связан с тяжелой металлургией. И получившийся продукт, в случае его удачи, будет иметь огромные перспективы. 

Отдельно отметим, что мы не ожидаем от участников глубоких знаний в сфере тяжелой металлургии. И уж совсем мы не ждем знания ГОСТов. Задача исключительно на правильный поиск информации и связку «стандартизированный промт» - «выжимка из нужных ГОСТов».

“Нужные” ГОСТы приводим ниже:

https://docs.cntd.ru/document/1200113779

https://docs.cntd.ru/document/1200000119

Как принять участие

Что нужно для участия в новом хакатоне? Вам нужно сделать следующее:

  1. В комментариях к этой статье написать "участвую".

  2. Также в комментах вы можете задавать уточняющие вопросы. Однако, всем заинтересованным предлагаем сразу перейти вот в эту ТГ-группу. В ней есть наши эксперты, они помогут с более специфичными вопросами, не стесняйтесь задавать им вопросы!

  3. Свои решения необходимо загрузить через форму (с использованием гитхаб).

  4. Сроки приема ответов до 3 ноября.

  5. Итоги подведем отдельным постом после 11 ноября.

Дерзайте и удачи)

Автор: OMK_IT

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js