Команда Яндекса выложила в открытый доступ нейросеть YaLM 100B для создания и обработки текстов на русском и английском языках.
Как отмечают в пресс-службе, это самая большая GPT-подобная модель, опубликованная в свободном доступе. Теперь её могут использовать разработчики и исследователи со всего мира.
YaLM 100В содержит 100 млрд параметров — больше, чем какая-либо из существующих моделей для русского языка. Это позволяет использовать её для решения большого круга задач, связанных с обработкой естественного языка. В Яндексе рассказали:
Языковые модели из семейства YaLM определяют принцип построения текста и генерируют новые, опираясь на законы лингвистики и свои знания о мире. Например, они способны придумывать идеи для рекламных кампаний, создавать описания товаров и видео. С их помощью можно генерировать любые тексты (стихи, ответы, поздравления и так далее), а также классифицировать их, например, по стилю речи.
Команда Яндекса использует нейросети YaLM более чем в 20 проектах, в том числе в фирменном поиске и голосовом помощнике Алисе.
Модель обучали на суперкомпьютерах Яндекса, которые были признаны самыми мощными в Восточной Европе. В процессе обучения YaLM 100B обработала около 2 ТБ текстов из открытых датасетов и интернета на английском и русском языках. Модель предоставляется по открытой лицензии Apache 2.0 и доступна на GitHub.