Рубрика «mistral»

Шлепа — Большой Русский Бенчмарк - 1

Здарова! На связе лаборатория Вихрей, сегодня мы расскажем про наш бенчмарк, Шлёпа — большой русский бенчмарк.

Что есть сейчас для оценки русскоязычных LLM

Mera — бенчмарк от Альянса искусственного интеллекта, использует тесты и генерацию, сабмит через сайт, сайт почти не обновлялся с зимы. Почитать про него можно тут


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js