
Привет, на связи Юлия Рогозина, бизнес-аналитик Шерпа Роботикс. Сегодня я перевела для вас статью про то, какие недостатки есть у языковых моделей в плане вычислений, а также, как учёные продолжают совершенствовать методы решения простейших задач.
Привет, на связи Юлия Рогозина, бизнес-аналитик Шерпа Роботикс. Сегодня я перевела для вас статью про то, какие недостатки есть у языковых моделей в плане вычислений, а также, как учёные продолжают совершенствовать методы решения простейших задач.
От теории из оригинальной академической статьи до ее реализации на Python с OpenAI, Weaviate и LangChain
В своём последнем посте я говорил об одной загадке: все большие языковые модели (LLM) ужасно играют в шахматы. Все, за исключением gpt-3.5-turbo-instruct
Читать полностью »
В мире, где технологии стремительно развиваются, HR-специалисты и рекрутеры сталкиваются с новыми вызовами. Отбор кандидатов, оценка их навыков и компетенций, а также составление тестовых заданий — все это требует значительных временных и человеческих ресурсов.
Но что, если можно было бы автоматизировать значительную часть этих процессов, сохранив при этом высокий уровень точности и персонализации?
Когда говорят про ИИ в страховании, все обычно представляют классический ML и вероятностные модели (они конечно же имеются у нас в большом количестве). Страховая отрасль богата всевозможными данными (телеметрия с авто, внешние условия, данные с сайтов и партнёров, и прочее). Все эти большие данные нужны для создания лучших предложений клиентам в рамках кастомизируемых и вариативных страховых продуктах.
Именно с ними работают математики, которых, чтобы было веселее, в страховании называют сложно выговариваемыми словами «актуарии» и «андеррайтеры».
Многие из самых популярных бенчмарков для моделей ИИ устарели или плохо разработаны.
Дисклеймер: это вольный перевод статьиЧитать полностью »
Привет, меня зовут Ирина Барская, и я руководитель службы аналитики и исследований в Яндексе. А это значит, что я и моя команда каждый день думаем, как оценивать качество работы генеративных моделей, какие при этом смотреть метрики, как вообще понять, хорошая ли модель у нас получилась.
Во первых это настоящий вызов современным LLM моделям и очень интересно как разные модели будут справляться с такой задачей.