Рубрика «обучение моделей»

Привет! В продолжение моей предыдущей статьи о локальном переводчике на кабардинском языке хочу поделиться практическим опытом обучения моделей машинного перевода для низкоресурсных языков. Расскажу о том, с какими проблемами я столкнулся, как их решал, и покажу конкретный код, который помог улучшить качество перевода с BLEU 8 до 28 пунктов.

Введение: три кита обучения переводчиков

Обучение моделей перевода - нетривиальная задача, которая опирается на три ключевых элемента:

1. Корпус параллельных текстов

Читать полностью »

Когда пришло время выбирать тему диплома, я, как и многие студенты, понятия не имел, о чём писать. После мозгового штурма с одногруппниками родилась идея, которая из простого «варианта для защиты» превратилась в полноценный инженерный проект: «исследование и разработка системы автоматического распознавания дефектов печатных плат».

Со временем я понял, что выбрал тему не случайно - это реально актуальная задача для производства, где качество пайки напрямую влияет на работоспособность устройств, а ещё отличный шанс пройти весь цикл Computer Vision проекта от сбора данных до обучения моделей.

Читать полностью »

Команда JavaScript for Devs подготовила перевод статьи Пола Кинлана о том, почему новые веб-фреймворки сегодня оказываются «мёртвыми при рождении». Автор утверждает: сочетание сетевых эффектов, экосистемы React и обучения LLM формирует замкнутый цикл, в котором альтернативы просто не успевают набрать критическую массу.


Это мои личные размышления о том, что может происходить по мере того, как всё больше разработчиков используют LLM и фреймворки для разработки под веб.

В октябре прошлого года я написал текст под названием «Читать полностью »

В 2022 году случился «нейросетевой бум» – генеративные модели вроде Midjourney вышли из лабораторий и стали доступны широкому кругу людей. Уже несколько лет нейросети являются одной из самых популярных тем для обсуждения в арт-сообществе, вызывая волну споров, страхов и мифов.

В этой статье я хочу разобраться во всем этом и разложить по полочкам – отделить мифы от реальности, обсудить популярные аргументы сторонников ИИ, например, сравнение с фотографией, обсудить возможность охраны промпта авторским правом, а также проанализировать ситуацию с обучением моделей и «добросовестным использованием».

Читать полностью »

Если нужно сгенерировать синтетические данные — подборка открытых решений - 1

Про снижение расходов на работу с данными расскажемЧитать полностью »

Про NER написано немало, но этот материал носит прикладной характер. Статья будет полезна тем, кто интересуется NLP и ищет разные подходы для решения узкопрофильных задач, требующих извлечения сущностей из текста.

Для джунов это возможность пройти весь путь — от разметки данных до обучения собственной кастомной NER-модели, попутно понять типичные сложности и ограничения.

Читать полностью »

Для каких типов обучений нейросетевых моделей подходят ускорители AMD - 1

Введение

Привет! В прошлом материале мы рассказывали про графические ускорители для ЦОДЧитать полностью »

Адаптировали статью Marina Tosic, в которой автор выясняет, в чём сходства и различия между устройством человеческого мозга и моделей машинного обучения. Разобраться в теме нам помогли: кандидат технических наук Василий Борисов и архитектор ML-решений в РБК Кирилл Думнов.

В 2024 году значение машинного обучения и искусственного интеллекта, наконец, признали все, в том числе Нобелевский комитет. Демис Хассабис и Джон Джампер получили Нобелевскую премию по химииЧитать полностью »

Мизерный объем задач с ответами может разбудить спящего LLM-льва...

Мизерный объем задач с ответами может разбудить спящего LLM-льва...

"Мы представляем фундаментальное открытие, которое бросает вызов нашему пониманию того, как сложные рассуждения возникают в больших языковых моделях"Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js