Рубрика «обучение моделей»

Как создать переводчик для низкоресурсного языка: практическое руководство

2025-12-25 в 16:49, admin, рубрики: изучение языков, кабардинский, обучение моделей, переводчики, синтез речи, ударение

Привет! В продолжение моей предыдущей статьи о локальном переводчике на кабардинском языке хочу поделиться практическим опытом обучения моделей машинного перевода для низкоресурсных языков. Расскажу о том, с какими проблемами я столкнулся, как их решал, и покажу конкретный код, который помог улучшить качество перевода с BLEU 8 до 28 пунктов.

Введение: три кита обучения переводчиков

Обучение моделей перевода - нетривиальная задача, которая опирается на три ключевых элемента:

1. Корпус параллельных текстов

Читать полностью »

Как я собрал и подготовил датасет дефектов печатных плат для обучения моделей YOLO

2025-11-20 в 22:47, admin, рубрики: computer vision, dataset, labeling, machine learning, pcb, yolo, машинное обучение, обучение моделей, разметка датасета, учусь программировать

Когда пришло время выбирать тему диплома, я, как и многие студенты, понятия не имел, о чём писать. После мозгового штурма с одногруппниками родилась идея, которая из простого «варианта для защиты» превратилась в полноценный инженерный проект: «исследование и разработка системы автоматического распознавания дефектов печатных плат».

Со временем я понял, что выбрал тему не случайно - это реально актуальная задача для производства, где качество пайки напрямую влияет на работоспособность устройств, а ещё отличный шанс пройти весь цикл Computer Vision проекта от сбора данных до обучения моделей.

Читать полностью »

Теория мёртвых фреймворков

2025-11-17 в 14:59, admin, рубрики: llm, React, будущее веба, веб-платформа, инструменты, обучение моделей, разработчики, тренды, фреймворки, экосистема

Команда JavaScript for Devs подготовила перевод статьи Пола Кинлана о том, почему новые веб-фреймворки сегодня оказываются «мёртвыми при рождении». Автор утверждает: сочетание сетевых эффектов, экосистемы React и обучения LLM формирует замкнутый цикл, в котором альтернативы просто не успевают набрать критическую массу.

Это мои личные размышления о том, что может происходить по мере того, как всё больше разработчиков используют LLM и фреймворки для разработки под веб.

В октябре прошлого года я написал текст под названием «Читать полностью »

Нажал кнопку – художник? Как нейросети меняют законы об авторском праве

2025-10-31 в 13:16, admin, рубрики: fair use, midjourney, stablediffusion, авторское право, генерация изображений, нейросети, обучение моделей, промпты, этика ии

В 2022 году случился «нейросетевой бум» – генеративные модели вроде Midjourney вышли из лабораторий и стали доступны широкому кругу людей. Уже несколько лет нейросети являются одной из самых популярных тем для обсуждения в арт-сообществе, вызывая волну споров, страхов и мифов.

В этой статье я хочу разобраться во всем этом и разложить по полочкам – отделить мифы от реальности, обсудить популярные аргументы сторонников ИИ, например, сравнение с фотографией, обсудить возможность охраны промпта авторским правом, а также проанализировать ситуацию с обучением моделей и «добросовестным использованием».

Читать полностью »

130+ датасетов для машинного обучения: гид, который сэкономит часы поиска нужных данных

2025-10-08 в 9:08, admin, рубрики: ML-репозитории, где искать датасет, датасеты, Компьютерное зрение, машинное обучение, наборы данных, обработка естественного языка, обучение моделей, подборка датасетов для ML, распознавание речи

Читать полностью »

Если нужно сгенерировать синтетические данные — подборка открытых решений

2025-07-30 в 13:22, admin, рубрики: llm, ml, MWS, данные, датасеты обучения, обучение моделей, синтетические данные

Про снижение расходов на работу с данными расскажем Читать полностью »

Что такое NER, зачем он нужен и когда не поможет

2025-06-25 в 13:37, admin, рубрики: named entity recognition, natural language processing, ner, nlp, spacy, нейросети python, обучение моделей, примеры кода

Про NER написано немало, но этот материал носит прикладной характер. Статья будет полезна тем, кто интересуется NLP и ищет разные подходы для решения узкопрофильных задач, требующих извлечения сущностей из текста.

Для джунов это возможность пройти весь путь — от разметки данных до обучения собственной кастомной NER-модели, попутно понять типичные сложности и ограничения.

Читать полностью »

Для каких типов обучений нейросетевых моделей подходят ускорители AMD

2025-04-28 в 13:04, admin, рубрики: amd, fplus, gpu, Nvidia, Видеокарты, видеокарты AMD, обучение моделей, обучение нейросетевых моделей, сравнение видеокарт, ускорители AMD

Введение

Привет! В прошлом материале мы рассказывали про графические ускорители для ЦОД Читать полностью »

Человеческий мозг против ML-модели: сходства и различия между психикой и машинным обучением

2025-03-06 в 10:50, admin, рубрики: AGI, ml-модель, алгоритмы машинного обучения, ИИ, инженерия, кластеризация, машинное обучение, мозг-компьютер, обучение моделей, человеческий разум

Адаптировали статью Marina Tosic, в которой автор выясняет, в чём сходства и различия между устройством человеческого мозга и моделей машинного обучения. Разобраться в теме нам помогли: кандидат технических наук Василий Борисов и архитектор ML-решений в РБК Кирилл Думнов.

В 2024 году значение машинного обучения и искусственного интеллекта, наконец, признали все, в том числе Нобелевский комитет. Демис Хассабис и Джон Джампер получили Нобелевскую премию по химии Читать полностью »

LIMO: Меньше — значит больше для рассуждающих LLM

2025-02-13 в 19:44, admin, рубрики: llm, qwen2.5, обучение моделей, рассуждения

Мизерный объем задач с ответами может разбудить спящего LLM-льва...

"Мы представляем фундаментальное открытие, которое бросает вызов нашему пониманию того, как сложные рассуждения возникают в больших языковых моделях"Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «обучение моделей»

Как создать переводчик для низкоресурсного языка: практическое руководство

Введение: три кита обучения переводчиков

1. Корпус параллельных текстов

Как я собрал и подготовил датасет дефектов печатных плат для обучения моделей YOLO

Теория мёртвых фреймворков

Нажал кнопку – художник? Как нейросети меняют законы об авторском праве

130+ датасетов для машинного обучения: гид, который сэкономит часы поиска нужных данных

Если нужно сгенерировать синтетические данные — подборка открытых решений

Что такое NER, зачем он нужен и когда не поможет

Для каких типов обучений нейросетевых моделей подходят ускорители AMD

Введение

Человеческий мозг против ML-модели: сходства и различия между психикой и машинным обучением

LIMO: Меньше — значит больше для рассуждающих LLM