Главная

Рубрика «чувашский язык»

Встречайте чувашский язык в Яндекс.Переводчике: как мы решаем главную проблему машинного перевода

2020-02-11 в 7:52, admin, рубрики: Блог компании Яндекс, изучение языков, команда яндекс.переводчика, машинное обучение, нейросети, переводчик, поисковые технологии, Разработка веб-сайтов, чувашский язык, яндекс

Регионы России — это не просто границы на карте. В каждом регионе есть свои культурные традиции, во многих — свои языки. Машинный перевод мог бы помочь сохранять и применять эти языки — в частности, публиковать статьи в Википедии. Но как быть, если данных для обучения машинного интеллекта недостаточно?

Сегодня мы расскажем о нашем подходе на примере чувашского языка, которому мы обучили Яндекс.Переводчик. По данным последней переписи населения, этот язык считают родным более миллиона человек.

Встречайте чувашский язык в Яндекс.Переводчике: как мы решаем главную проблему машинного перевода - 1

Читать полностью »

Передача знания и Нейронный машинный перевод на практике

2019-11-13 в 16:40, admin, рубрики: big data, colab, sockeye, transfer learning, Алгоритмы, машинное обучение, нейронные сети, нейронный перевод, чувашский язык

Нейронный машинные перевод (НМП, англ. Neural Machine Translation, NMT) развивается очень быстро. Сегодня, чтобы собрать свой переводчик, не нужно иметь два высших образования. Но чтобы обучить модель, нужен большой параллельный корпус (корпус, в котором предложению на исходном языке сопоставлен его перевод). На практике речь идет хотя бы об одном миллионе пар предложений. Есть даже отдельная большая область НМП, исследующая методы обучения языковых пар с малым количеством данных в электронном виде (англ. Low Resource NMT).

Мы собираем чувашско-русский корпус и параллельно смотрим, что можно сделать с имеющимся объемом данных. В этом примере использовали корпус из 90 000 пар предложений. Самый хороший результат на данный момент дал метод передачи знания (англ. Transfer Learning), о нем и пойдет речь в статье. Цель статьи — дать практический пример реализации, который легко можно было бы воспроизвести.Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Обсуждаемое

Рекомендуем

Рубрика «чувашский язык»

Встречайте чувашский язык в Яндекс.Переводчике: как мы решаем главную проблему машинного перевода

Передача знания и Нейронный машинный перевод на практике

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «чувашский язык»

Встречайте чувашский язык в Яндекс.Переводчике: как мы решаем главную проблему машинного перевода

Передача знания и Нейронный машинный перевод на практике

Новости

Актуальные темы

Архив