Рубрика «машинное обучение» - 32

Теперь наш синтез на 20 языках

2022-06-06 в 17:35, admin, рубрики: diy или сделай сам, natural language processing, text-to-speech, TTS, голосовые интерфейсы, звук, машинное обучение, синтез речи

hero_image

В нашей прошлой статье мы ускорили наши модели в 10 раз, добавили новые высококачественные голоса и управление с помощью SSML, возможность генерировать аудио с разной частотой дискретизации и много других фишек.

В этот раз мы добавили:

1 высококачественный голос на русском языке (eugeny);
Синтез на 20 языках, 174 голоса;
В список языков входят 5 языков народов СНГ: калмыцкий, русский, татарский, узбекский и украинский;
В список языков входят 5 вариаций на тему романо-германских языков: английский, индийский английский, испанский, немецкий, французский;
Также в список языков входят 10 языков народов Индии;
Новую значительно улучшенную модель для простановки ударений и буквы ё со словарем в 4 миллиона слов и точностью 100% (но естественно с рядом оговорок);
Все модели наследуют все "фишки" прошлого релиза, кроме автоматической простановки ударений для языков отличных от русского;

Пока улучшение интерфейсов мы отложили на некоторое время. Ускорить модели еще в 3+ раза мы тоже смогли, но пока с потерей качества, что не позволило нам обновить их прямо в этом релизе.

Попробовать модель как обычно можно в нашем репозитории и в колабе.

Читать полностью »

Рейтинг русскоязычных энкодеров предложений

2022-06-05 в 19:18, admin, рубрики: BERT, natural language processing, python, sentence encoder, бенчмаркинг, машинное обучение, Семантика, энкодер предложений

Энкодер предложений (sentence encoder) – это модель, которая сопоставляет коротким текстам векторы в многомерном пространстве, причём так, что у текстов, похожих по смыслу, и векторы тоже похожи. Обычно для этой цели используются нейросети, а полученные векторы называются эмбеддингами. Они полезны для кучи задач, например, few-shot классификации текстов, семантического поиска, или оценки качества перефразирования.

Читать полностью »

Система распознавания шрифта Брайля. Читаем написанное белым по белому

2022-05-31 в 10:34, admin, рубрики: accessibility, braille, cnn, machine learning, object detection, Блог компании Open Data Science, Брайль, машинное обучение, обработка изображений

В 2018 году мы взяли из детдома в семью слепую девочку Анжелу. Тогда я думал, что это чисто семейное обстоятельство, никак не связанное с моей профессией разработчика систем компьютерного зрения. Но благодаря дочери через два года появилась программа и интернет-сервис для распознавания текстов, написанных шрифтом Брайля - Angelina Braille Reader.

Читать полностью »

Работа в Data Science: что важно знать и как этому научиться

2022-05-29 в 18:30, admin, рубрики: artificial intelligence, big data, career, data science, machine learning, self-education, искусственный интеллект, Карьера в IT-индустрии, машинное обучение

О чем это все?

Сегодня словосочетания вроде Data Science, Machine Learning, Artificial Intelligence очень популярны. При этом нередко под ними понимаются довольно разные вещи. Это зачастую смущает и запутывает людей, желающих войти в специальность: трудно разобраться, с чего начать, что действительно нужно, а что необязательно для начала. Не претендуя на общность, расскажем, как это видится на основе десятка лет опыта c решением такого рода задач для крупных клиентов со всего мира (сервис / заказная разработка / аутсорс – подставьте термин по вкусу).

Читать полностью »

Насколько естественен естественный язык? Представляем датасет RuCoLA

2022-05-24 в 9:02, admin, рубрики: github, natural language processing, open source, Исследования и прогнозы в IT, корпус текстов, лидерборд, лингвистика, машинное обучение, открытые данные

В последние годы в области NLP произошла настоящая революция: огромные нейросети, предобученные на сотнях гигабайт текстов, бьют все известные рекорды качества. Но обладают ли такие нейросети чутьём на «естественность» текста, которое есть у носителей языка? Оценка предложения по внутреннему чутью в лингвистике получила название приемлемости; умение давать подобную оценку — ещё один шаг на пути к общему пониманию языка. Чтобы узнать, насколько хорошо нейросети для русского языка справляются с этой задачей, мы публикуем RuCoLA (Russian Corpus of Linguistic Acceptability) — датасет русскоязычных предложений, размеченных по бинарной шкале приемлемости. Это совместный труд команды исследователей и NLP-разработчиков из SberDevices, ABBYY, Yandex Research, Huawei Noah’s Ark Lab и Факультета компьютерных наук ВШЭ. Также мы открываем лидерборд на данных RuCoLA, чтобы любой желающий мог проверить способности своих моделей или поучаствовать в развитии методов для оценки приемлемости.
Читать полностью »

Как нарисовать Мону Лизу без кистей и красок?

2022-05-22 в 16:13, admin, рубрики: искусственный интеллект, искусство, машинное обучение, обучение с подкреплением

Рисуем Мону Лизу используя глубокое обучение с подкреплением

Как нарисовать Мону Лизу без кистей и красок? - 1

Пост написан специально для всех любителей искусства (и, возможно, машинного обучения).

На самом деле, специально для лучшего курса по ML.

Читать полностью »

Мой опыт с резиновым мужиком. Github Copilot

2022-05-19 в 5:26, admin, рубрики: copilot, github, python, машинное обучение, ненормальное программирование, Программирование, секс-робот, хабра-папа

Читать полностью »

C++ магистрали потоков и древо алгоритма

2022-05-15 в 12:06, admin, рубрики: application architecture, c++, channel, execution_tree, mutexless, template, thread, thread_highways, машинное обучение, Программирование

Привет. В этой публикации речь пойдёт о многопоточке, каналах, подписках, планировании регулярных задач, мониторинге, нейросетях и самоэволюционирующих алгоритмах.

Для начала небольшое вступление, а потом пойдёт C++ код.

Читать полностью »

NNHelper – пакет на языке Go для создания и использования нейронной сети

2022-05-08 в 1:32, admin, рубрики: Go, golang, machinelearning, neural networks, машинное обучение, нейронная матрица, нейронная сеть

Краткое содержание

Данная статья описывает работу пакета nnhelper, предназначенного для создания и использования нейронных сетей в программах на языке Go.

Читать полностью »

MLOps меняет процесс разработки моделей машинного обучения

2022-04-30 в 19:01, admin, рубрики: devops, machine learning, mlops, машинное обучение

Промышленные решения, основанные на машинном обучении — это гораздо больше, чем просто модель. Три ключевые концепции, охватывающие управление версиями, тестирование и конвейеры, являются основой для операций машинного обучения (MLOps), которые помогают группам по анализу данных быстрее и увереннее выпускать модели.

MLOps меняет процесс разработки моделей машинного обучения - 1

Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «машинное обучение» - 32

Теперь наш синтез на 20 языках

Рейтинг русскоязычных энкодеров предложений

Система распознавания шрифта Брайля. Читаем написанное белым по белому

Работа в Data Science: что важно знать и как этому научиться

О чем это все?

Насколько естественен естественный язык? Представляем датасет RuCoLA

Как нарисовать Мону Лизу без кистей и красок?

Рисуем Мону Лизу используя глубокое обучение с подкреплением

Мой опыт с резиновым мужиком. Github Copilot

C++ магистрали потоков и древо алгоритма

NNHelper – пакет на языке Go для создания и использования нейронной сети

Краткое содержание

MLOps меняет процесс разработки моделей машинного обучения

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «машинное обучение» - 32

О чем это все?

Рисуем Мону Лизу используя глубокое обучение с подкреплением

Краткое содержание

Новости

Актуальные темы

Архив