Рубрика «машинное обучение» - 96

Специалисты МТИ создали нейросеть, которая воссоздает внешность человека по голосу - 1

23 мая исследователи Массачусетского технологического института в сотрудничестве с командой Google AI представили итоги работы над нейросетью Speech2Face, которая может по короткой аудиозаписи со звучащей речью реконструировать внешность говорящего. Разработчики не преследовали цели добиться точного сходства – проект носил экспериментальный характер и был призван показать, какой объем информации о человеке можно получить, прослушивая его голос.
Читать полностью »

ИИ датских разработчиков вычисляет школьников, заказывающих домашние работы в Сети - 1

Исследовательская группа Копенгагенского университета сообщила о результатах тестирования новой нейросети Ghostwriter. Разработанный учеными алгоритм искусственного интеллекта анализирует тексты письменных работ, которые сдают учителям школьники, чтобы установить авторство и выявить тех, кто прибегает к услугам текстовых бирж.
Читать полностью »

image

Привет!

Год назад мы проделали отличную работу. Корявенько, наполовину, но всё же отличную. Ноосфера послала мне сигнал, что пришла пора доделать её до конца. Я думал, что эта работа оказалось никому не нужна, но неделю назад известный писатель-фантаст-киберпанкер спросил меня, когда же продолжение переводов? Я ответил, что основного бойца забрали в армию год назад и пока перевод не предвидится. А через 10 часов после моего ответа — получаю письмо: «Я вернулся из армии, готов возобновить переводы.»

Тезисы:

  1. Мы рождаемся с множеством ментальных ресурсов.
  2. Мы учимся взаимодействовать с другими.
  3. Эмоции — это разные Образы Мышления.
  4. Мы учимся думать о недавних мыслях.
  5. Мы учимся думать на различных уровнях.
  6. Мы накапливаем колоссальный опыт.
  7. Мы переключаемся между различными Образами Мышления.
  8. Мы находим различные пути представления вещей.
  9. Мы строим различные модели себя.

Спасибо всем кто помогал: Станиславу Суханицкому, Savva Sumin, Victor Ivanov, urticazoku

Поэтому ждите новых глав, присоединяйтесь и помогайте с переводами (пишите в личку или на почту alexey.stacenko@gmail.com) Вот что есть готового на данный момент:
Читать полностью »

Реставрируем фотографии с помощью нейросетей - 1

Всем привет, я работаю программистом-исследователем в команде компьютерного зрения Mail.ru Group. Ко Дню Победы в этом году мы решили сделать проект по реставрации военных фотографий. Что такое реставрация фотографий? Она состоит из трех этапов:

  • находим все дефекты изображения: надломы, потертости, дырки;
  • закрашиваем найденные дефекты, основываясь на значениях пикселей вокруг них;
  • раскрашиваем изображение.

В этой статье я детально пройдусь по каждому из этапов реставрации и расскажу, как и где мы брали данные, какие сети мы учили, что у нас получилось, на какие грабли мы наступили.
Читать полностью »

Каждый год в Москве проходит конференция "Диалог", в которой участвуют лингвисты и специалисты по анализу данных. Они обсуждают, что такое естественный язык, как научить машину его понимать и обрабатывать. В рамках конференции традиционно проводятся соревнования (дорожки) Dialogue Evaluation. В них могут участвовать как представители крупных компаний, создающих решения в области обработки естественного языка (Natural Language Processing, NLP), так и отдельные исследователи. Может показаться, что если ты простой студент, то тебе ли тягаться с системами, которые крупные специалисты больших компаний создают годами. Dialogue Evaluation — это как раз тот случай, когда в итоговой турнирной таблице простой студент может оказаться выше именитой компании.

Этот год станет уже 9-ым по счету, когда на «Диалоге» проводится Dialogue Evaluation. Каждый год количество соревнований разное. Темами для дорожек уже становились такие задачи NLP, как анализ тональности (Sentiment Analysis), разрешение лексической многозначности (Word Sense Induction), нахождение опечаток (Automatic Spelling Correction), выделение сущностей (Named Entity Recognition) и другие.

Соревнование ML-систем на лингвистическом материале. Как мы учились заполнять пропуски - 1В этом году четыре группы организаторов подготовили такие дорожки:

  • Генерация заголовков для новостных статей.
  • Разрешение анафоры и кореференции.
  • Морфологический анализ на материале малоресурсных языков.
  • Автоматический анализ одного из видов эллипсиса (гэппинга).

Сегодня мы расскажем про последнюю из них: что такое эллипсис и зачем учить машину восстанавливать его в тексте, как мы создавали новый корпус, на котором можно решить эту задачу, как проходили сами соревнования и каких результатов смогли добиться участники.
Читать полностью »

Нейронные сети предпочитают текстуры и как с этим бороться - 1

В последнее время вышло несколько статей с критикой ImageNet, пожалуй самого известного набора изображений, использующегося для обучения нейронных сетей.

В первой статье Approximating CNNs with bag-of-local features models works surprisingly well on ImageNet авторы берут модель, похожую на bag-of-words, и в качестве "слов" используют фрагменты из изображения. Эти фрагменты могут быть вплоть до 9х9 пикселей. И при этом, на такой модели, где полностью отсутствует какая-либо информация о пространственном расположении этих фрагментов, авторы получают точность от 70 до 86% (для примера, точность обычной ResNet-50 составляет ~93%).

Во второй статье ImageNet-trained CNNs are biased towards texture авторы приходят к выводу, что виной всему сам набор данных ImageNet и то, как изображения воспринимают люди и нейронные сети, и предлагают использовать новый датасет – Stylized-ImageNet.

Более подробно о том, что на картинках видят люди, а что нейронные сети Читать полностью »

Рекомендательные системы: идеи, подходы, задачи - 1

Многие привыкли ставить оценку фильму на КиноПоиске или imdb после просмотра, а разделы «С этим товаром также покупали» и «Популярные товары» есть в любом интернет- магазине. Но существуют и менее привычные виды рекомендаций. В этой статье я расскажу о том, какие задачи решают рекомендательные системы, куда бежать и что гуглить.
Читать полностью »

ИИ Microsoft генерирует реалистичную речь с минимальным обучением - 1

В своем новом проекте компании Microsoft удалось значительно усовершенствовать технологии генерации речи. Разработанную нейросеть отличает естественное произношение, практически неотличимая от человеческой, и малый объем размеченной выборки, необходимой для обучения.
Читать полностью »

В ближайшие годы крупнейшие государственные компании России должны пройти цифровую трансформацию и внедрить новейшие компьютерные технологии. Как стало известно РБК, Минкомсвязь разослала в ряд госкомпаний проект методических рекомендаций по разработке стратегий цифровой трансформации госкорпораций и компаний с госучастием. Документ должны обсудить на совещании 27 мая, а окончательную версию министерство обязано утвердить до 31 мая (согласно программе «Цифровая экономика»).

Каждая госкомпания обязана назначить специалиста на должность CDO (директор по цифровым трансформациям) с широкими полномочиями по изменению бизнес-процессов в компании.

Информированные источники приводят список требований, которые выдвигаются к государственным компаниям.Читать полностью »

Полный курс на русском языке можно найти по этой ссылке.
Оригинальный курс на английском доступен по этой ссылке.

Введение в глубокое обучение с использованием TensorFlow - 1
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js