Специалисты Массачусетского технологического института, лаборатории Artificial Intelligence Laboratory и института Institute of Medical Engineering and Science разработали алгоритм, способный анализировать эмоциональный окрас речи. То, что большинство людей воспринимает даже не задумываясь, для электроники является крайне сложной задачей.
Используя механизмы глубокого обучения, система способна анализировать аудиоинформацию и даже текстовые транскрипции, определяя общий тон речи с точностью до 83%.
В рамках исследования участники носили устройство, которое разработчики называют Samsung Simband. Судя по внешнему виду, это умные часы Galaxy Gear S. В данном случае они были выбраны из-за наличия разнообразных датчиков, которые помогали собирать больше данных в процессе разговора. Нужно отметить, что оценка не производилась непосредственно на носимом устройстве в режиме реального времени. Речь записывалась, затем переводилась в текст, а потом системе отдавали все эти данные, дополненные информацией с датчиков часов.
Разработчики алгоритма говорят о пользе таких технологий для людей, страдающих синдромом Аспергера, подверженных тревожным состояниям и прочим расстройствам психики, которые мешают корректно воспринимать эмоциональный окрас речи, а значит и нередко её смысл. Но подобные же технологии можно использовать и в других целях, не связанных неврологическими отклонениями.
Источник:
MIT