Главная

Немцы создали библиотеку пьяных аудиозаписей

2014-12-05 в 12:30, admin, рубрики: big data, data mining, автомобили, лингвистический анализ, машинное обучение, пьянству бой

Эпиграф:
— Пил?
— Не пил!
— Скажи Гибралтар.
— Пил.

Тема немного курьезная, но мне кажется, что именно таких в последнее время не хватает на Хабре. Особенно в пятницу.

Немцы создали библиотеку пьяных аудиозаписей - 1

Итак, немецкие ученые из двух университетов Мюнхена создали базу аудизаписей, где записа речь 162-х людей в состояние алкогольного опьянения. Данные собирались с 2007 года по 2009 и теперь на основании базы данных создается языковой корпус (статья о корпусах на Вики) Alcohol Language Corpus (ALC).

Корпус предполагается использовать для машинного обучения, чтобы автоматизационные системы (к примеру, в автомобиле) автоматически распознавали состояние хозяина и блокировали управление. Таким образом предполагается бороться с бессовестным человеческим фактором.

До этого несколько автомобильных концернов работали над детектированием пьяного поведения. Но тогда речь шла либо о датчиках, улавливающих пары алкоголя (и иногда ложно срабатывающих при присутствии пьяного пассажира), анализа пота на рукоятке переключения скоростей, или камер, пристально вглядывающихся в лицо водителя. Но, судя по всему, до анализа речи никто пока не додумался.

Стоимость набора записей — порядка $1200 (внушительная сумма за 162 структурированные речи немецких алкоголиков :)
Кстати, вот пример из базы.

Новость закончена, можете ставить минус за краткость.

Автор: Maslukhin

Источник