Эпиграф:
— Пил?
— Не пил!
— Скажи Гибралтар.
— Пил.
Тема немного курьезная, но мне кажется, что именно таких в последнее время не хватает на Хабре. Особенно в пятницу.
Итак, немецкие ученые из двух университетов Мюнхена создали базу аудизаписей, где записа речь 162-х людей в состояние алкогольного опьянения. Данные собирались с 2007 года по 2009 и теперь на основании базы данных создается языковой корпус (статья о корпусах на Вики) Alcohol Language Corpus (ALC).
Корпус предполагается использовать для машинного обучения, чтобы автоматизационные системы (к примеру, в автомобиле) автоматически распознавали состояние хозяина и блокировали управление. Таким образом предполагается бороться с бессовестным человеческим фактором.
До этого несколько автомобильных концернов работали над детектированием пьяного поведения. Но тогда речь шла либо о датчиках, улавливающих пары алкоголя (и иногда ложно срабатывающих при присутствии пьяного пассажира), анализа пота на рукоятке переключения скоростей, или камер, пристально вглядывающихся в лицо водителя. Но, судя по всему, до анализа речи никто пока не додумался.
Стоимость набора записей — порядка $1200 (внушительная сумма за 162 структурированные речи немецких алкоголиков :)
Кстати, вот пример из базы.
Новость закончена, можете ставить минус за краткость.
Автор: Maslukhin