После интересной публикации об изобретении для глухо-немых (См. «Украинские студенты создали перчатки, переводящие язык жестов в речь»), за авторов которых был искренне рад, я выразил в комментариях своё сомнение о практической пользе такого новшества на текущий момент, будучи уверен в том, что на сегодня вряд ли получится какой-либо действенный инструмент, способный реально помочь понимать язык жестов.
А не получится он ровно по той же самой причине, которая препятствует созданию качественного естественно-язычного машинного переводчика. И причина эта кроется ровно в том, что компьютер, как мы знаем, не обучен понимать СМЫСЛ языкового сообщения, будь оно представлено, хоть, в вербальном виде, хоть, в эпистолярном (текстовом) виде, или даже в виде жестов.
Машина способна воспринимать лишь алгоритмизированные вещи, например, некоторые правила из области лингвистики. Но с их помощью нельзя закрыть СМЫСЛОВОЕ ПРОСТРАНСТВО, которое является НАДлингвистическим и потому НЕ ФОРМАЛИЗУЕТСЯ в рамках лингвистических правил.
Чтобы понимать (извлекать) Смысл из любого языкового сообщения, в том числе и жестового, человеку-реципиенту (видящему, слышащему, читающему...) речи, текста, жестов… нужно иметь в своем сознании (памяти) некую БАЗУ некоторого числа Моделей Поведения Образов (МПО), которых должно хватить на распознавание ЗАМЫСЛА, заложенного в этом языковом сообщении (речи, тексте, жестах...) автором. Так вот, эти МПО и составляют Базу Знаний (БЗ) людей. При этом, качество и количество МПО (по- английски Models of Image Behaviors => MIBs) для разных языковых групп сильно разнятся, вследствие чего люди различных языковых культур не понимают друг друга.
Не является здесь исключением и язык жестов. Когда обычные люди смотрят на общение глухо-немых, то они их не понимают ровно по этой же самой причине – из-за отсутствия в нашей памяти тех МПО, которые есть у участников беседы на языке жестов.
А как возникают эти МПО? Да в процессе обучения. Нам в детстве, например, показывают нашу маму и произносят «мама». Мы запоминаем Образ [мама] и его языковое соответствие. Потом нам показывают на идущего дядю и говорят: «дядя идёт» и мы запоминаем в своей виртуальной памяти эту модель поведения. Так формируются МПО в нашем сознании. Поэтому, чтобы понимать сообщения на любом языке нам надо понимать ЧЕРЕЗ их соответствия – графические, звуковые, тактильные или жестовые, какие именно МПО формируются в этих сообщениях. Если нет МПО, то нет и понимания, нет извлечения Смысла. А, если нет СООТВЕТСТВИЙ, то, тем более, не может быть никакого понимания.
Здесь мы можем озадачиться вопросом: «Что же тогда нужно машине, чтобы она могла извлекать Смысл из языкового сообщения?» Ответ очень прост – да нужно ровно то же самое, что и человеку – Базу Знаний.
А что, разве у современных компьютеров нет Базы Знаний, ведь, мы постоянно читаем про различные программы, которые, якобы, используют БЗ и даже извлекают какие-то Смыслы и Знания из чего-то там? Нет, к сожалению, то, что подразумевается под «Базами Знаний», таковыми, на самом деле, не являются. Это всё те же двухмерные табличные Базы Данных. Знаниями там и не пахло.
Хорошо, тогда что нужно, чтобы создать такие БЗ или каким критериальным условиям они, эти БЗ, должны отвечать? Ответ здесь может быть таков.
Во-первых, нужна Модель Мироздания (ММ), без которой не возможно извлекать Смысл из языкового сообщения.
Во-вторых, нужно определиться с форматом МПО – он должен быть ДИНАМИЧЕСКИМ. Например, МПО может быть представлена так, как приведено здесь.
В-третьих, машина должна РАСПОЗНАВАТЬ МПО из языковых сообщений. Для этого нужна технология эвристико-смысловой обработки жестов (текста, речи...).
Из того, что перечислено, на сегодня имеется только третья позиция, да и то в состоянии разработки.
Что же касается первого и второго условия, то подходы к ним лишь только-только проявляются.
Но вот, когда эти три условия-требования будут выполнены в комплексе, вот тогда мы можем снова вернуться к замечательному украинскому изобретению.
Автор: Cybersoph