Главная

Компьютерная лингвистика бессильна нам помочь в обработке текстов

2012-04-19 в 14:05, admin, рубрики: Инфосфера - мысли вслух, Исследования и прогнозы в IT, Компьютерная лингвистика, машинный перевод, обработка естественных языков, смысловой поиск, метки: Компьютерная лингвистика, машинный перевод, обработка естественных языков, смысловой поиск

Компьютерная лингвистика на сегодня практически себя уже исчерпала. На это прямо указывает безуспешный опыт исследователей и разработчиков «интеллектуальных» информационных продуктов, трудившихся вот уже более полувека над созданием таких амбициозных программ, как, например, адекватный машинный перевод или смысловой поиск информации в масивах документов на естественном языке.

Будущее машинной обработки естественно-язычных текстов, безусловно, видится в создании и развитии надлингвистических технологий, способных осуществлять анализ содержания информации на уровне смыслового понимания контекста подобно тому, как это умеет делать человек. Однако, созданию «мыслящих машин» (Thinking Machine) длительное время препятствовали два основных фактора – отсутствие необходимой методологии и должного инструментария для решения двух фундаментальных задач — это нахождение «формулы смысла» и построения «модели знаний о мироздании» в некотором формализованном доступном для компьютера виде, без чего, собственно, невозможно повторить на программном уровне естество человеческого мышления.

Лингвисты вкупе с кибернетиками эти проблемы так и не смогли преодолеть, поскольку последнее лежит уже вне границ их предметной специализации, из-за чего, собственно, существенно затормозилось развитие таких давно затребованных прикладных направлений текстовой обработки, как, например, создание «умных» диалоговых систем или «смысловых Интернет-поисковиков». Да и тот же машинный перевод по-прежнему оставляет желать много лучшего.

Опыт развития научно-технического прогресса говорит о том, что прорывной искомый результат в итоге получается, как правило, на стыке разных технологических областей и предметных дисциплин. По всей видимости, проблема «машинного мышления» будет решена ровно тогда, когда мы точно поймём, как именно в процедурном плане работает наше естественное сознание, и когда достоверно сможем узнать, поддадутся ли эти процедуры мышления, проявленные нам в необходимом и достаточном количестве, своей окончательной компьютерной алгоритмизации.

Нужно отметить, что в последние годы начинает развиваться новая («смартпбютерная») научная дисциплина, занимающаяся ровно тем, что изучает процедурность умственной деятельности человека. Можно сказать, что на данный момент мы имеем существенный прорыв в этом направлении и уже достаточно чётко представляем себе, как устроен алгоритм человеческого мышления. Если говорить об этом обобщенно, то, в первую очередь, надо отметить, что человек мыслит не образами, как это обычно принято думать, а «моделями поведения образов» (МПО). Во-вторых, мы думаем «онтологотивно», то есть, непрерывно задаём вопросы, даже сами этого не замечая, и перманентно ищем на них ответы (тоже автоматически). Наконец, осмысленное понимание всего, что происходит вокруг индивидуума или в его сознании во время каких-либо созерцаний, осуществляется именно с помощью некого «модельного представления» об окружающем мироздании. Происходит это путем сравнения тех МПО, которые он получает в оперативном порядке, с хранящимися в человеческой долговременной памяти представлениях о Мироздании. Вот, ровно, эти три основных кита и составляют всю технологию естественного мышления, которую остаётся теперь лишь просто переложить на понятный для программистов язык и получить долгожданный результат.

Когда люди осмысливают какое-либо естественно-язычное сообщение, они, практически, никогда не устанавливают моментальное соответствие высказанного суждения с понятиями и моделями поведения образов, хранящимися в их памяти. Каждый раз они придают для получаемых (воспринимаемых) МПО первое ассоциативно-эвристическое соответствие, которое возникает у них в сознании, исходя из специфики накопленного ими опыта и имеющихся знаний, и лишь потом, в ходе дальнейшего переосмысления текста, начинают уточнять и конкретизировать получаемую информацию. Компьютерная же лингвистика стремится к установлению точных соответствий значений слов, а также их взаимных отношений, пытаясь преодолеть проблему многозначности словесного инструментария, свойственной для любого языка, что, собственно, сильно отличается от того, как действует наше мышление. Ведь, человек достигает понимания речи или текста вовсе не за счет знания морфологических нагрузок слов или установления синтаксических связей между словами, и даже не потому, что он распознал конкретные значения (семантисы) слов, а ровно за счет начальных ассоциативных предположений и последующей «иттерационной прокрутки всего контекста» с целью прорисовки окончательной картины соответствия воспринимаемой информации её внутреннему содержанию.

Автор: Cybersoph