Как говорил великий классик Аристотель, «известное, оказывается, известно немногим».
Языковеды всего мира подвержены одной пагубной иллюзии, полагая, что если они сумеют построить «правильный синтаксический граф», (то есть, «дерево фразы»), то они в этом случае, наконец-таки, решат это треклятую проблему машинной обработки естественно-язычных текстов (еят). Вот и ищут лингвисты денно и нощно какие-то мифические связи и отношения между словами (семантическими единицами) в предложениях и абзацах текстов. Да ещё и кибернетиков подключили к этим своим безуспешным поискам. Прошло уже полвека таких изысканий, а воз, как говорится, и поныне там. Не строится никак этот граф, давая много лет устойчивые 50% ошибок. Уже и сотни миллионов долларов потрачены. Один только проект «Watson» чего стоит. А ведь, в принципе, этих «связей и отношений» и нет на самом-то деле. Всё это, если внимательно вдуматься, искусственные наукообразные выдумки, из-за которых, собственно, прогресс в деле создания технологии осмысленной обработки еят зашел в тот тупик, где сейчас и пребывает.
Лингвисты как те инопланетяне, в руки которых попало обыкновенное для землян куриное яйцо. Вот они его могут изучать и так и сяк. И обмерить вдоль и поперек, и взвесить, и рентгеном просветить, и скорлупу исследовать на состав, и её твердость по Моосу замерить, и хрупкость уточнить, и цвет откалориметрировать. В общем провести всё, что только можно измерить, а вот понять, как оно образуется, того бедняги никак не смогут, поскольку самой курицы не знают и не ведали. Точно также не могли туземцы океанических островов нашей планеты понять, каким это образом транзисторный приемник, занесенный к ним западной цивилизацией, может издавать членораздельные звуки или звуковые мелодии. И как-бы они не изучали этот приемник, не пробовали его на зуб или на вкус, того бы вовек сами не поняли, что к такому устройству еще и радиостанция нужна. Подобная картина наблюдается и с языковедами, изучающими еят, как продукт (яйцо, транзистор) человеческого мышления (курицы, радиостанции), не обращая, при этом, внимания на «генератора (производителя) яйца». Читать полностью »
Метка «Компьютерная лингвистика» - 3
Не надо вычислять смысл и знания, когда их можно доставать из машинной памяти
2012-04-24 в 13:06, admin, рубрики: искусственный интеллект, ит-инфраструктура, Компьютерная лингвистика, машинный перевод, обработка естественных языков, смысловой поиск, метки: искусственный интеллект, Компьютерная лингвистика, машинный перевод, обработка естественных языков, смысловой поискОдин день для искусственного интеллекта и естественного языка
2012-04-23 в 11:23, admin, рубрики: natural language processing, siri, watson, диалоговые системы, искусственный интеллект, Компьютерная лингвистика, конференция, обработка текстов, распознавание речи, синтез речи, метки: natural language processing, siri, watson, диалоговые системы, искусственный интеллект, Компьютерная лингвистика, конференция, обработка текстов, распознавание речи, синтез речи 26 мая 2012 в Санкт-Петербурге пройдет первая конференция AINL: Искусственный интеллект и естественный язык. Основные темы и направления: распознавание и синтез речи, искусственный интеллект и диалоговые системы, инженерия знаний и онтологии, извлечение данных и data mining.
Конференция будет длиться один день, официальный язык — русский.
Сейчас мы формируем программу и приглашаем докладчиков.
Искуственный интеллект и естественный язык за один день
2012-04-23 в 11:23, admin, рубрики: natural language processing, siri, watson, диалоговые системы, искусственный интеллект, Компьютерная лингвистика, конференция, обработка текстов, распознавание речи, синтез речи, метки: natural language processing, siri, watson, диалоговые системы, искусственный интеллект, Компьютерная лингвистика, конференция, обработка текстов, распознавание речи, синтез речи 26 мая 2012 в Санкт-Петербурге пройдет первая конференция AINL: Искусственный интеллект и естественный язык. Основные темы и направления: распознавание и синтез речи, искусственный интеллект и диалоговые системы, инженерия знаний и онтологии, извлечение данных и data mining.
Конференция будет длиться один день, официальный язык — русский.
Сейчас мы формируем программу и приглашаем докладчиков.
Компьютерная лингвистика бессильна нам помочь в обработке текстов
2012-04-19 в 14:05, admin, рубрики: Инфосфера - мысли вслух, Исследования и прогнозы в IT, Компьютерная лингвистика, машинный перевод, обработка естественных языков, смысловой поиск, метки: Компьютерная лингвистика, машинный перевод, обработка естественных языков, смысловой поискКомпьютерная лингвистика на сегодня практически себя уже исчерпала. На это прямо указывает безуспешный опыт исследователей и разработчиков «интеллектуальных» информационных продуктов, трудившихся вот уже более полувека над созданием таких амбициозных программ, как, например, адекватный машинный перевод или смысловой поиск информации в масивах документов на естественном языке.
Будущее машинной обработки естественно-язычных текстов, безусловно, видится в создании и развитии надлингвистических технологий, способных осуществлять анализ содержания информации на уровне смыслового понимания контекста подобно тому, как это умеет делать человек. Однако, созданию «мыслящих машин» (Thinking Machine) длительное время препятствовали два основных фактора – отсутствие необходимой методологии и должного инструментария для решения двух фундаментальных задач — это нахождение «формулы смысла» и построения «модели знаний о мироздании» в некотором формализованном доступном для компьютера виде, без чего, собственно, невозможно повторить на программном уровне естество человеческого мышления.
Лингвисты вкупе с кибернетиками эти проблемы так и не смогли преодолеть, поскольку последнее лежит уже вне границ их предметной специализации, из-за чего, собственно, существенно затормозилось развитие таких давно затребованных прикладных направлений текстовой обработки, как, например, создание «умных» диалоговых систем или «смысловых Интернет-поисковиков». Да и тот же машинный перевод по-прежнему оставляет желать много лучшего.
Опыт развития научно-технического прогресса говорит о том, что прорывной искомый результат в итоге получается, как правило, на стыке разных технологических областей и предметных дисциплин. По всей видимости, проблема «машинного мышления» будет решена ровно тогда, когда мы точно поймём, как именно в процедурном плане работает наше естественное сознание, и когда достоверно сможем узнать, поддадутся ли эти процедуры мышления, проявленные нам в необходимом и достаточном количестве, своей окончательной компьютерной алгоритмизации.
Читать полностью »
Где в России обучают компьютерной лингвистике?
2012-04-13 в 9:11, admin, рубрики: ABBYY, Компьютерная лингвистика, МФТИ, образование, Программирование, учебный процесс, Учебный процесс в IT, яндекс, метки: ABBYY, Компьютерная лингвистика, МФТИ, образование, Программирование, учебный процесс, яндекс Речь пойдет не об единичных курсах, посвященных этой интересной науке, а о том, как специалист, уже имеющий диплом мат-меха или другого технического факультета, может получить полноценное образование, связанное с компьютерной лингвистикой. Самый простой способ — поступить в профильную магистратуру. Но это только кажется простым, потому что такую магистратуру еще нужно найти. Потратив некоторое время на изучение проблемы, мне удалось выбрать несколько вариантов. Своими находками я хочу поделиться с уважаемымиами. Думаю, это будет интересно в особенности будущим бакалаврам и специалистам, которые размышляют над проблемой «куда пойти учиться дальше?».
Читать полностью »
Стоит ли учиться на компьютерного лингвиста? Личный опыт
1970-01-01 в 0:00, admin, рубрики: Читальный зал, метки: автоматическая обработка языка, Компьютерная лингвистика, лингвистика, личный опытВ далеком 2012 году, я, только что сдав ЕГЭ (на то время баллы были хорошими), подала документы в университет на бакалаврскую программу «Фундаментальная и прикладная лингвистика». Я не понимала, что это такое, чему нас будут учить, кем я потом буду. Меня привлекло сложное название программы и описание в буклете абитуриентов. Да, в общем, я отучилась 4 года и до сих пор не поняла, правильный ли выбор я сделала.
Чтобы разобраться в этом, необходимо понять, что такое компьютерный лингвист. По современным определениям, компьютерная лингвистика – это
научное направление в области математического и компьютерного моделирования интеллектуальных процессов у человека и животных при создании систем искусственного интеллекта, которое ставит своей целью использование математических моделей для описания естественных языков.
Возьмем обычного выпускника, который сдавал ЕГЭ по математике, русскому и английскому. Вот он поступает на компьютерную лингвистику, не зная, кем он будет на выходе.
В процессе обучения он успевает побыть в трех амплуа: человек, который отлично знает
современный русский язык, тенденции его изменения, как развивался русский язык (от древнерусского до наших дней), его морфологический строй, диалекты и немного литературу. Человек, который каким-либо образом не забыл это все после сдачи зимней сессии – филолог.
Добавим немного еще компетенций:
Человек, допустим, шарит в морфологии, синтаксисе, семантике, социолингвистике и других аспектах языка. Его не пугают такие понятия, как синтагматика и парадигматика, онтологии и тезаурусы, пропозиция, когнитивизм, прагматика и так далее. Знает английский язык и в идеале еще плюсом 1-2 других иностранных языка (в моем случае это заброшенные напрочь немецкий и испанский). И вот мы получаем лингвиста. Прикладного. Который знает, как теорию можно применить на практике.
Читать полностью »