С 30 мая по 2 июня в Российском государственном гуманитарном университете (РГГУ) пройдет 24-ая международная научная конференция по компьютерной лингвистике «Диалог». Мы уже рассказывали о том, что такое «Диалог» и почему ABBYY его основной организатор. В этом посте мы анонсируем основные темы конференции, ключевых спикеров и их доклады, публикуем информацию о соревнованиях по разрешению лексической многозначности на русском языке Dialogue Evaluation и другие подробности о конференции.
В этом году главными темами «Диалога» станут:
- Лингвистическая интерпретация результатов глубокого машинного обучения («черных ящиков»). Принципиальная особенность невероятно популярных сегодня многослойных нейронных сетей заключается в том, что мало кто понимает, какие факторы на самом деле повлияли на итог их работы. Они являются своеобразными «черными ящиками». Это, с одной стороны, порождает некоторый пессимизм среди части лингвистов относительно перспектив их науки, а с другой – заставляет задуматься о возможности использования глубокого обучения для собственно лингвистических исследований и о содержательной интерпретации его результатов. Возможно, такое понимание поможет улучшить и работу самих нейронных сетей.
- Методы применения технологий анализа больших данных к задачам, для которых таких данных не хватает. Не секрет, что для многих задач текстовой аналитики очень сложно найти адекватные обучающие датасеты. А решать их хочется. Существуют разные подходы к этой проблеме, от автоматической генерации обучающих данных до технологий переноса результатов глубокого обучения с задач, где данных много, на задачи, где их не хватает (т.н. TransferLearning).
- Мультимодальная коммуникация. Это изучение всех сфер речевого акта, языка, интонации, мимики и жестов, эмоционального и коммуникативного поведения. На конференции обсудят новые результаты и возможности их практического применения, например, для диалоговых агентов или роботов.
В «Диалоге» примут участие известные специалисты по компьютерной лингвистике:
Александр Панченко из Гамбургского университета (Германия). Этот молодой российский ученый успешно занимается проблемами в области компьютерной лексической семантики. Его приглашенный доклад посвящен лингвистической интерпретации результатов глубокого обучения, 31 мая, четверг, 15:30-16:40.
Андрей Кибрик, директор Института языкознания РАН, профессор МГУ. Он выступит с докладом (совместно со старшим научным сотрудником Лаборатории когнитивных исследований факультета психологии ИОН РАНХиГС Ольгой Федоровой), посвященным взаимодействию процессов порождения и понимания в «face-to-face» мультимодальной коммуникации, 30 мая, среда, 11:30-13:00.
Сергей Шаров, профессор кафедры переводоведения Университета Лидса (Великобритания). Один из наиболее авторитетных специалистов в мире в области анализа интернет-текстов. На конференции расскажет об экспериментах с применением машинного перевода для задач многоязычной жанровой классификации текстов, 1 июня, пятница, 10:30-13:30.
Игорь Богуславский, профессор Мадридского технологического университета и заведующий Лабораторией компьютерной лингвистики ИППИ РАН, один из крупнейших специалистов по онтологической семантике. Его доклад будет посвящен тому, как научить компьютер понимать футбольные репортажи, 30 мая, среда, 11:30-13:00.
Наталья Лукашевич из ВЦ МГУ, ведущий исследователь в области создания компьютерных тезаурусов и их применения к различным задачам NLP. Расскажет на «Диалоге» о новом направлении в области т.н. анализа сентимента: выявлении сложной картины мнений, выражаемых в текстах, 31 мая, четверг, 12:30-14:00.
• 31 мая, в 19:15, состоится круглый стол, посвященный «черным ящикам». Если вас интересует, какие возможности открывают перед лингвистикой методы глубокого обучения, рекомендуем посетить конференцию в этот день.
• 1 июня, в 17:00, приглашаем на круглый стол BigData vs. SmallData. Инженеры и лингвисты будут обсуждать, как решать проблемы нехватки обучающих данных.
Материалы конференции будут опубликованы в ежегоднике «Компьютерная лингвистика и интеллектуальные технологии», который входит в международную систему цитирования Scopus. По основным направлениям «Диалога» 2 июня c 17:00 по 19:00 также состоится студенческая сессия. Лучшие работы участников получат призы Ассоциации преподавателей фундаментальной и прикладной лингвистики (АПИФИПЛ).
Одно из ключевых событий «Диалога» – проведение технологических соревнований разработчиков систем лингвистического анализа текстов, Dialogue Evaluation. В этом году они впервые посвящены автоматическому определению значений многозначных слов в русскоязычных текстах. Это первое подобное соревнование для русского языка. Более подробно об этом состязании мы уже рассказывали на Хабре. Итоги Dialogue Evaluation будут подведены на «Диалоге» 31 мая, в четверг, в 17:00. По окончании конференции мы опубликуем их в этом блоге, следите за обновлениями.
Рабочие языки конференции – русский и английский. Подробная программа конференции выложена здесь.
Зарегистрироваться можно здесь, регистрация проходит до 29 мая. Условия участия.
Автор: Лиза Титаренко