Рубрика «искусственный интеллект» - 235

Тестирование лингвистических технологий: соревнования по автоматическому разрешению кореферентности и анафорыИтак, как и обещали, рассказываем: недавно были подведены итоги соревнований по автоматическому разрешению анафоры и кореферентности. Такие соревнования для русского языка проводились впервые а организовала их команда из ВШЭ-МГУ.

Мы уверены, что среди наших читателей много лингвистов, которые и без нас отлично знают, что такое анафора и кореференция, остальным рассказываем. Один и тот же объект реального мира может упоминаться в тексте несколько раз разными способами. «Вася – миллионер, он хочет купить остров». В этой фразе местоимение «он» и существительное «Вася» относятся к одному человеку (т.е. имеют одного и того же референта). Если система анализа текста понимает, что «он» – это и есть «Вася», значит, она умеет разрешать анафору.

Сложнее, когда Вася появляется в тексте еще несколько раз – например, как «Иванов», «клиент», «глава компании» или «футболист». Тогда речь идет уже не о местоименной анафоре, а о кореферентности именных групп. Задача системы в этом случае – объединить все слова, за которыми скрывается этот человек, в одну кореферентную цепочку. Приведем несколько примеров, а заодно покажем, как это делает наша технология Compreno.Читать полностью »

Продолжаем тему процесса создания игры Insomnia, начатую со статьи Как мы перестали бояться Огра и начали делать на нем игру

Об истуканах

Начну с того, что на момент старта проекта мы не планировали вводить ИИ как таковой. Несколько скриптовых сцен казались нам вполне достаточным дополнением игры.
Все НПС планировалось сделать абсолютно бызмозглыми, выполняющими строго определенную, закольцованную последовательность действий.
Было забавно наблюдать, как НПС продолжал приветливо махать тебе рукой, пока ты всаживал в него вторую обойму.
Прогулка по густонаселенной локации напоминала путешествие в саду каменных фигур.

Insomnia: игровой искусственный интеллект такой искусственный (видео)
Читать полностью »

Этим постом я хочу привлечь внимание к интересной области прикладного программирования, бурно развивающейся в последние годы — компьютерной лингвистике. А именно — системам, способным к разбору и пониманию текста на русском языке. Но основной фокус внимания я хочу сместить с академических и промышленных систем, в которые вложены десятки и тысячи человеко-часов, к описанию тех способов, какими успехов на этом поприще могут добиться любители.
Читать полностью »

Инженеры и лингвисты снова вступили в ДиалогВ начале июня в подмосковном «Бекасово» состоялась международная конференция по компьютерной лингвистике «Диалог», которую уже много лет делает наша компания. О том, что представляет собой «Диалог», мы писали здесь, поэтому не будем повторяться, а расскажем, что было нового.

Пожалуй, одно из самых важных для нас событий – сборник научных трудов «Диалога» наконец-то будет индексироваться международной системой SCOPUS. Почему это важно? Для подтверждения своего научного статуса все отечественные ученые должны иметь публикации в наиболее авторитетных изданиях, входящих в т.н. список ВАК (Высшей аттестационной комиссии). К таковым относятся, в частности, журналы, входящие в базу SCOPUS. Скопусовский статус сборника Диалога, придает конференции более высокий статус и мы рады, что теперь участие в «Диалоге» будет придавать больше «веса» научным трудам наших докладчиков.

В этом году одной из доминант «Диалога» была вычислительная семантика, ей был посвящен первый день конференции. Эта область компьютерной лингвистики изучает различные способы компьютерного моделирования значений слов, фраз, предложений, целых текстов. Читать полностью »

Елена, «электронная девушка» из службы поддержки

Привет. Сегодня мы хотели бы рассказать об одной замечательной девушке. Точнее, о «девушке». Это виртуальный оператор в колл-центре службы поддержки, и зовут её Елена. Она способна распознавать речевые запросы и отвечать на них.

Для чего это нужно?

Обычно абоненты звонят в службу поддержки, чтобы задать различные вопросы. Во многих случаях эти вопросы однотипны. Когда-то, чтобы не заставлять абонентов ждать ответа оператора, было придумано голосовое меню (IVR). Вы все с ними сталкивались: «… для связи с оператором — нажмите ”ноль“». Однако прогресс не стоит на месте, и теперь появились новые, более удобные технологии. Одной из них является система распознавания речевых запросов, позволяющая сохранить степень автоматизации службы поддержки.

Так мы внедрили виртуального оператора Елену. Или помощника, как вам больше нравится. Пока что Елену нельзя отнести к полноценным системам искусственного интеллекта. На текущий момент она является своеобразной надстройкой над IVR, перенаправляя человека в конкретные разделы меню. Но, в целом, Елена ближе к таким системам, как Siri на iPhone, или к мобильным консультантам на Android. Пока что её возможности куда скромнее, и она не сможет подсказать вам, где находится ближайшая станция метро или как ловить на мотыля. Но Елена уже может распознавать наиболее популярные вопросы и давать на них ответ. И в будущем вообще превратится в замечательного собеседника. Но об этом ниже.
Читать полностью »

Проект 2045 был основан российским предпринимателем Дмитрием Ицковым в 2011 году и задействует ведущих специалистов в области нейронных интерфейсов, робототехники и искусственных органов. Главной задачей 2045 является создание технологии, позволяющей передачу личности индивида к более продвинутому небиологическому носителю. Команда 2045 занимается исследованиями и разработками в области человекоподобных роботов с целью передачи человеческого индивидуального сознания искусственному переносчику и достижения, как говорят в компании, «кибернетического бессмертия».

Проект 2045 — аватары
Читать полностью »

Она сможет напомнить вам купить молоко, когда в следующий раз вы будете в магазине. Она предложит вам взять с собой зонтик, если на улице собирается дождь. Она при необходимости самостоятельно отклонит звонок и отправит в ответ СМС о временной недоступности абонента, если вы сидите на важном совещании.

Она

Она поможет спланировать ваш день с учетом ваших запросов и многих других факторов (пробки, погода и т.д.). Она пока не доступна для России, но уже сейчас вы можете познакомиться с ее возможностями (в посте мы расскажем вам как). Она — Cortana. И этот пост мы хотим посвятить ей.
Читать полностью »

image
Пару дней назад по многим новостным сайтам прошла информация о применении агентством Associated Press робота для публикации новостей. Подробностей нашлось не много, но тема достаточно любопытная. Читать полностью »

Продолжаем разговор. Прошлая статья была переходной от предыдущего цикла о графических моделях вообще (часть 1, часть 2, часть 3, часть 4) к новому мини-циклу о тематическом моделировании: мы поговорили о сэмплировании как методе вывода в графических моделях. А теперь мы начинаем путь к модели латентного размещения Дирихле (latent Dirichlet allocation) и к тому, как все эти чудесные алгоритмы сэмплирования применяются на практике. Сегодня – часть первая, в которой мы поймём, куда есть смысл обобщать наивный байесовский классификатор, и заодно немного поговорим о кластеризации.

Вероятностные модели: от наивного Байеса к LDA, часть 1
Читать полностью »

Приходилось ли вам, перейдя по ссылке на интересный видеоролик на Youtube, обнаруживать, что ради нескольких секунд, где действительно происходит что-то интересное, вы только что потратили нескольк минут на созерцание совершенно бесполезного «мусора» только потому, что автор видео выложил целиком файл с видеорегистратора или смартфона? Количество видеокамер стремительно растёт, а количество людей, способных хотя бы обрезать пару лишних фрагментов, похоже, остаётся постоянным. И проблема не только в нескольких минутах убитого в интернете времени — ведь есть и более серьёзные случаи, например, десятки и сотни часов видео с камер наблюдения, которые иногда приходится просматривать, чтобы раскрыть преступление.

Учёные из университета Карнеги-Меллон разработали эффективный алгоритм выделения наиболее интересных фрагментов видео на основе машинного обучения. Новый алгоритм, названный ими «LiveLight» значительно превосходит аналоги по скорости и качеству работы. LiveLight выделяет характерные фрагменты видео и сотавляет их «словарь», а затем пытается предсказать на их основе следующий кадр. Если это удаётся с достаточной степенью точности, то это значит, что кадр не добавляет практически никакой новой информации и его можно исключить. В отличие от «механических» подходов, реагирующих на любое движение в кадре либо резкое изменение яркости, цвета или контраста, LiveLight достаточно универсален — он хорошо работает и на видео, снятым неподвижной камерой, и на любительской съемке трясущимся смартфоном.


Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js