С момента создания сервиса Wolfram|Alpha, Википедия занимала особое место на пути его развития. Мы обычно используем её не как первичный источник данных, но скорее в качестве важнейшего ресурса для улучшения распознавания естественного языка. В частности, для добычи данных о том, как люди описывают те или иные вещи в разговорном/официальном стиле.
В течение многих лет мы разрабатывали различные инструменты для анализа и извлечения информации из Википедии, однако теперь мы добавляем «сервис интеграции» с Википедией, который будет доступен в новой версии языка Wolfram Language (системе Mathematica 10.1, выходящей уже совсем скоро). Теперь встраивать контент из Википедии в рабочие процессы внутри Wolfram Language стало значительно проще.
Конечно, вы можете просто взять текст из статьи в Википедии и передать его новым функциям Wolfram Language для обработки текста и визуализации:
Если Вы не можете указать точного названия статьи, Вы можете искать по названию или содержанию:
Вы даже можете использовать объекты Wolfram Language напрямую в WikipediaData чтобы, скажем, найти похожие статьи на каких-то других языках, которые есть в Википедии.
Одна из моих любимейших функций позволяет исследовать ссылки на статьи внутри какой-то конкретной статье или категории. И основная прелесть в том, что данные можно вывести как с помощью простого списка, так и воспользоваться различными функциями и правилами Wolfram Language для визуализации в виде, скажем, графа. На самом деле, с помощью всего нескольких строк кода, вы можете создать красивую и интересную визуализацию связей между любым набором статей Википедии:
Это всего это лишь верхушка айсберга, и эта функция может делать множество других полезных вещей. Получите бесплатную подписку на Wolfram Programming Cloud, чтобы увидеть, что Вы сможете реализовать вместе с WikipediaData после выхода новой версии Wolfram Language, и не пропустите релизы интеграции с другими сервисами, которые будут выходить в течение следующего года.
Автор: OsipovRoman