Новое в Wolfram Language: функция WikipediaData для интеграции с Википедией и обработки её данных

в 6:07, , рубрики: Wiki-технология, wikipedia, wolfram language, wolfram mathematica, Блог компании Wolfram Research, импорт данных, открытые данные, Программирование

С момента создания сервиса Wolfram|Alpha, Википедия занимала особое место на пути его развития. Мы обычно используем её не как первичный источник данных, но скорее в качестве важнейшего ресурса для улучшения распознавания естественного языка. В частности, для добычи данных о том, как люди описывают те или иные вещи в разговорном/официальном стиле.

В течение многих лет мы разрабатывали различные инструменты для анализа и извлечения информации из Википедии, однако теперь мы добавляем «сервис интеграции» с Википедией, который будет доступен в новой версии языка Wolfram Language (системе Mathematica 10.1, выходящей уже совсем скоро). Теперь встраивать контент из Википедии в рабочие процессы внутри Wolfram Language стало значительно проще.

Конечно, вы можете просто взять текст из статьи в Википедии и передать его новым функциям Wolfram Language для обработки текста и визуализации:

Новое в Wolfram Language: функция WikipediaData для интеграции с Википедией и обработки её данных - 1

Новое в Wolfram Language: функция WikipediaData для интеграции с Википедией и обработки её данных - 2

Если Вы не можете указать точного названия статьи, Вы можете искать по названию или содержанию:

Новое в Wolfram Language: функция WikipediaData для интеграции с Википедией и обработки её данных - 3

Вы даже можете использовать объекты Wolfram Language напрямую в WikipediaData чтобы, скажем, найти похожие статьи на каких-то других языках, которые есть в Википедии.

Новое в Wolfram Language: функция WikipediaData для интеграции с Википедией и обработки её данных - 4

Одна из моих любимейших функций позволяет исследовать ссылки на статьи внутри какой-то конкретной статье или категории. И основная прелесть в том, что данные можно вывести как с помощью простого списка, так и воспользоваться различными функциями и правилами Wolfram Language для визуализации в виде, скажем, графа. На самом деле, с помощью всего нескольких строк кода, вы можете создать красивую и интересную визуализацию связей между любым набором статей Википедии:

Новое в Wolfram Language: функция WikipediaData для интеграции с Википедией и обработки её данных - 5

Это всего это лишь верхушка айсберга, и эта функция может делать множество других полезных вещей. Получите бесплатную подписку на Wolfram Programming Cloud, чтобы увидеть, что Вы сможете реализовать вместе с WikipediaData после выхода новой версии Wolfram Language, и не пропустите релизы интеграции с другими сервисами, которые будут выходить в течение следующего года.

Автор: OsipovRoman

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js