Институт искусственного интеллекта Пола Аллена (Allen Institute for Artificial Intelligence, AI2), созданный одним из основателей Microsoft Полом Алленом, объявил о запуске поисковой машины Semantic Scholar, которая ориентирована на «умный поиск» в научных статьях. Пока что проект имеет статус беты и база данных документов содержит тексты только из области компьютерных наук. Основным отличием от конкурента Google Scholar заявлена возможность «семантического понимания», под которой имеется ввиду, что система может извлекать из статьи характерные элементы — ссылки, цитаты, ключевые фразы — и помогать пользователю ориентироваться в них.
Поисковая машина имеет типичный интерфейс, включая умные подсказки с именами авторов, доступными пока что только на английском языке. Поисковые результаты выглядят как список заголовков статей аннотаций к ним; в левой части доступны инструменты для анализа результатов. Помимо достаточно стандартных для такого рода поиска данных, таких как даты публикации или издательство, интересным выглядит блок «Key Phrase», который группирует «ключевые фразы», встречающиеся для предмета поиска в найденных статьях. При клике на ключевую фразу система показывает документы, где она, по мнению системы, играет ключевую роль. Найденные статьи свободно доступны в формате pdf.
Если попробовать перейти по какой-либо найденной ссылке, то система показывает список источников, использованных в документе. Они по умолчанию упорядочены в соответствии со степенью их «влияния» на текст. За определение степени «влияния» отвечает специальный алгоритм, работу которого в своей статье описал CEO AI2 Орен Эциони (Oren Etzioni). Соседняя кнопка показывает краткие выдержки из текста в виде всплывающих подсказок.
Пока что базы данных документов даже по компьютерным наукам у Semantic Scholar и Google Scholar несравнимы по количеству текстов: поиск по слову «java» в системе Google даёт 2 060 000 результатов, тогда как у новой системы результаты гораздо скромнее — 89 928 документов.
Автор: jeston