Исследование обнаружило, что фразы из статей Википедии, касающихся активно развивающихся научных областей, попадают в научные работы
Википедия решает застольные споры и спасает тех, кто пытается схитрить на вечере эрудиции. Быстро: в какой стране берёт начало Нил? В каком году Гершвин написал "Рапсодию в стиле блюз"? В Википедии можно найти ответы на все подобные вопросы – включая и научные.
В Википедии содержатся сотни тысяч научных статей, и она предоставляет способ быстро сослаться на молекулярную формулу "Золофта", изобретателя 3D-принтера и то, что теории тектонических плит всего около 100 лет. Этот сайт – золотая жила для любителей науки, научных блогеров и самих учёных. Но хотя учёные и используют Вики, они не спешат в этом признаваться. Сайт редко попадает в список цитат, как источник, допустим, истории изучения оси мозг-кишечник или химической формулы поливинилхлорида.
Но учёные роются в Вики точно так же, как и все остальные люди. Недавний анализ обнаружил, что актуальность Вики не отстаёт от новейших исследований – и что слова из её статей попадают в научные работы. Эти результаты не только указывают на привычку использовать Вики, укоренившуюся в башне из слоновой кости. Они также говорят о том, что свободный и доступный всем источник информации играет свою роль в прогрессе исследований, особенно в более бедных странах.
Учителя в средней школе, старших классах и колледжах наставляют учеников: Вики – недостоверный источник. Её может редактировать каждый, и статьи меняются день ото дня – иногда на одну запятую, а иногда полностью переписываются за одну ночь. «У Вики репутация ненадёжного источника», — говорит Томас Шафи, биохимик из Университета Ла Троуб в Мельбурне.
Но те же самые учителя – даже преподаватели колледжа – предостерегая студентов от использования Вики, сами её используют. «Учёные постоянно используют Вики, потому что они тоже люди. Это то, что делают все», — говорит Даг Хэнли, специалист по макроэкономике из Питтсбургского университета.
И, возможно, репутация сайта как ненадёжного неоправданна. Вики не менее непротиворечива, чем Британская Энциклопедия – так показало исследование 2005 года, опубликованное в Nature (сама энциклопедия яростно возражала против такого заключения). Но цитировать её в качестве источника никто не решается. «Её не уважают так, как академические источники», — отмечает Шафи.
Академическая наука может не уважать Вики, но сама Вики однозначно любит науку. Из порядка 5,5 млн статей от полумиллиона до миллиона касается научных тем. И постоянное дополнение материала сотнями и тысячами редакторов гарантирует актуальность статей вровень с самыми последними научными работами.
Легко отследить, как новейшие публикации влияют на Вики. Их ведь упоминают в энциклопедии. Но работает ли эта связь в другую сторону? Просачиваются ли научные статьи из Вики в академическую литературу, пусть их даже и не цитируют? Хэнли с коллегой Нилом Томпсоном, изучающим в MIT инновации, решили подойти к этому вопросу с двух фронтов.
Сначала они определили 1,1 млн самых распространённых научных слов в опубликованных в научном гиганте Elsevier статьях. Затем Хэнли и Томпсон изучили, насколько часто эти слова добавляются или удаляются из Вики со временем, и цитируются в исследовательской литературе. Они сфокусировались на двух областях, химии и эконометрике – новой области, разрабатывающей статистические проверки для экономики.
Между языком научных работ и языком Вики прослеживалась чёткая связь. «Если появляется какая-то новая захватывающая тема, она приводит к созданию новой страницы в Вики», — отмечает Томпсон. Затем язык этой страницы связывается с более поздней научной работой. Хэнли и Томпсон продемонстрировали, что после появления новой статьи в Вики более поздние научные работы содержат больше языка, схожего с Вики, чем с языком научных работ в этой области, опубликованных до появления статьи в Вики. Существовала определённая связь между языком статьи в Вики и последующими научными работами.
Но была ли сама Вики источником этого языка? На этот вопрос исследование не отвечало. Оно только наблюдало, как увеличивается частота появлений слов в различных текстах. Оно не могло доказать, что учёные читали Вики и использовали прочитанное в работе.
Поэтому исследователи создали в Вики новых статей с нуля, чтобы выяснить, повлияет ли их язык на научную литературу. Хэнли и Томпсон поручили аспирантам по химии и эконометрике написать новых статей в Вики по темам, которых на сайте ещё не было. Студенты написали 43 статьи по химии и 45 статей по эконометрике. Затем по половине этих статей из каждой области опубликовали в Вики в январе 2015, а другую половину придержали как контрольную. Исследователи дали статьям три месяца на проникновение в интернет. Затем они изучили опубликованные научные статьи за последовавшие шесть месяцев в двух этих областях на предмет поиска определённых слов, использовавшихся в Вики, и сравнили их с языком статей, которые не были опубликованы.
По крайней мере, в химии новые статьи оказались популярными. Опубликованные в Вики и контрольные статьи были написаны на темы, до того не освещённые на сайте. Туда входили записи по синтезу гидрастина (прекурсору гидрастинина – препарата, останавливающего кровотечение). Люди заинтересовались статьями достаточно для того, чтобы просматривать их по 4400 раз в месяц.
Слова из статей просочились в научную литературу. За шесть месяцев после публикации статьи из Вики повлияли примерно на одно слово из 300 в новых научных работах по химии. А научные работы по темам, описанным в Вики, со временем стали больше походить на статьи в Вики. К примеру, если химики писали о синтезе гидрастина – на тему одной из новых статей в Вики – в опубликованных научных работах всё чаще встречалась фраза «реакция Пассарини», термин, использовавшийся в статье в Вики. Но если статью в Вики не публиковали, то научные работы не становились похожими на такую статью (а это могло бы произойти просто потому, что эта тема набирала популярность). Хэнли и Томпсон опубликовали препринт своей работы в журнале Social Science Research Network 26 сентября.
К сожалению, статьи по эконометрике в Вики не запустили реакцию. «Мы хотели выбрать что-то на грани науки», — говорит Томпсон. Но грань получилась слишком тонкой. Новые статьи по эконометрике в Вики просматривали в тридцать раз меньше, чем статьи по химии. Томпсон и Хэнли не смогли набрать достаточно данных из статей, чтобы сделать обоснованные выводы. Ну что ж, пожелаем эконометрике удачи в следующий раз.
Связь статей в Вики и научной литературы отличалась в разных регионах. Когда Хэнли и Томпсон отсортировали опубликованные научные статьи по ВВП стран, из которых они происходили, они обнаружили, что статьи в Вики сильнее влияли на язык научных работ учёных из стран с более слабой экономикой. «Если задуматься, то в относительно богатой стране у человека должен быть доступ к большому количеству журналов и научной литературы», — отмечает Хэнли. А организации в бедных странах не могут позволить себе дорогие подписки на научные журналы, поэтому учёным из этих стран приходится больше полагаться на публично доступные источники, такие, как Вики.
Это исследование Вики отличает «отлично разработанная схема работы и надёжный анализ», — говорит Хезер Форд, изучающая цифровые политики в Лидском университете Англии. «Насколько мне известно, это первая работа, указывающая на прочную связь статей из Вики и развития науки». Но, как она отмечает, всё это касается только химии. В разных областях и влияние может отличаться.
«Она обращается к вопросу, давно интересующему людей, который достаточно сложно доказать», — говорит Шэфи. Связь явно есть, но, по его словам, отслеживать язык – это не то же самое, что отслеживать, как новые идеи и концепции мигрируют с Вики в башню из слоновой кости. «Говорить, что по этой теме требуется больше исследований, конечно, будет клише, но на самом деле так оно и есть».
Хэнли и Томпсон согласились бы первыми. «Я считаю, что это первый шаг, — говорит Хэнли. – Показано, что Вики – не просто пассивный ресурс, она влияет на передовой край знаний».
Это отличная причина для того, чтобы учёные подключались к работе и редактировали статьи, — отмечает Томпсон. «Это крупный научный ресурс, и мне кажется, что мы должны признать это, — говорит Томпсон. – Есть польза в том, чтобы убедиться, что наука в Вики хорошо и достаточно полно описана». Хорошие научные статьи в Вики могут не только решать застольные споры. Они могут помочь продвигать науку. Ведь, в конце концов, учёные следят за ней, пусть даже и не признаваясь в этом.
Автор: Вячеслав Голованов