У человечества ограничен доступ к наиболее полным источникам научного знания — научным журналам. Во многом такая печальная картина сложилась из-за коммерческой политики издательств и платных подписок, а также предположения, что факт публикации в «платном» журнале является доказательством научной значимости открытия.
В отличие от издательств, большинству людей понятно, что свободные научные знания — это благо для всех (и это благо больше, чем «фильтрация» качественных статей в авторитетных изданиях, см. информационный парадокс Эрроу). Существует ряд научных проектов, которые финансируются в основном из государственных субсидий, при этом открыты бесплатно. Это, например, банки физических объектов, такие как банки семян и репозитории модельных организмов — ряд исследований показывает, что создание таких открытых банков способствовало научной активности в данном направлении. Есть и бесплатные открытые для всех информационные репозитории, как проект «Геном Человека» или StackOverflow.com (источник знаний в области компьютерного программирования).
Википедия — крупнейший в мире источник научной информации для широкой публики. Это вообще 5-й по популярности сайт в интернете. Сейчас пара учёных из Массачусетского технологического института и Питтсбургского университета опубликовали научную статью в пользу того, что Википедия способствует распространению научных знаний, её читают и используют учёные, ставят на неё ссылки в своих научных работах, и Википедия во многом формирует направление научных исследований в принципе.
В своей статье авторы цитируют Чарльза Дарвина из его письма к коллеге-биологу Томасу Генри Хаксли в 1865 году: «Я иногда думаю, что общие и популярные трактаты почти так же важны для прогресса науки, как оригинальное произведение». В конце концов, его «Происхождение видов» было одновременно и выдающейся научной работой, и бестселлером.
Количество научных статей в англоязычной Википедии, в зависимости от определения и методов подсчёта, от 500 тыс. до 1 млн. Авторы говорят, что в области химии, которую проверили для эксперимента, 93% научных статей объясняют тему на уровне начальных курсов специализированных вузов, а 47% статей объясняют тему на уровне старших курсов.
На таком уровне совершенно очевидно, что Википедия объективно отражает науку. Но вопрос в том, как она влияет на науку, насколько учёные читают Википедию, и может ли Википедия повлиять на активность научных исследований?
В данном случае тема изучалась с помощью двух подходов. Во-первых, вычисление встречаемости научных терминов на страницах Википедии и на страницах научных журналов. Авторы обработали полную историю правок всех статей (20 терабайт данных) и все полные версии статей двух тысяч научных журналов Elsevier с 1995 года (0,6 терабайт).
Разумеется, эти словарные базы во многом пересекаются. Так, 61% слов из научной литературы встречается в Википедии, а 63% слов из последней встречается в научной литературе. Однако относительная частотность слов в некоторых случаях заметно отличается.
Слово | Место в научной литературе | Место в Википедии |
---|---|---|
Acid | 59 | 65 |
Reaction | 32 | 132 |
Graphene | 2143 | 3099 |
Photovoltaic | 5764 | 7651 |
Gravity | 6139 | 2375 |
Pokemon | 745 676 | 14 485 |
В своих измерениях учёные, естественно, сделали поправку на языковой дрифт, то есть изменение частотности терминов со временем.
Изменение частотности во времени некоторых терминов по химии
Второй подход — экспериментальный. Экспертам по определённым темам предложили написать ряд статей для Википедии. Затем случайная половина этих статей реально публиковалась на сайте, а вторая половина сохранялась в качестве контрольной выборки. Впоследствии учёные изучали, насколько в научной литературе повысилась частотность слов из опубликованных статей и из статей контрольной группы. Результаты эксперимента подтвердили догадку: слов из статей Википедии в литературе оказалось больше. Это доказывает, что Википедия действительно оказывает влияние на текущие научные исследования.
Внедрение определённой информации в Википедию влияет на будущие научные исследования. Это означает не только большую значимость самой Википедии, но и большое значение открытых научных знаний в принципе. У статьи за платным файрволом гораздо меньше шансов оказать значение на научное сообщество и на всё общество в целом, чем у статьи в открытом доступе. Получается, что открытая публикация статей — это очень экономически выгодный способ развивать науку. Эта выгода гораздо больше, чем выгода от «фильтрации» статей в платных журналах.
Авторы научной работы уверены, что теперь никак неуместно говорить, что Википедия — это просто источник общеизвестных знаний.
Автор: Анатолий Ализар