В тексте в конспективном виде изложены идеи, высказанные автором в докладе «Философия эволюции и эволюция интернета».
Основные недостатки и проблемы современного веба:
- Катастрофическая перегруженность сети многократно дублированным контентом, при отсутствии надежного механизма поиска оригинального источника.
- Рассредоточенность и несвязанность контента – невозможность сделать исчерпывающую выборку по тематике и, тем более, по уровням анализа.
- Зависимость формы представления контента от издателей (зачастую случайных, преследующих собственные, обычно коммерческие, цели).
- Слабая связанность результатов поиска с онтологией (структурой интересов) пользователя.
- Малая доступность и слабая классифицированность архивного контента сети (в частности, социальных сетей).
- Малое участие профессионалов в организации (систематизации) контента, хотя именно они по роду своей деятельности повседневно занимаются как раз систематизацией знаний, но результат их работы фиксируется лишь на локальных компьютерах.
Основная причина замусоренности и нерелевантности сети – это доставшееся нам в наследство от Web 1.0 сайтовое устройство, при котором главным лицом в сети является не владелец информации, а владелец места ее размещения. То есть в сеть была перенесена идеология материальных носителей контента, где главным было место (библиотека, киоск, забор) и предмет (книга, газета, бумажка), а уже потом их содержание. Но поскольку в отличие от реального мира, пространство в виртуальном мире не ограничено и стоит копейки, то количество мест, предлагающих информацию, на порядки превысило количество единиц уникального контента. Web 2.0 частично исправил ситуацию: каждый пользователь получил свое личное пространство – аккаунт в социальной сети и свободу в известной мере его конфигурировать. Но проблема с уникальностью контента лишь усугубилась: технология копипаста еще на порядки увеличила степень дублирования информации.
Усилия по преодолению указанных проблем современного интернета концентрируются в двух, в некоторой степени взаимосвязанных, направлениях.
- Повышение точности поиска путем микроформатирования распределенного по сайтам контента.
- Создание «хранилищ» достоверного контента.
Первое направление, безусловно, позволяет получить более релевантный поиск, по сравнению с вариантом указания ключевых слов, но не снимает проблемы дублирования контента, а самое главное, не устраняет возможности подлога – систематизацию информации чаще всего делает ее владелец, а не автор и уж подавно не потребитель, который больше всех заинтересован в релевантности поиска.
Разработки во втором направлении (Google, Freebase.Com, CYC и др.) позволяют получить однозначно достоверную информацию, но только в областях, где это возможно – остается открытой проблема плюрализма знаний в сферах, где нет единых стандартов и общей логики систематизации данных. Сложно решается проблема получения, систематизации и включения в базу нового (текущего) контента, что является главной проблемой в современной социально ориентированной сети.
Какие же решения предлагает юзероцентристский деятельный подход, изложенный в докладе «Философия эволюции и эволюция интернета»
- Отказ от сайтовой структуры – главным элементом сети должна стать единица контента, а не место его размещения; узлом сети должен быть пользователь, с конфигурированным относительно него множеством единиц контента, которое можно назвать онтологией пользователя.
- Логический релятивизм (плюрализм), констатирующий невозможность существования единой логики организации информации, признающий необходимость неконечного числа практически независимых онтологических кластеров даже в пределах одной тематики. Каждый кластер представляет собой онтологию некоторого пользователя (индивидуального или обобщенного).
- Деятельный подход к построению онтологий, подразумевающий, что онтология (структура кластера) формируется и проявляется в деятельности генератора контента. Такой подход необходимо требует переориентации сервисов сети с генерации контента, на генерацию онтологий, что по сути, означает создание инструментов для реализации в сети любой деятельности. Последнее позволит привлечь в сеть множество профессионалов, которые обеспечат ее функционирование.
Последний пункт можно расписать подробнее:
- Онтология создается профессионалом в ходе его профессиональной деятельности. Система предоставляет профессионалу все инструменты для введения, систематизации и обработки любых типов данных.
- Онтология выявляется в деятельности профессионала. Сейчас это стало возможно, поскольку большой процент операций любой деятельности выполняется или фиксируется на компьютере. Профессионал не должен строить онтологии, он должен действовать в программной среде, которая одновременно является основным инструментом его деятельности и генератором онтологий.
- Онтология становится основным результатом деятельности (и для системы, и для профессионала) – продукт профессиональной работы (текст, презентация, таблица) является лишь поводом для построения онтологии этой деятельности. Не онтология привязывается к продукту (тексту), а текст, понимается как объект, сгенерированный в конкретной онтологии.
- Онтология должна пониматься как онтология конкретной деятельности; сколько деятельностей – столько и онтологий.
Итак, основной вывод: Web 3.0 это переход от сайтоцентристского веба к семантической юзероцентристской сети – от сети вебстраниц с произвольно конфигурированным контентом к сети уникальных объектов, объединенных в неконечное число кластерных онтологий. С технической стороны Web 3.0 это множество онлайн-сервисов, предоставляющих полный спектр средств внесения, редактирования, поиска и отображения любого типа контента, которые одновременно обеспечивают онтологизацию деятельности пользователей, а через нее и онтологизацию контента.
Александр Болдачев, 2012-2015
Автор: boldachev