Описание предметной области (создание ее онтологии) начинается с выделения объектов и их классификации, которая традиционно заключается в составлении дерева классов-подклассов и приписывании к ним индивидов. При этом термин «класс», по сути, используется в значении «множество»: отнесение объекта к классу мыслится как включение его в качестве элемента в соответствующее множество. Цель этого текста показать, что такой унифицированный подход к описанию структуры предметной области является сильным упрощением и не позволяет зафиксировать разнообразие семантических отношений объектов.
Давайте рассмотрим три варианта классификации индивида Жучка:
- Животное – собака – лайка – Жучка.
- Служебная – ездовая – Жучка.
- Псарня – упряжка собак – Жучка.
Первую последовательность соподчиненных сущностей однозначно принято описывать через задание классов и подклассов: Жучка является индивидом класса «лайка», класс «лайка» – подклассом собак, а тот подклассом класса «животное». При этом класс «животные» трактуется как множество всех животных, а класс «лайки», как подмножество множества «собаки». Однако, такое описание, несмотря на то, что оно достаточно наглядно, содержательно является тавтологичным, самореферентным: индивида Жучку мы называем лайкой, если она входит в множество лаек, а само множество лаек определяем как совокупность всех индивидов лаек – то есть включение в множество содержательно дублирует поименование. К тому же описание класса-множества полностью исчерпывается описанием индивида, подпадающего под задающее класс понятие. Также следует отметить, что оперирование подобными классами-множествами не зависит от количества элементов в них: лайка Жучка будет лайкой даже тогда, когда она останется единственной, последней лайкой на Земле. Более того, оперировать такими классами-множествами мы можем даже при отсутствии индивидов в них: можно построить онтологию уже вымерших динозавров, помыслить класс, в который только в будущем войдет проектируемое уникальное устройство или построить модель предметной области мифических животных, героев сказок, хотя при этом мощность всех классов-множеств будет равна нулю.
Итак, если говорить о содержательной стороне анализируемой классификации (животное – собака – лайка – Жучка), то она (содержательная сторона) никак не может быть выражена через отношение множеств и подмножеств. В данном случае мы имеем дело с концептуализацией – выделением понятий и установлением родо-видовых отношений между ними. При этом фактическое число элементов концептуального класса, то есть объем понятия, не фигурирует при его определении и упоминается (да и то не содержательно) только, когда одно понятие («лайка») подпадает под другое («собака»), то есть когда выступает как вид рода. Да, мы можем констатировать, что объем понятия «собака» больше, чем объем понятия «лайка», но реальное числовое соотношение этих множеств не имеет никакого онтологического смысла. Превышение объемом класса объема подкласса при родо-видовых отношениях отражает лишь то, что по определению рода в него должно входить несколько видов – в противном случае эта классификация становится бессмысленной. То есть в родо-видовой концептуальной классификации нас интересует именно содержание понятий – чем вид «собака» отличается от вида «кот» (которое также подпадает под родовое для них понятие «животное»), а не то, как соотносятся объемы множеств рода и вида и тем более объемы видовых понятий («собака» и «кошка»). И чтобы отличать концептуальные классы от действительно счетных множеств, правильнее было бы говорить о подпадании индивида под понятие, а не о включении его в класс/множество. Ясно, что в формальной записи утверждения «подпадает под понятие Х» и «является элементом класса Х» могут выглядеть одинаково, но непонимание существенной разницы между двумя этими описаниями может привести к серьезным ошибкам в построении онтологии.
Во втором варианте (служебная – ездовая – Жучка) нас также не интересует сопоставление понятию «ездовая» какого-либо множества: смысловое содержание утверждения «Жучка – ездовая» не зависит от того, является ли она единственной ездовой или таковых много. Казалось бы, мы и здесь имеем дело с родо-видовыми отношениями: понятие «ездовая» можно рассматривать как видовое относительно родового понятия «служебная». Но связь индивида «Жучка» с понятием «ездовая» существенно отличается от связи с понятием «лайка»: второе, концептуальное, понятие имманентно и неизменно присуще индивиду, а первое отражает локальную во времени специализацию. Жучка не родилась ездовой и возможно с возрастом может перестать быть ею и перейти в разряд сторожевых, а под старость вообще потерять всякую «профессию». То есть, говоря о специализации, мы всегда можем выделить события приобретения и утраты связи с тем или иным понятием. К примеру, Жучка могла быть признана абсолютным чемпионом породы, а потом утерять это звание, что принципиально невозможно с концептуальными понятиями: Жучка от рождения и до смерти, то есть на всем временном отрезке своего существования как индивида, является собакой и лайкой. Так и человек остается концептом «человек» всю жизнь, но ситуационно (от события до события) может подпадать под специализирующие понятия «школьник», «студент», «врач», «муж» и пр. И как уже отмечалось, связь с этими понятиями ничуть не означает включение в некоторое множество (хотя это и может так выглядеть) – приписывание специализирующего понятия всегда есть результат конкретного отношения индивида с другими индивидами: поступление в школу, ВУЗ, получение диплома, регистрация брака и пр. Поэтому специализирующие понятия можно назвать еще реляционными. Из приведенных примеров следует еще одно существенное отличие концептуальной классификации от специализации: индивид может обладать несколькими специализациями (Жучка являться ездовой и чемпионом породы, человек студентом и мужем), но не может одновременно входить более чем в одну концептуальную иерархию (Жучка не может быть и собакой, и кошкой).
И только в третьем варианте описания Жучки – как принадлежащей к некоторой псарне и как члена конкретной упряжки, тянущей нарты по тундре – просто необходимо упоминание множества. Только в этом случае мы имеем право говорить, что индивид является элементом конкретного множества со счетным количеством элементов, а не подпадает под понятие, которое может быть представлено как абстрактное множество, условно фиксирующее объем этого понятия. И здесь принципиально, что индивид является частью другого индивида, исходно определяемого как множество: псарня и упряжка – это обязательно непустое множество собак, и количество элементов этого множества непременно входит в их определения как индивидов. То есть в данном случае следует говорить об отношении часть-целое: Жучка является частью псарни и частью упряжки. Более того, вхождение или невхождение Жучки в конкретную упряжку меняет ее (упряжки) содержание: если у нас была упряжка-двойка, то после изъятия Жучки, упряжка превращается в одинарную. В таких случаях мы имеем дело не просто со счетным множеством (собаки в псарне), а с индивидом, сущность которого меняется при изменении состава его элементов, определяется этим составом, то есть с системой. Если псарня – это просто индивид-группа, описываемый через множество входящих в него элементов, то упряжка – это система, сущность которой зависит от числа и специфики ее частей.
Следовательно, при построении онтологии предметной области можно выделить действительные объекты-множества, определяемые именно как совокупность некоторого числа индивидов. Таковы: класс в школе, товары в ящике на складе, детали блока электронного устройства и пр. И эти множества могут быть подмножествами других реальных счетных множеств: всех учеников школы, всех товаров на складе, всех деталей устройства. При выделении этих множеств существенно то, что они (эти множества) выступают как самостоятельные индивиды (коллектив, партия товара, комплект деталей), основным атрибутом которых является именно число входящих в них элементов. Причем изменение этого атрибута может привести к смене статуса объекта, скажем, при росте количества элементов превратить квартет в квинтет или полк в бригаду. Важно также, что описание этих объектов-множеств, сложных объектов не сводится к описанию входящих в них индивидов, хотя может включать указание на допустимый тип последних (струнный квартет, упряжка лошадей). И такие отношения – не между абстрактными множествами, а между множествами, являющимися индивидами, сложными объектами – точнее описывать как отношения часть-целое, а не класс-подкласс.
Итак, традиционная классификация индивидов через приписывание их к тем или иным классам-множествам не может считаться однородной. Следует различать (1) включение индивидов как частей в сложный объект (целое), семантическая специфичность которого не сводится к описанию его элементов. При этом (1.1.) объект-целое может рассматриваться лишь как поименованное множество индивидов (детали в упаковке, коллекция картин), для которой, по сути, важно лишь количество частей. Такие объекты возможно называть группами (или коллекциями). Также (1.2.) объект-целое может содержательно (а не только количественно) определяться своими частями и, как следствие, обладать атрибутами, которыми не обладают части. Такие целостности традиционно называют системами, а части систем – элементами. Вторым вариантом описания объектов через приписывание их к классам-подклассам является (2) подпадание индивидов под понятие, что лишь формально, тавтологично может быть описано как включение индивидов в множество мощность которого равна мощности понятия. Понятийное описание индивидов в свою очередь можно классифицировать на (2.1) концептуальное, глобально фиксирующее тип индивида, и (2.2) специализирующее (реляционное), локально во времени и пространстве (событийно) связывающее индивид с другими объектами.
Приведенные рассуждения, прежде всего, ставят вопрос о достаточности, адекватности традиционного подхода к описанию предметной области с использованием классификации, основанной на теории множеств. И предлагается вывод: для фиксации в онтологиях всего разнообразия связей объектов нужны более дифференцированные инструменты классификации (группы, системы, концептуальные и специализирующие понятия). Формализм теории множеств может использоваться только как локальное упрощение для нужд логического вывода, а не как основной метод описания.
Автор: boldachev