Онтология – это формальное описание результатов концептуального моделирования предметной области, представленная в форме, воспринимаемой человеком и компьютерной системой.
Онтология состоит из примитивов представления знаний предметной области (определений основных понятий, таких как имена индивидуумов, классы, функции и другие сущности), а также различного рода семантических связей, поддерживаемых между ними.
Онтологию предметной области можно рассматривать как словарь терминов, специфических для данной предметной области, вместе с совокупностью аксиом, которые обеспечивают интерпретацию и правильное использование этих терминов. Онтологическое представление знаний используется для семантической интеграции информационных ресурсов, адекватной интерпретации содержания текстовых документов и поисковых запросов, представленных на естественном языке.
Такие описания на каждом иерархическом уровне поддерживают отношение эквивалентности на множестве классифицируемых сущностей, обеспечивающее его разбиение на попарно непересекающиеся классы. При этом сущности соседних уровней иерархии обычно находятся в отношении «целое-часть» или «род-вид». В более сложном случае онтология задается в виде формального определения на языках представления знаний, допускающих логический вывод.
В настоящее время средства формального описания онтологии включают несколько альтернатив:
- представление онтологии предметной области в виде набора элементов метаданных «Дублинского ядра» (Dublin Core, DC);
- представление онтологии предметной области на языках логики первого порядка;
- представление онтологии предметной области с использованием стандарта языка описания онтологии – OWL (Ontology Web Language) для информационных ресурсов Web второго поколения на платформе XML.
Дублинское ядро (Dublin Core, DC) – это набор элементов метаданных для представления онтологии предметной области. В терминах значений этих элементов можно описывать содержание различного рода текстовых документов и документов, представленных в иных средах. Привлекательность такого подхода связана с его простотой, что, конечно же, оборачивается ограниченностью его возможностей.
Первоначальная версия Дублинского ядра, которая включала 13 элементов, была предложена на состоявшемся в 1995г. в Дублине (США) симпозиуме, организованном Online Computer Library Center (OCLC) и National Center for Supercomputing Applications (NCSA) для описания информационных ресурсов библиотечных систем, в частности, информационных ресурсов Web.
Развитие Дублинского ядра поддерживается специально учрежденной для этой цели организацией – Инициативой по метаданным Дублинского ядра (Dublin Core Metadata Initiative, DCMI).
В настоящее время ведется работа как по уточнению состава набора элементов метаданных, так и по введению факультативных атрибутов (квалификаторов) для этих элементов метаданных, которые в конкретных областях применения уточняли бы их содержание и игнорировались в случаях, когда приложение с ними «незнакомо». Некоторый предварительный список квалификаторов был принят в качестве рекомендации DCMI в июле 2000г. Он содержит квалификаторы двух категорий: квалификаторы, уточняющие семантику элементов метаданных ядра, и квалификаторы, определяющие способ кодирования значений его элементов, что позволяет адекватным образом их интерпретировать.
Формальное описание онтологии предметной области на языках логики первого порядка допускает возможности логического вывода. Довольно широкое распространение для представления онтологии получил язык указанной категории KIF (Knowledge Interchange Format), разработанный в начале 90-х гг. в Лаборатории систем знаний (KSL) Стэнфордского университета. Первоначально он разрабатывался как формальный язык для обеспечения обмена знаниями между различными системами, основанными на знаниях.
На основе расширения языка KJF в той же лаборатории была создана исследовательская система Ontolingua, поддерживающая формирование и представление онтологии в некотором каноническом формате, благодаря чему обеспечивается их совместное использование и/или переносимость в среды различных оперирующих с ними систем. Онтологию, заданную в каноническом формате, можно легко транслировать в разнообразные системы, использующие различный синтаксис для представления знаний и обладающие различными возможностями рассуждений.
Стандарт языка описания онтологии для информационных ресурсов Web – OWL (Ontology Web Language) разрабатывается рабочей группой по онтологиям для Web консорциума W3C с 2001г. Язык OWL основан на логиках описаний и предназначен для интеллектуальных систем поиска информационных ресурсов в среде Web второго поколения.
Замысел создания Web второго поколения направлен на превращение Web в систему семантического уровня. Поскольку Web первого поколения строился с ориентацией на обработку содержащейся в нем информации человеком, технологии Web нового поколения должны обеспечивать возможности автоматизированной семантической интерпретации и обработки информационных ресурсов.
Еще одним способом описания онтологии предметной области, широко используемым в исследовательских и коммерческих системах текстового поиска, является это представление ее в форме тезауруса предметной области.