190 likes | 380 Views
Применение онтологии для ведения и доступа к данным коллекции «Природные ресурсы региона». В.А.Лебедев, С.В.Брагин, В.Г.Старкова Институт прикладных математических исследований Карельского научного центра РАН math@krc.karelia.ru.
E N D
Применение онтологии для ведения и доступа к данным коллекции «Природные ресурсы региона» В.А.Лебедев, С.В.Брагин, В.Г.Старкова Институт прикладных математических исследований Карельского научного центра РАН math@krc.karelia.ru
В институте прикладных математических исследований разрабатывается интернет-технология контроля за природными ресурсами региона. В настоящее время разработана исследовательская версия. Поскольку природные ресурсы рассредоточены в пространстве региона, в основу разрабатываемой технологии положена геоинформационная (ГИС) технология. Описание природных ресурсов будет отображаться в некотором наборе тематических баз данных, связанных процедурой геокодирования с цифровой векторной картой. На каждый вид ресурса создается отдельная база данных, в которой характеристики ресурса представляет отдельная запись, содержащая различные виды характеристик ресурса: числовые, текстовые и, возможно, графические.
К природным ресурсам относятся • земельные, • месторождения полезных ископаемых, • лесные, болотные и водные системы, • животное и растительное многообразие, • рекреационно-туристические объекты, • климатические условия. Контроль за использованием ресурсов осуществляется региональным статуправлением через мониторинг предприятий и организаций, осуществляющих охрану, использование, добычу, заготовку или восстановление соответствующих ресурсов. Помимо этого для обеспечения инвестиционных интересов должны быть отражены характеристики объектов инфраструктуры • населенные пункты • дороги, водные пути, • объекты энергообеспечения, •перевалочные пункты и др.
Указанная технология полностью русифицирована и при загрузке или поиске данных требуется вводить с клавиатуры значительное количество русских названий. Применение онтологии предметной области упростит и ускорит эти операции.
Онтология в информатике, согласно современным толкованиям, является «точной спецификацией концептуализации предметной области» ( T.Gruber), но с определенными ограничениями в зависимости от назначения коллекции (M.Ushold)и должна включать словарь терминов и некоторые спецификации их значений. Обычно при выполнении концептуализации используют типы отношений классификации, агрегации и ассоциации. Классификации и агрегации выражают иерархические (вертикальные) связи, а ассоциации – горизонтальные. В данной онтологии классификации, агрегации и синонимии выражены явно. Другие ассоциации пользователь может задавать в процессе построения запроса. Структура онтологии может быть представлена в виде связного ациклического графа, в котором вершинами являются термины, а дугами - отношения между ними указанных типов.
Связный ациклический граф может быть представлен множеством дуг, представленных парами смежных вершин, и, следовательно, может быть интерпретирован как реляционная база данных, в которой ключевыми колонками являются пары вершин, дополнительно могут быть указаны пометы вершин и дуг (например, названия уровней иерархии и видов отношений). Это и является отличительной особенностью реализации. Построенная часть онтологии включает: • 120 тем • более 600 характеристик • более 450 значений 47 характеристик • около 150 синонимических гнезд Всего онтология содержит около 1800 терминов и синонимов.
Технология применения онтологии в геоинформационных коллекциях о природных ресурсах региона содержит три интернет-сервиса: • регистрации загружаемых данных; • построения запроса на поиск релевантных данных и выполнения поиска; • построения и редактирования онтологии; Эти сервисы базируются на алгоритме поиска в глубину, реализованы в виде последовательности выборок (формируемых операторов select) из реляционной базы данных и оформлены в виде набора скриптов.
Блок-схема технологии применения онтологии
Использование онтологии для регистрации загружаемых данных
Использование онтологии для поиска данных
Браузер с картой и таблицей характеристик озера
Создание и редактирование онтологии: добавление терминов в онтологию
Создание и редактирование онтологии: анализ опасности удаления термина
Литература • Лебедев В.А., Брагин С.В., Старкова В.Г. Геоинформационные коллекции о природных ресурсах региона в Интернет. // Материалы международной научно-практической конференции «Рациональное природопользование: ресурсо- и энергосберегающие технологии и их метрологическое обеспечение». Москва, 2004. • Цветков В.Я. Геоинформационные системы и технологии. М., 1998. • Когаловский М.Р. Энциклопедия технологий баз данных. М., 2002. • Россеева О.И., Загорулько Ю.А. Организация эффективного поиска на основе онтологий. www.dialog-21.ru/Archive/2001/Volume2/2_49.htm • Бездушный А.Н., Гаврилова Э.А., Серебряков В.А., Шкотин А.В. Место онтологий в единой интегрированной системе РАН. www.benran.ru • Лебедев В.А., Старкова В.Г., Брагин С.В. Представление онтологии научной коллекции «Водные ресурсы региона». // Труды Шестой Всероссийской конференции по электронным библиотекам. Пущино, 2004. • Лебедев В.А., Старкова В.Г., Брагин С.В. Технология администрирования геоинформационными коллекциями. // Труды Института прикладных математических исследований Карельского научного центра РАН, вып. 5. Петрозаводск, 2004