280 likes | 453 Views
Разработка системы информационного поиска в базе знаний. Белякова Д.Ю. Группа С- 10 5 МИЭМ 07 . 0 6. 201 2. Актуальность. Увеличение неструктурированной информации Структурирование информации является не всегда полезным Необходимость поиска среди неструктурированных документов.
E N D
Разработка системы информационного поиска в базе знаний Белякова Д.Ю. Группа С-105 МИЭМ 07.06.2012
Актуальность • Увеличение неструктурированной информации • Структурирование информации является не всегда полезным • Необходимость поиска среди неструктурированных документов
Постановка задачи • Анализ методов и подходов по реализации информационного поиска • Анализ поисковых движков • Выявление ошибок в существующей базе знаний • Внедрение данной системы в базу знаний • Тестирование поисковой системы
Информационный поиск – это процесс поиска в большой коллекции некоего неструктурированного материала, удовлетворяющего информационной потребности. Критерии поиска:
Понятие веса • F – функция, показывающая отвечает ли документ поисковому запросу. • si– величина, показывающая встречает ли данный термин в документе. • gi – вес документа.
Понятие веса F=0.2*0 + 0.3*1 + 0.5*1 = 0.8
Основные методы • Последовательный метод • Булев поиск • Сжатие индекса • Метод ранжирования
Булев поиск Матрица «термин-документ»
Сжатие индекса Матрица «термин-документ»
Сжатие индекса Словопозиция имеет вид [2.20.1.1.4]:
Скачивание базы данных • Скачать файл с настройками LocalSettings.php • Скачать саму базы данных в домашнюю папку • Переместить на домашний компьютер
Конфигурационный файл • Indexer – генератор индекса • Searchd – поисковый демон • Search – тестовая утилита
Индексация запросов Indexer
Блок-схема работы демона Searchd
Модификация системы • Закачать исправленный файл • Остановить работу демона • Удалить предыдущий файл • Запустить индексатор • Запустить демона
Тестирование системы • Запуск утилиты search
Тестирование системы • Запуск из браузера
Выводы В результате выполнения работы были: • Проведен анализ существующих решений • Исправлены ошибки в поиске • Данная система была модифицирована и внедрена в кафедральную базу знаний
Спасибо за внимание Разработка системы информационного поиска в базе знаний Белякова Д.Ю. darya.belyakova@2012.auditory.ru