280 likes | 507 Views
ТЕМА 2. С истемы электронного документооборота. Лекция 6 . Концепция ЕСМ. Функциональные подсистемы СЭД. Расширение понятия СЭД.
E N D
ТЕМА 2. Системы электронного документооборота. Лекция 6. Концепция ЕСМ. Функциональные подсистемы СЭД.
Расширение понятия СЭД • Перед современными системами управления документами ставится более широкий круг задач – автоматизация всех аспектов деятельности организации, связанных с обработкой документов. • Понимание значимости массива накопленной информации как ценнейшего интеллектуального актива организации. • Переход от традиционной функционально-дивизионной модели управления предприятием к процессно-ориентированной. • Динамичность внешней среды.
ECM = BPM + IDM ECM (Enterprise Content Management) – управление корпоративными информационными ресурсами BPM (Business Process Management) – управление бизнес-процессами IDM (Integrated DocumentManagement) — интегрированное управление документами
Концепция ЕСМ • ECM – это набор технологий, инструментов и методов, используемых для сбора, управления, накопления, хранения и доставки информации всем потребителям внутри организации. Association for Information and Image Management • ECM– это стратегическая инфраструктура и техническая архитектура для поддержки единого жизненного цикла неструктурированной информации (контента) различных типов и форматов. Gartner Group
Задачи ЕСМ • Поддержка полного жизненного цикла информации. • Интеграция различных информационных систем на уровне информационных потоков. • Управление неструктурированной информацией в бизнес-процессах.
Компоненты ECM • Управление документами(Integrated Document Management (IDM), Document Management System (DMS) • экспорт/импорт документов, • контроль версий, • хранение документов и их метаданных • разграничение доступа • ведение истории работы с документом. • Управление образами документов(Document Imaging) • технология сканирования бумажных документов; • атрибутирование и индексирование документов; • загрузка в репозитории документов.
Компоненты ECM • Управление записями (Records Management(RM) • поддержка полного жизненного цикла документа; • долгосрочное архивирование; • автоматизация политик хранения; • обеспечение соответствия законодательным и отраслевым нормам. • Управление потоками работ (Business Process Management (BPM), Workflow) • поддержка бизнес-процессов; • передача контента по маршрутам; • назначение рабочих задач и состояний; • создание журналов аудита.
Компоненты ECM • Управление веб-контентом (Web Content Management (WCM) • автоматизация роли веб-мастера (процессы создания, согласования, публикации и постоянного обновления информации на сайтах); • управление динамическим контентом и взаимодействием пользователей. • Управление мультимедиаконтентом (Digital Asset Management(DAM) • управление графическими, видео- и аудиофайлами, различными маркетинговыми материалами, рекламными роликами. • цель применения DAM – извлечение организацией максимальной выгоды из использования цифровых активов.
Компоненты ECM • Документо-ориентированное взаимодействие (Collaborate) • организация коллективного использования контента в трудно формализуемых, творческих процессах. • Управление знаниями (Knowledge Management (КМ) • поддержка систем для накопления и доставки релевантной для бизнеса информации • полнотекстовый поиск. • сквозной поиск по разнородным источникам информации. • автоматическая категоризация. • визуализация информации.
Основные функциональные подсистемы СЭД • подсистема формирования электронных документов • подсистема организации массового ввода документов • подсистема хранения и поиска документов • подсистема маршрутизации и контроля исполнения документов
Подсистема формирования электронных документов • Электронная форма документа – это страница с пустыми полями, оставленными для заполнения пользователем. • Под электронной формой документа понимается не изображение бумажного документа, а технология работы с формами, где бумажная форма появляется только по требованию в качестве копии электронной.
Типы форм, используемых в СЭД • Формы, предназначенные для сбора информации и ее последующей статистической обработки (извлечение информации из бумажных форм – выборы, ЕГЭ и т.д.). • Формы, предназначенные для сбора информации, требующие процедуры ознакомления и подтверждения (заказы на покупку, счета, отчеты о командировках). • Формы, размещенные на Web-сайтах для использования удаленными пользователями (регистрация клиентов, заказ продукции).
Состав формы ЭД • Поля с постоянными реквизитами, не изменяющимися среди экземпляров документа одного типа (наименование предприятия). • Поля с переменными реквизитами, значения которых могут заполняться либо вручную, либо автоматически. • Автоматически заполняемые поля: • вычисляемые поля с помощью подключения стандартных статистических, математических, логических, финансовых функций или макросов, • автоматически заполняемые поля из БД или справочников. • Управляющие кнопки, предназначенные для инициирования более сложных вычислений или отправки документа по маршруту. • Поля для отметок, которые ставятся в документе в процессе его просмотра. • Поля с электронными подписями.
Проектирование форм ЭД • Проектирование структуры (внешнего вида) формы ЭД. • Проектирование содержания формы ЭД (определение перечня элементов). • Определение последовательности форм ЭД. • Установление связей между формами ЭД. • Апробация форм ЭД и их заполнение.
Подсистема организации массового ввода документов • Персональный ввод бумажных документов. • Ввод небольшого количества разнотипных бумажных документов с помощью планшетных или персональных сканеров. • Ручная индексация путем заполнения карточки документа. • Массовый (поточный) ввод бумажных документов. • Ввод большого количества однотипных бумажных документов. • Автоматическая индексация.
Задачи системы массового ввода • Извлечение данных из бумажных документов без сохранения их образов • Извлечение данных из бумажных документов с сохранением их образов • В случае использования структурированных данных для организации хранения и поиска изображений применяется атрибутивная индексация • В случае использования неструктурированных данных применяется полнотекстовая индексация • Извлечение данных из бумажных документов с частичным сохранением их образов (наиболее значимой части документа)
Подготовительный этап обработки документа • Подготовка документов для сканирования: • вскрытие конвертов, удаление скрепок или других предметов, мешающих сканированию; • определение состава документов, подлежащих сканированию; • выбор конкретных областей в каждом документе для сканирования; • определение технологической цепочки движения документа по рабочим местам; • формирование пакетов документов для сканирования; • выписка ярлыков на каждый пакет документов с указанием кода документа и количества документов каждого типа в пакете. • Настройка системы на конкретную форму и модель ввода документа предполагает описание полей документа и модели его ввода в базу данных.
Настройка системы на форму ЭД • Форма ЭД – набор полей. • Каждое поле описывается в двух аспектах: визуально и содержательно. • Визуально каждое поле должно быть явно обособлено. • Содержательная часть характеризуется назначением поля, словарным и алфавитным составом, а также законами построения текста
Настройка системы на модель ввода • Ввод ключевых слов. Ключевые слова будут использоваться в качестве индексов для конкретного изображения. • Ввод всего текста документа. Производится ввод всех слов документа для возможности осуществления полнотекстового поиска. • Формо-ориентированный ввод данных. Применяется для ввода данных из форм стандартных, однотипных документов. Атрибуты документа используются для составления индекса документа для его поиска и хранения.
Основной этап ввода документов • Сканирование • Предварительная обработка изображений • Улучшение читаемости изображения • Повышение точности распознавания. • Уменьшение размера изображения • Сегментация (нахождение полей) и распознавание • Контроль качества распознавания и редактирование • Индексирование документа и загрузка.
Технологии распознавания • OCR (Optical Character Recognition) – технология оптического распознавания печатных символов; • ICR (Intelligent Character Recognition) – распознавание раздельных печатных символов, написанных от руки; • OMR (Optical Mark Recognition) – распознавание отметок; • Стилизованные цифры – распознавание рукописных цифр, написанных от рукипо шаблону.
Требования к системам массового ввода • тип обрабатываемых документов и вид содержащихся в них данных; • точность распознавания; • наличие эффективной системы редактирования; • настраиваемость системы на требования заказчика; • способность системы адаптироваться к изменяющимся внешним условиям без программирования; • наличие поддержки сканеров различных типов; • наличие редактора форм; • наличие редактора схем обработки документов; • наличие редактора схем экспорта в базу данных для хранения или в другие бизнес-приложения для обработки.