440 likes | 819 Views
OFS207. Microsoft. Михаил Бондаревский. Microsoft. Управление миллионами документов и терабайтами данных - управление контентом на платформе SharePoint. Денис Сагайдак. Содержание. Управление информацией – подход Microsoft
E N D
OFS207 Microsoft Михаил Бондаревский Microsoft Управление миллионами документов и терабайтами данных - управление контентом на платформе SharePoint Денис Сагайдак
Содержание • Управление информацией – подход Microsoft • Возможности SharePoint по управлению большими объемами данных • Пример создания большого хранилища документов • Технические детали и рекомендации по реализации хранилищ данных
Управление контентом: стратегия Microsoft Взаимодействие с пользователем — ПК, телефон и браузер Традиционные средства управления контентом Социальные сети и совместная работа Социальные сети и совместная работа Традиционные средства управления контентом Функции поиска обеспечивают эффективную работу с информацией
Дополнительные возможности управления корпоративным контентомПартнерские решения Система управления корпоративным информационным содержимым SharePoint Базовые возможности управления корпоративным контентом Управление бизнес-процессами Управление транзакционным контентом Потоковый ввод и сканирование Юридически значимый документооборот и ЭЦП Управление физическими записями Управление документами Управление записями Управление веб-контентом Управление мульти-медийным контентом Управление выходными данными документов Управление рабочими процессами Архивация электронной почты* * Архивация электронной почты обеспечивается Exchange
Возможности SharePoint 2010 для управления большими объемами данных • Таксономии и фолксономии • Навигация на основе метаданных • Наборы документов • Постоянные уникальные идентификаторы документов • Организатор контента • Встроенная поддержка удаленных хранилищ больших двоичных объектов • Управление записями на месте • Веб-приложения Office Web Applications • и многое другое….
Этапы работы с контентом Обработка, верификация, добавление метаданных Заявки InfoPath Центр сканирования SharePoint Server Партнерские решения Категоризация, Таксономия, Идентификаторы документов 3 7 1 6 5 4 Организатор контента 1а 2 Политики, Протокол согласования, IRM, Аудит Центр документов, Поиск, Метаданные Фолксономия Архив Набор Документов Перемещение в архив Рабочие процессы
Первичное получение документов Обработка, верификация, добавление метаданных Заявки InfoPath Центр сканирования SharePoint Server Партнерские решения Категоризация, Таксономия, Идентификаторы документов 3 7 1 6 5 4 Организатор контента 1а 2 Политики, Протокол согласования, IRM, Аудит Центр документов, Поиск, Метаданные Фолксономия Архив Набор Документов Перемещение в архив Рабочие процессы
Получение документов Михаил Бондаревский Демонстрация
Рекомендации (Электронные формы) • Максимально используйте возможности электронных форм • Использование InfoPath Designerпозволит быстро разработать сложный шаблон форму с бизнес-правилами • InfoPath Form Services предоставит возможность пользователю заполнять формы через браузер • Используйте возможности партнерских решений для обработки бумажных форм
Организатор контента,Категоризация, Таксономия,Наборы документов
Организатор контента Обработка, верификация, добавление метаданных Заявки InfoPath Центр сканирования SharePoint Server Партнерские решения Категоризация, Таксономия, Идентификаторы документов 3 7 1 6 5 4 Организатор контента 1а 2 Политики, Протокол согласования, IRM, Аудит Центр документов, Поиск, Метаданные Фолксономия Архив Набор Документов Перемещение в архив Рабочие процессы
Организатор контента (Content Organizer) • Обычно пользователям требуется четко представлять структуру сайта / библиотеки, чтобы знать, куда сохранять документы • Благодаря усовершенствованной маршрутизации пользователи передают документы на сайт • Правила маршрутизации определяют место сохранения документа • Правила маршрутизации задаются администраторами сайтов • Возможность автоматической отправки документов в центр записей по расписанию
Наборы документов • Каждый набор документов содержит: • Список разрешенных в нем типов контента • Контент по умолчанию, автоматически добавляемый в набор • Можно создавать общие столбцы (определенные в типе контента набора документов), которые применяются ко всему содержимому набора • Начальная страница является домашней страницей наборов документов • Настраиваемая веб-часть «Страница» отображает свойства документа
Уникальный идентификатор документа (Document ID) • Новая возможность семейства сайтов: служба ИД документов • Добавляет ко всем документам в семействе сайтов уникальные идентификаторы • Эти уникальные ИД позволяют получать документы независимо от их текущего и будущего расположения • http://<sitecollectionurl>/_layouts/DocIdRedir.aspx?ID=MFSHF5F7ZUF5-1-1
Термины, ключевые слова, теги • Термины • Приложение-служба (хранилище терминов) » Группы » Наборы терминов » Термины • Регионы » Города » Редмонд • Организация хранилища терминов и термины • Плоский или иерархический список • Каждому термину могут быть сопоставлены пользовательские свойства • Устранение противоречий, повторное использование, слияние и исключение терминов • Ключевые слова • Простой текст без перечисляемых источников • Аналогичны тегам, но без корпоративных характеристик (синонимов, переводов, иерархии и др.) • Теги
Организатор контента,Категоризация, Таксономия,Наборы документов Михаил Бондаревский Демонстрация
Рекомендации • Классификация • используйте качественный корпоративный справочник, привлекайте экспертов; • старайтесь не использовать очень глубокую вложенность, начните с 2-3 уровней • Организатор контента • максимально автоматизируйтеразмещение документов; • не забудьте включить это опцию на адресуемом сайте • Идентификатор документа – привяжите к вашему делопроизводству (используйте вашу номенклатуру) • Наборы документов – используйте понятные определения
Рабочие процессы Обработка, верификация, добавление метаданных Заявки InfoPath Центр сканирования SharePoint Server Партнерские решения Категоризация, Таксономия, Идентификаторы документов 3 7 1 6 5 4 Организатор контента 1а 2 Политики, Протокол согласования, IRM, Аудит Центр документов, Поиск, Метаданные Фолксономия Архив Набор Документов Перемещение в архив Рабочие процессы
Рабочие процессы,Аудит,Политики Михаил Бондаревский Демонстрация
Рекомендации • Используйте политики вместо создания мини-рабочих процессов или написания своих обработчиков событий • Используйте стандартные рабочие процессы (они достаточно мощные их надо просто настроить) • Помните о WikiLeaks – используйте IRM • Аудит – ваша служба безопасности будет довольна
Поиск, как основной инструмент доступа к документам
Центр документов Обработка, верификация, добавление метаданных Заявки InfoPath Центр сканирования SharePoint Server Партнерские решения Категоризация, Таксономия, Идентификаторы документов 3 7 1 6 5 4 Организатор контента 1а 2 Политики, Протокол согласования, IRM, Аудит Центр документов, Поиск, Метаданные Фолксономия Архив Набор Документов Перемещение в архив Рабочие процессы
OFS206 Построение поисковых приложений на основе FAST Search Server for SharePoint
Рекомендации • Максимально используйте поиск и поисковый API вместо написания своих web-частей фильтрации, сортировки и представления • Удобный пользовательский интерфейс • Панель-отчет статуса заявок • Последние заявки • Текущий статус активных заявок • Центр поиска • Индивидуальные закладки поиска для каждого подразделения, с различными параметрами • Метаданные • Заполняются редко • Позволяют находить необходимую информацию (учитываются в рэнкинге, правах доступа, рекомендациях, т.д.)
Организация архива Обработка, верификация, добавление метаданных Заявки InfoPath Центр сканирования SharePoint Server Партнерские решения Категоризация, Таксономия, Идентификаторы документов 3 7 1 6 5 4 Организатор контента 1а 2 Политики, Протокол согласования, IRM, Аудит Центр документов, Поиск, Метаданные Фолксономия Архив Набор Документов Перемещение в архив Рабочие процессы
Организация архива Михаил Бондаревский Демонстрация
Рекомендации • «Актуальные» документы – давностью до Х месяцев хранить на локальном SQL Server с использованием SAN • «Архивные» документы – используйте Remote Blob Storage (RBS) • Бесшовное подключение к облачному хранилищуили любому недорогому решению по хранению • Единый интерфейс для доступа к «Актуальным» и «Архивным» данным • Azure – обеспечивает необходимый уровень обслуживания связанный с высокой доступностью и восстановлением после сбоев • Использование возможностей аппаратной дедубликации • Возможность горизонтального масштабирования слоя доступа к данным
Рекомендуемые ограничения • При правильном подходе SharePoint может масштабироваться под любые ваши требования • Новые рекомендации и ограничения выпущены в Июле 2011 • Рекомендуется хранить до 4 Тб в одной контентной базы • Используйте несколько контентных баз вместо одной большой • Ограничение на 60 Миллионов записей в одной контентной базе • Для архива (доступ только на чтение) ограничений нет
Демонстрация масштабируемости и отказоустойчивости SharePoint Server2010 Видео
Пример хранилища на 120 Миллионов документов (30Тб) • http://go.microsoft.com/fwlink/?LinkId=229493
Файловый архив или SharePoint? Используйте SharePoint: Используйте файловые папки: Файлы представляют собой архивы, дампы данных или резервные копии или редко изменяются Вам необходима строгая модель безопасности Размещаемые файлы используют клиент-серверный профиль доступа Необходимо локальное размещение файлов Для хранения исполняемых файлов .exe , scripts, и т.д.. • Вам нужен контроль версий • Пользователи совместно работают над документами • Вам нужна гибкая модель безопасности • Все пользователи имеют доступ к SharePoint • Файлы описываются с использованием метаданных • Вам необходимо соответствовать правилам, которые нельзя выполнить с файловыми папками
Итоги • SharePoint 2010 позволяет реализовать ECM решение, соответствующее практически любому количеству пользователей, объему информации и темпу их роста. • Предлагаемые подходы максимально использует стандартную функциональность SharePoint 2010 и не требует значительных инвестиций в доработку: • Использование InfoPath формпозволяет быстро разработать сложную форму на основе стандартной xml-схемы клиента и опубликовать ее на портале. • Использование таксономии и навигации по метаданнымпозволяет организовать эффективную навигацию в библиотеках документов и возможность уточнения результатов поиска. • Использование организатора контента позволяет организовать эффективное хранение документов автоматически распределяя их в соответствии с правилами.
Сессии по теме • OFS206 Построение поисковых приложений на основе FAST Search Server for SharePoint • OFS214 Вы внедрили SharePoint – что теперь? • OFS215 Корпоративный поиск в SharePoint 2010 • OFS302 Использование собственных InfoPath-шаблонов для построения форм • OFS312 Оптимизация и тюнинг производительности SharePoint 2010 • ARC205 Как реализовать интранет-портал на SharePoint 2010 для 100000+ сотрудников
Ресурсы • Scale Test Report for Very Large-Scale Document Repositories • Top 10 SQL 2012 “Denali” Enhancements for SharePoint • Install and configure RBS (SharePoint Server 2010) • Data Storage Changes for SharePoint 2010 • SharePoint Server 2010 capacity management: Software boundaries and limits • FILESTREAM Storage in SQL Server 2008
Обратная связь Уважаемые участники! Ваше мнение очень важно для нас! В блокноте, который находится в инфопаке участника, вы найдете анкету для оценки докладов Пожалуйста, оцените доклад и сдайте анкету при выходе из зала модератору Для участия в конкурсе заполненных анкет, отметьте в анкете номер, который указан на вашем бейдже Спасибо!
Вопросы • OFS207 • Денис Сагайдак • Консультант по бизнес-решениям • denis@microsoft.com • Михаил Бондаревский • Архитектор Технологического центра Майкрософт • a-mibon@microsoft.com • Вы сможете задать вопросы докладчику в зоне Microsoft в зале №17 в течение часа после завершения этой сессии