1 / 28

Servicios de búsqueda en Microsoft SharePoint Server 2010

Código: HOL-SPS17. Servicios de búsqueda en Microsoft SharePoint Server 2010. Rubén Alonso ralonso@informatica64.com. Agenda. Tecnologías de búsqueda en Sharepoint Sharepoint Foundation 2010 Search Server 2010 Express Search Server 2010 Sharepoint Server 2010

Download Presentation

Servicios de búsqueda en Microsoft SharePoint Server 2010

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Código: HOL-SPS17 Servicios de búsqueda en Microsoft SharePoint Server 2010 Rubén Alonso ralonso@informatica64.com

  2. Agenda • Tecnologías de búsqueda en Sharepoint • Sharepoint Foundation 2010 • Search Server 2010 Express • Search Server 2010 • Sharepoint Server 2010 • FastSearch Server 2010 for Sharepoint • Funcionalidades de búsqueda de Sharepoint Server 2010 • Capacidades de búsqueda • Taxonomías • Orígenes de contenido • Ámbitos de búsqueda • Páginas autoritativas • Propiedades de metadados • Reglas de rastreo • Tipos de archivo • Búsquedas federativas • Informes de búsqueda

  3. Tecnologías de búsqueda en Sharepoint • Tecnologías Sharepoint de búsqueda: • Microsoft Sharepoint Foundation 2010 Search • Microsoft Search Server 2010 Express • Microsoft Search Server 2010 • Microsoft Sharepoint Server 2010 • Fast Search Server 2010 for Sharepoint

  4. Tecnologías de búsqueda en Sharepoint • Microsoft Sharepoint Foundation 2010 Searchproporciona búsqueda integrada en colecciones de sitios con las siguientes características: • Ámbitos de búsqueda en colección de sitios independientes. • Funcionalidades de búsqueda configuradas automáticamente. • Sistema de búsqueda con rastreo automático sin programación y sin control del administrador. • Se permiten IFilters para formatos de documentos Office y otros formatos comunes. • Escalado aproximadamente a 10 millones de elementos por servidor de consulta. • No se incluye rastreo de fuentes de datos externas y búsquedas en dichas fuentes.

  5. Tecnologías de búsqueda en Sharepoint • Microsoft Sharepoint Foundation 2010puede utilizarse siempre y cuando: • No se requiera por parte de la empresa realizar búsquedas en fuentes de datos externas como puedan ser recursos compartidos de tipo carpeta, sitios web externos, etc. • No se requiera realizar búsquedas más allá del ámbito de la colección de sitios. • El presupuesto de la empresa no permita la adquisición de capacidades adicionales de búsqueda. • No se requiera un control elevado por parte del administrador de las tareas realizadas por el servidor de búsqueda.

  6. Tecnologías de búsqueda en Sharepoint Microsoft Sharepoint Foundation 2101 - Topologías • Topología de servidor independiente: • Instalación de Microsoft Sharepoint Foundation 2010 con búsquedas instalado en servidor independiente • Topología de servidor dedicado: • Puede ser escalado a través de múltiples servidores,. • Se puede establecer la búsqueda en un servidor de aplicaciones dedicado. • El servidor de búsqueda proporciona indexación y consulta, no pudiendo separar dichas funciones • El servidor de búsqueda no puede ser desplegado en más de un servidor de aplicaciones para conseguir escalabilidad y rendimiento. Servidores Web Servidor de búsqueda (consulta e indexación) Servidor de BBDD en Cluster

  7. Tecnologías de búsqueda en Sharepoint • Microsoft Search Server Express 2010 proporciona búsqueda sobre contenido empresarial, pudiendo descargarse gratuitamente, proporcionando las siguientes características: • Rastreo de almacenes de datos externos, entre los que se incluyen otras colecciones de sitios de Sharepoint, otros sitios web, recursos compartidos de archivos, carpetas públicas de Exchange, conexiones al catálogo de datos profesional y Lotus Notes. • Realización de consultas federadas desde cualquier canal OpenSearch o RSS. • Despliegue limitado a no más de un servidor de aplicaciones o múltiples servidores de bases de datos para conseguir escalabilidad y rendimiento, pudiendo establecer múltiples servidores web. • Se puede utilizar SQL Server Express edition (gratuíto sin licencia) o SQL Server. • Escalado a 300.000 elementos aproximadamente en SQL Server Express o a 10 millones de elementos en SQL Server.

  8. Tecnologías de búsqueda en Sharepoint Microsoft Search Server 2010 Express - Topología Granja Windows Sharepoint Services Web Servers • Topología de servidor dedicado: • Puede haber múltiples servidores frontales web. • Search Server Express 2010 proporciona indexación y consulta en fuentes de datos externas. • Search Server Express 2010 proporciona búsquedas federativas • El servidor de búsqueda no puede ser desplegado en más de un servidor de aplicaciones para conseguir escalabilidad y rendimiento. Search Server 2010 (consulta e indexación) Servidor de BBDD en Cluster

  9. Tecnologías de búsqueda en Sharepoint • Microsoft Search Server 2010 proporciona una solución de búsqueda empresarial que puede ser escalada en múltiples servidores. Proporciona las siguientes características: • Incluye gran parte de las funcionalidades de búsqueda de Sharepoint Server 2010. • Puede desplegarse a través de múltiples servidores para conseguir redundancia e incremento de la capacidad del rendimiento. • Escalado aproximadamente a 100 millones de elementos. • Utilizado en caso de necesitar una solución empresarial que se pueda escalar para soportar múltiples servidores de rastreo y de consulta. • Utilizado para despliegues de grandes redes, ya que se puede escalar el servidor de búsqueda a partir de un despliegue limitado consistente en uno o dos servidores a un despliegue de una granja de tamaño grande conformada de 15 o más servidores.

  10. Tecnologías de búsqueda en Sharepoint Microsoft Search Server 2010 - Topología Pequeña topología de servidor de búsqueda (10 millones de elementos) • Servidores de Consulta (Query Server) • Incluyen una partición de índice, que almacena el índice completo. • La partición de índice incluye una copia primaria del componente de consulta y una copia espejo (m). • Para conseguir redundancia, la copia espejo se coloca en un servidor de consulta diferente. • Servidores de Rastreo (Crawl Server) • Dispone de la administración del rastreo. • El servidor de rastreo dispone de un rastreador que se asocia a una base de datos de rastreo (Crawl db). • Servidor de Base de Datos (Cluster o Reflejo) • Almacena bases de datos específicas. • Base de datos de administración de búsquedas • Base de datos de propiedades. • Base de datos de rastreo

  11. Tecnologías de búsqueda en Sharepoint • Microsoft Sharepoint Server 2010 proporciona una solución empresarial que incluye todas las capacidades de búsqueda añadiendo además integración con las herramientas de productividad como son las características de red social y la gestión de taxonomías. Características: • Topología de búsqueda escalable. • Integra características de red social como los índices y las búsquedas y resultados de personas o búsqueda en sitios personales. • Características de taxonomías administradas, como el etiquetado generado por el usuario o el ranking de búsquedas. • Puede llegar a escalarse aproximadamente a 100 millones de elementos. • Utilizado para despliegues de grandes redes, ya que permite escalabilidad, añadiendo además características de socialización de red y uso de taxonomías.

  12. Tecnologías de búsqueda en Sharepoint Microsoft Sharepoint Server 2010 - Topología Media topología de búsqueda compartida (20 millones de elementos) • Servidores de Consulta (Query Server) • Sitúa el rol de servidor web como el servidor de consulta en el mismo servidor. • Incluye dos particiones de índice. • Cada partición de índice incluye una copia primaria del componente de consulta y una copia espejo (m). • Para conseguir redundancia, la copia espejo se coloca en diferente servidor de consulta. • Servidores de Rastreo (Crawl Server) • Se dispone de la administración del rastreo en uno de ellos. • Cada servidor dispone de su propio rastreador, asociándose todos a la base de datos de rastreo (Crawl db). • Servidor de Base de Datos (Cluster o Reflejo) • Almacena bases de datos específicas. • Base de datos de administración de búsquedas • Base de datos de propiedades. • Base de datos de rastreo • Otro servidor almacena el resto de las BBDD de la granja

  13. Tecnologías de búsqueda en Sharepoint • Microsoft Fast Search Server 2010 for Sharepoint proporciona la solución empresarial más amplia que existe en el mercado en tecnologías Sharepoint, ya que incluye todas las capacidades de búsqueda e integración. Características: • Agrega flexibilidad de plataforma y escalado bajo demanda así como capacidades de procesamiento de contenido mejoradas. • Aporta gran escalabilidad y rendimiento. • Proporciona búsqueda empresarial enriquecida mediante la habilitad para personalizar y optimizar la relevancia y la navegación. • Permite rastrear diferentes tipos de orígenes de contenido externos e internos, incluyendo contenido web a gran escala. • Procesamiento de contenido sofisticado al permitir la extracción de propiedades. • Escalado a través de los siguientes ejes: • Volumen de documentos • Volumen de consulta • Procesado de contenido

  14. Tecnologías de búsqueda en Sharepoint Microsoft Fast Search Server 2010 for Sharepoint - Topología Media topología de búsqueda compartida escalada con Fast Search Server (100 millones de elementos)

  15. Capacidades de búsqueda

  16. Capacidades de búsqueda

  17. Taxonomías • Definición: • «Organización jerárquica de metadatos que permite clasificar y describir el entorno con una gran precisión». • En Sharepoint Server 2010 se incluye la aplicación de servicio Servicio de Metadatos Administrados, que incorpora la Herramienta de Administración de Almacén de Términos. • La herramienta de administración de almacén de términos permite definir taxonomías de metadatos jerárquicos. • El Servicio de Metadatos Administrados se clasifica con las siguientes estructuras: • Almacén de términos (Term Stores) • Grupo de conjunto de términos (Term Set Group) • Conjunto de términos (Term Set) • Términos (Term)

  18. Taxonomías

  19. Orígenes de Contenido • Utilizados para proceder al rastreo e indexación de fuentes de datos. • Por defecto, se incluye un origen de contenido denominado Sitios Locales de Sharepoint, que indexa todo el contenido de las colecciones de sitios y personas. • Tipos de orígenes de contenido: • Sitios de Sharepoint • Sitios web • Recursos compartidos de archivos • Carpetas públicas de Exchange • Datos de línea de negocio • Repositorio personalizado

  20. Ámbitos de búsqueda • Utilizados para acotar las búsquedas a ubicaciones específicas. • Se dispone de dos tipos de ámbitos: • Compartidos (creados a nivel de aplicación de servicio). • Locales (a nivel de colecciones de sitios) • Los elementos web tipo «SearchCoreResults» pueden ser acotados para que muestren los resultados de determinados ámbitos. • Dos ámbitos compartidos «de serie»: • Personas • Regla: SPSPeople • Todos los sitios • Regla: Todo el contenido

  21. Páginas Autoritativas • Utilizadas para indicar la información más relevante (aquella que se mostrará en primer lugar). • La función de búsqueda usa las páginas autoritativas para calcular el rango de cada página de índice. • Los resultados de búsqueda se pueden visualizar por fecha de modificación o por relevancia. • Existe la posibilidad de especificar páginas de primer nivel, de segundo nivel, de tercer nivel y páginas no autoritativas.

  22. Propiedades de metadatos • Permiten realizar consultas sobre las propiedades administradas al permitir el uso de las mismas en ámbitos. • Por defecto, se incluyen 120 propiedades administradas. • Las propiedades administradas pueden asociarse a propiedades rastreadas • Hasta que no se realiza un nuevo rastreo, no se actualizan los cambios realizados sobre dichas propiedades administradas. • Se incluyen opciones de optimización de almacenamiento de las mismas, reduciendo los requisitos de almacenamiento de las mismas, a través de una comparativa de hash.

  23. Reglas de rastreo • Permiten especificar reglas con rutas de acceso para excluir o incluir contenido a rastrear. • Como novedad, se permite especificar autenticación para el acceso y cumplimiento de las reglas de rastreo: • Cuenta de acceso al contenido predeterminada • Especificar una cuenta de acceso al contenido distinta • Especificar certificado de cliente • Especificar credenciales de formulario • Usar cookie para el rastreo

  24. Tipos de Archivo • Permite especificar cuales son las extensiones de los tipos de archivo a rastrear. • Seguimos disponiendo de IFILTERS para indexar formatos de archivo específicos. • No se asocian imágenes (iconos) a extensiones de archivos específicos (Docicon.xml)

  25. Búsquedas Federativas Permiten realizar búsquedas utilizando motores de búsqueda de terceros. Utilizan conectores federativos (*.FLD). Utilizan especificación OpenSearch (RSS o ATOM), índices de Sharepoint o índices FAST Microsoft dispone de una galería de conectores federativos más utilizados para descarga y utilización: http://www.microsoft.com/enterprisesearch/en/us/search-connectors.aspx#none Se disponen de elementos web para uso específico de búsquedas federativas

  26. Informes de búsqueda • En Sharepoint Server 2010 se han mejorado los informes de búsquedas. • Informes de administración de búsquedas • SearchAdministrationReports • Informes de análisis de web del servicio de búsqueda • Resumen • Número de consultas • Consultas principales • Búsquedas que no producen ningún resultado • Los informes de análisis del servicio de búsqueda permite filtrar por periodos de tiempo

  27. TechNews de Informática 64 Suscripción gratuita en http://www.informatica64.com/technews.aspx

  28. Contactos • Informática 64 • http://www.informatica64.com • i64@informatica64.com • +34 91 146 20 00 • Rubén Alonso Cebrián • ralonso@informatica64.com • www.puntocompartido.com

More Related