Contenidos

2. Contenidos GBIF qu� es trabajo y principios proveedores actuales c�mo se proporcionan datos protocolos + est�ndares utilizados paquetes software disponibles Formatos de intercambio para espec�menes y observaciones Est�ndar Darwin Core 2: versiones 1.2 y 1.4 Est�ndar ABCD DiGIR Protocolo DiGIR provider software Caso Pr�ctico I. Instalaci�n de DiGIR provider UDDI Plataforma UDDI UDDI en GBIF Registro y Actualizaci�n Caso pr�ctico II. Registro y Navegaci�n en el UDDI de GBIF Portales de GBIF Caso pr�ctico III. Navegaci�n en los portales de b�squeda de GBIF TAPIR: Protocolo TapirLink software Caso pr�ctico IV. Instalaci�n TapirLink, manejo y migraci�n desde DiGIR

3. GBIF es una iniciativa internacional que se propone hacer accesible a trav�s de Internet de forma gratuita toda la informaci�n disponible sobre los organismos vivos conocidos a nivel mundial Concebida a instancias de la OCDE (Organizaci�n para la Coorperaci�n y el Desarrollo Eecon�mico) 1996, MegaScience Forum Working Group- encargado de lanzar iniciativas cient�ficas de inter�s fundamental pero que por su escala no eran abordables por pa�s alguno. En este foro surge el concepto de GBIF con la idea de aplicar la inform�tica como mecanismo para facilitar y administrar informaci�n proveniente de la naturaleza Los miembros son estados, econom�as y organizaciones internacionales Los estados miembros se comprometen a establecer uno � m�s nodos a trav�s de los que compartir su informaci�n sobre biodiversidad contribuyendo adem�s econ�micamente a la inciativa INFRAESTRUCTURA MUNDIAL DE INFORMACI�N EN BIODIVERSIDAD GBIF

4. TRABAJO Y PRINCIPIOS DE GBIF Trabaja para construir la principal red de bases de datos sobre biodiversidad, herramienta fundamental en el desarrollo cient�fico de los pa�ses y que contribuir� a una mejor protecci�n y uso de la biodiversidad en el planeta Principios: Los proveedores de datos tienen el control sobre los mismos, sus bases de datos tienen entidad por s� mismas y se reconocen los derechos de propiedad intelectual Promueve una arquitectura no centralizada, y el uso de software de �c�digo abierto� Esta red se construye a partir de fuentes hetereog�neas relativas a datos primarios: Especimenes, Observaciones y Nombres

6. Proveedores de Datos Actualmente: 201� Proveedores de datos 1086 Colecciones M�s de 125 millones de registros de especimenes/observaciones.

7. �Como se proporcionan los datos a GBIF? A trav�s de un modelo en el que los proveedores puedan: Controlar y gestionar el acceso a los datos Proporcionar los metadatos tanto de las instituciones como de las colecciones Uso de paquetes software desarrollados � recomendados por gbif.org Registro en el UDDI Fuente de datos previamente avalada por el nodo http://registry.gbif.net/uddi/web [Servicio de Alojamiento de la Unidad de Coordinaci�n GBIF.es]

8. Est�ndares y protocolos en biodiversidad Existe una gran cantidad de informaci�n sobre biodiversidad a nivel mundial (N�mero esperado de especies: 10 millones. 1.7 millones han sido descritas y nombradas. N�mero total de espec�menes en las colecciones del mundo de 1-3 mil millones.) Accesibilidad + Compartici�n + Integraci�n (S.O y B.D) + Evitar la duplicaci�n de esfuerzos Para hacer posible el intercambio de informaci�n sobre biodiversidad (interoperabilidad) Formatos de intercambio de informaci�n (definici�n de datos comunes) + Protocolos que permitan la comunicaci�n y el transporte de esos formatos [TDWG:Foro de debate para proyectos de datos biol�gicos, desarrollando y promoviendo el uso de est�ndares para facilitar el intercambio de datos, y evitar la duplicidad de esfuerzos]

9. Paquetes de Software GBIF recomienda el uso de diversos paquetes de software (provider package) compuestos por: -Un formato de intercambio de datos com�n (est�ndar) -Un protocolo que sea capaz de reconocer y manejar dicho formato a trav�s de internet ?DiGIR protocol (http://www.digir.net/) + Darwin Core (http://darwincore.calacademy.org/) ?BioCASE protocol (http://www.biocase.org/) + ABCD (http://www.bgbm.org/TDWG/CODATA/default.htm) ?[TAPIR protocol (http://www.tdwg.org/activities/tapir/)]

10. Versiones soportadas Las combinaciones de protocolos + formatos de intercambio

11. Paquetes de Software DiGIR Provider (php) Desarrollado a partir del �data provider� de digir.sourceforge.net y modificado para que sea capaz de trabajar con el registro UDDI Soportado por el Secretariado Internacional de GBIF (workshops, helpdesk) GBIF Data Repository Tool Herramienta para Nodos que permite crear y gestionar un servicio de alojamiento (almacena datos subidos en formato documento, como hojas excel,documentos de Word, etc) DiGIR,Python, Zope y MySQL Soportado por el Secretariado Internacional de GBIF Disponibles desde: GBIF tools downloads: (http://www.gbif.org/serv/gbif-tools) BioCASE - BioCASE wrapper 2.0 (http://www.biocase.org/provider/) TAPIR - PyWrapper v3 (http://trac.pywrapper.org/pywrapper/) TAPIR-TapirLink http://wiki.tdwg.org/twiki/bin/view/TAPIR/TapirLink

12. Darwin Core 2 (DwC) Est�ndar dise�ado para facilitar el intercambio de informaci�n de datos primarios de biodiversidad a trav�s de internet Caracter�sticas: Para datos de colecciones y datos observacionales Representa un m�nimo com�n denominador en la la informaci�n a compartir. Informaci�n en espacio y tiempo: El qu�, el cuando y el d�nde. (+extensiones 1.4) Simplicidad: minimizando las barreras entre los proveedores de datos maximizando la disponibilidad para los usuarios Para intercambio, no para modelado de datos Historia: Inicios: 2001-2003. The Species Analyst - Universidad de Kansas. En 2002 MaNIS - de la Universidad de Berkeley. 1� red distribuida basada en DiGIR + Darwin Core (MANIS version) Desde 2004. TDWG. �ltima versi�n -�Draft� (adaptaci�n nueva arquitectura TDWG). Task Group:Darwin Core (DwC)

13. Darwin Core 2 (DwC) Estad�sticas de uso a nivel mundial (fuente: http://bigdig.ecoforge.net/ para DiGIR) N�mero de proveedores:210 N�mero de fuentes (resources):1225 N�mero de registros:100.472.356 Versiones: [El documento que define el est�ndar es un XML Schema (*.xsd) ] DwC 1.2 schema Primera versi�n (usada en GBIF) DwC 1.21 schema revisi�n (usada en GBIF, MaNIS, HerpNet, OrNIS, y FishNet2) DwC 1.3 schema Presentado en el TDWG Meeting 2004 (no utilizada) DwC 1.4 schema Borrador bajo discusi�n (no para uso) OBIS Basada en DwC 1.2 (usada en GBIF, Ocean Biogeographic Information System)

14. Darwin Core 1.2

15. Darwin Core 1.2 Documento traducido al espa�ol: http://www.gbif.es/ficheros/DarwinCore2_esp.pdf

16. Campos de Darwin Core 1.2 DateLastModified: La fecha y hora de la ultima modificaci�n del registro seg�n norma ISO 8601 en UTC(GMT). Ejemplo: "5 de Noviembre 5, 1994, 8:15:30, Madrid (GMT+1:00)" ser�a "1994-11-05T7:15:30Z" InstitutionCode: Un c�digo que identifica la instituci�n o centro a la que la colecci�n pertenece. No existe ning�n registro global para la asignaci�n de los c�digos; utiliza el c�digo que es est�ndar dentro de tu disciplina. CollectionCode: Un valor alfanum�rico �nico que identifica la colecci�n dentro de la instituci�n. CatalogNumber: Un texto alfanum�rico �nico que identifica un registro individual dentro de una colecci�n. Se recomienda que este valor proporcione una clave por la que el esp�cimen en cuesti�n puede ser identificado. Si el esp�cimen tiene varios elementos como por ejemplo varios tipos de preparaci�n, este valor deber�a identificar la componente individual del esp�cimen. ScientificName: nombre completo de menor rango especificado en la identificaci�n del organismo. BasisOfRecord: Una descripci�n que indica si el registro representa una observaci�n (O), un organismo vivo (L), un esp�cimen testigo (S), germoplasma/semilla (G) etc. Kingdom: El nombre del reino al que pertenece el organismo. Phylum: El nombre de la divisi�n al que pertenece el organismo. Class: El nombre de la clase al que pertenece el organismo. Order: El nombre del orden al que pertenece el organismo. Family: El nombre de la familia al que pertenece el organismo. Genus: El nombre del g�nero al que pertenece el organismo. Species: El nombre de la especie al que pertenece el organismo. Subspecies: El nombre de la subespecie al que pertenece el organismo. ScientificNameAuthor: El autor o autores del nombre cient�fico. Se debe ajustar a las convenciones de la disciplina taxon�mica correspondiente.

17. Campos de Darwin Core 1.2 IdentifiedBy: El/los nombre/s de la/s persona/s que asignaron el nombre cient�fico, actualmente aceptado, al objeto catalogado. YearIdentified: El a�o de la identificaci�n, con cuatro d�gitos, p. ejemplo 1906, 2002 etc. MonthIdentified: El mes de la identificaci�n, con dos d�gitos [01..12]. DayIdentified: El d�a del mes de la identificaci�n, con dos d�gitos [01..31]. TypeStatus: Indica la designaci�n m�s reciente del ejemplar como tipo nomenclatural. CollectorNumber: Un n�mero identificador (en formato texto) aplicado al ejemplar en el momento de la recolecci�n. Establece enlaces entre diferentes partes/preparaciones de un �nico esp�cimen y entre notas de campo y el esp�cimen. FieldNumber: Un n�mero identificador (en formato texto) aplicado en el momento de la recolecci�n a un conjunto de material que se ha generado durante una �nica recolecci�n. Collector: El/los nombre/s del/los recolector/es responsable/s de la recolecci�n o que hizo la observaci�n. YearCollected: El a�o durante el que el ejemplar ha sido recolectado en el campo, siempre con cuatro d�gitos, p.ej. 1972. MonthCollected: El mes del calendario durante el que el ejemplar ha sido recolectado en el campo, siempre con dos d�gitos, [01�12]. DayCollected: El d�a del mes durante el que el ejemplar ha sido recolectado en el campo, siempre con dos d�gitos, [01�31]. JulianDay: El d�a ordinario del a�o (o sea, el n�mero de d�as pasados desde el d�a 31 de Diciembre del a�o anterior, el 1 de Enero es JulianDay 1) en que el ejemplar ha sido recolectado. Puede ser calculado mediante los campos YearCollected, MonthCollected, y DayCollected.

18. Campos de Darwin Core 1.2 TimeOfDay: La hora en que el ejemplar ha sido recolectado, expresado como hora decimal desde medianoche, hora local (p.ej.: 12.0 y 13.5). ContinentOcean: El nombre completo del continente u oc�ano donde el ejemplar ha sido recolectado. Country: El pa�s o la unidad pol�tica mayor donde el esp�cimen ha sido recolectado, expresado seg�n la norma ISO 3166-1 con c�digo de dos letras, p.ej. Espa�a = ES. StateProvince: El nombre completo de la provincia del que el ejemplar ha sido recolectado. County: El nombre completo del municipio del que el ejemplar ha sido recolectado. Locality: Descripci�n de la localidad de recolecci�n. Longitude: La longitud de la localizaci�n donde el ejemplar ha sido coleccionado, expresado en grados decimales. Latitude: La latitud de la localizaci�n donde el ejemplar ha sido coleccionado, expresado en grados decimales. CoordinatePrecision: Una estima de c�mo de cerca ha sido especificada la localidad de recolecci�n; expresada en la distancia en metros que corresponde al radio alrededor de la localidad. Utiliza NULL si el error es desconocido, si no se puede estimar o si no aplica. BoundingBox: Proporciona un mecanismo para ejecutar b�squedas utilizando un cerco. Un cerco normalmente no est� presente en la base de datos, pero se puede generar a partir de los campos Latitude y Longitude. (este dato NO es devuelta en las b�squedas) MinimumElevation: La distancia m�nima en metros por encima (positivo) o por debajo (negativo) del nivel del mar en que se encuentra la localidad de recolecci�n. MaximumElevation: La distancia m�xima en metros por encima (positivo) o por debajo (negativo) del nivel del mar en que se encuentra la localidad de recolecci�n.

19. Campos de Darwin Core 1.2 MinimumDepth: La distancia m�nima en metros por debajo de la superficie del agua donde la recolecci�n ha sido realizada; todo el material recolectado tiene al menos esta profundidad. Positivo por debajo de la superficie, negativo por encima (p. ejemplo: recolecciones por encima del nivel del mar en zonas de marea). MaximumDepth: La distancia m�xima en metros por debajo de la superficie del agua donde la recolecci�n ha sido realizada; todo el material recolectado tiene al menos esta profundidad. Positivo por debajo de la superficie, negativo por encima (p.ejemplo: recolecciones por encima del nivel del mar en zonas de marea). Sex: C�digo que representa el sexo del organismo (propuesto: M=macho, F=hembra, H=hermafrodita, I=sin determinar (examinado pero no pudo ser determinado), U=desconocido (no examinado), T=transicional (entre sexos, �til para hermafroditas secu�nciales) PreparationType: Una lista de m�todos de preparaci�n y conservaci�n del ejemplar (piel, cr�neo, esqueleto, animal entero (ETHO), preparaci�n microsc�pica, etc.). Se refiere a un �nico registro de colecci�n. IndividualCount: El n�mero de individuos presentes en un lote o contenedor a que el n�mero de catalogo se refiere. No es una estima de la abundancia o densidad en la localidad de recolecci�n. PreviousCatalogNumber: Lista de c�digos de colecci�n asignados previamente al ejemplar. Tiene que ser compuesto por el c�digo del centro y del c�digo de la colecci�n, aunque quiz�s ya no existan. RelationshipType: Un nombre o c�digo que identifica el tipo de relaci�n entre el registro de la colecci�n y el registro de la colecci�n referenciada. Valores que puede tener: "parasite of", "epiphyte on", "progeny of", etc. En futuras versiones del esquema este atributo podr�a ser interesante. RelatedCatalogItem: El identificador completo del registro con el cual est� relacionado (una referncia a otro esp�cimen); Compuesto por: Institution Code, Collection Code y Catalogue Number del registro con el que se relaciona (los tres elementos separados por un espacio). Notes: Cualquier anotaci�n que se desee realizar sobre el registro (esp�cimen u observaci�n).

20. Darwin Core 1.4 Estado:�Draft�. Se encuentra bajo desarrollo para adaptarse a la nueva arquitectura del TDWG Formado por un n�cleo central de elementos y una serie de extensiones con informaci�n adicional: de una disciplina en concreto simplemente informaci�n extra Independiente del protocolo DiGIR Incluye GlobalUniqueIdentifier XML Schema: Core: http://rs.tdwg.org/dwc/tdwg_dw_core.xsd Extensi�n curatorial: http://rs.tdwg.org/dwc/tdwg_dw_curatorial.xsd Extensi�n geoespacial: http://rs.tdwg.org/dwc/tdwg_dw_geospatial.xsd Extensi�n Paleontol�gica

21. Darwin Core 1.4 Core: Elementos a nivel de registro: GlobalUniqueIdentifier , DateLastModified , BasisOfRecord , InstitutionCode , CollectionCode , CatalogNumber , InformationWithheld , Remarks Elementos taxon�micos: ScientificName, HigherTaxon , Kingdom , Phylum, Class, Order , Family, Genus, SpecificEpithet, InfraspecificRank, InfraSpecificEpithet, AuthorYearOfScientificName , NomenclaturalCode Elementos de Identificaci�n : IdentificationQualifer Elementos referentes a la localidad y localizaci�n: HigherGeography, Continent, WaterBody, IslandGroup, Island, Country, StateProvince, County, Locality, MinimumElevationInMeters, MaximumElevationInMeters, MinimumDepthInMeters, MaximumDepthInMeters Elementos referentes al evento de recolecci�n : CollectingMethod, ValidDistributionFlag, EarliestDateCollected, LatestDateCollected, DayOfYear, Collector Elementos biol�gicos: Sex, LifeStage, Attributes Elementos de referencia: ImageURL, RelatedInformation

22. Darwin Core 1.4 Extension Curacional: Elementos a nivel de registro: CatalogNumberNumeric , IdentifiedBy, DateIdentified, CollectorNumber, FieldNumber, FieldNotes, VerbatimCollectingDate, VerbatimElevation, VerbatimDepth, Preparations, TypeStatus, GenBankNumber, OtherCatalogNumbers, RelatedCatalogedItems, Disposition, IndividualCount Extensi�n Geoespacial: Elementos Geoespaciales: DecimalLatitude, DecimalLongitude, GeodeticDatum, CoordinateUncertaintyInMeters, PointRadiusSpatialFit, VerbatimCoordinates, VerbatimLatitude, VerbatimLongitude, VerbatimCoordinateSystem, GeoreferenceProtocol, GeoreferenceSources, GeoreferenceVerificationStatus, GeoreferenceRemarks, FootprintWKT, FootprintSpatialFit Extensi�n Paleontol�gica: Elementos Paleontol�gicos: EarliestEonOrLowestEonothem, LatestEonOrHighestEonothem, EarliestEraOrLowestErathem, LatestEraOrHighestErathem, EarliestPeriodOrLowestSystem, LatestPeriodOrHighestSystem, EarliestEpochOrLowestSeries, LatestEpochOrHighestSeries, EarliestAgeOrLowestStage, LatestAgeOrHighestStage, LowestBiostratigraphicZone, HighestBiostratigraphicZone, LithostratigraphicTerms, Group, Formation, Member, Bed

23. ABCD (Access to Biological Collections Data ) ABCD Access to Biological Collections Data (2.0.6a) Para datos de colecciones biol�gicas (espec�menes y observaciones) Proporciona definiciones sem�nticas Estructura jer�rquica (alta estructuraci�n con gran n�mero de elementos. Pretende cubrir un m�ximo de detalle) Trabaja con extensiones Posibilidad de trabajo con diferentes niveles de detalle (atomizaci�n/fusi�n) Incluye GUID�s Indica en que idioma est� la informaci�n contenida Permite la repetici�n de registros (por ejemplo revisiones) Compatibilidad con Darwin Core (versiones 1.2 y 1.4), HISPID (Herbarium Information Standards and Protocols for Interchange of Data ), etc. http://www.bgbm.org/tdwg/codata/schema/

24. Compatibilidad DwC-ABCD Darwin Core (DwC) y ABCD son est�ndares complementarios Dwc es una estructura plana representa el m�nimo com�n denominador ABCD. Para m�ximo detalle de los registros; est� estructurado de forma jer�rquica y soporta la repetici�n de elementos Para asegurar la interoperabilidad la �traducci�n� entre ambos est�ndares debe de estar asegurada. Los elementos de DwC han sido mapeados a ABCD URL del mapeo: http://www.bgbm.org/TDWG/CODATA/Schema/Mappings/DwCAndExtensions.htm

25. DiGIR: Distributed Generic Information Retrieval Es un protocolo cliente/Servidor para recopilar datos desde fuentes distribuidas. Usa HTTP como protocolo de transporte y XML para la codificaci�n de los mensajes entre cliente y servidor. Tres tipos de mensajes: Metadata: Obtiene los metadatos de los proveedores y de las fuentes de datos servidas. Search: Encuentra registros de especimenes y observaciones que cumplen un criterio de b�squeda, por ejemplo: el nombre de una especie y/o un rect�ngulo que define un �rea de la superficie de la tierra y/o � Inventory: Obtiene el conjunto de valores asociados a un concepto. Por ejemplo: Especies. Proporciona un �nico punto de acceso a varias fuentes distribuidas de informaci�n Trabaja con el est�ndar de intercambio Darwin Core2 (para especimenes y observaciones), estableciendo la correspondencia entre las bases de datos de las colecciones y este formato.

26. DiGIR Provider: �Como Trabaja?

27. DiGIR Provider: �D�nde se integra?

28. DiGIR y Darwin Core2 Request: <?xml version="1.0" encoding="UTF-8"?><request xmlns="http://digir.net/schema/protocol/2003/1.0"�� xmlns:darwin="http://digir.net/schema/conceptual/darwin/2003/1.0"�� xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://digir.net/schema/protocol/2003/1.0 http://digir.sourceforge.net/schema/protocol/2003/1.0/digir.xsd http://digir.net/schema/conceptual/darwin/2003/1.0 http://digir.sourceforge.net/schema/conceptual/darwin/2003/1.0/darwin2.xsd"> �� <header>�� <version>0.95</version>�� <sendTime>2005-06-14T18:30:19+02:00</sendTime>�� <source>127.0.0.1</source>�� <destination resource=�biotella">http://giorgos.gbif.org:80/digir/DiGIR.php</destination>�� <type>search</type>�� </header> �� <search>�� <filter>�� <like>�� <darwin:InstitutionCode>bioshare.com</darwin:InstitutionCode>�� </like>�� </filter>�� <records limit=�3" start="0">�� <structure schemaLocation="http://digir.sourceforge.net/schema/conceptual/darwin/brief/2003/1.0/darwin2brief.xsd"/>�� </records>�� <count>true</count>�� </search> </request>

29. DiGIR y Darwin Core2 Response <?xml version="1.0" encoding="utf-8" ?> <responseWrapper> <response xmlns='http://digir.net/schema/protocol/2003/1.0'> <header> <version>$Revision: 1.10 $</version> <sendTime>11-09-2003 16:33:53+0200</sendTime> <source resource="biotella">http://giorgos.gbif.org:80/digir/DiGIR.php</source> <destination>192.38.103.181</destination> </header> <content xmlns:darwin='http://digir.net/schema/conceptual/darwin/2003/1.0' xmlns:xsd='http://www.w3.org/2001/XMLSchema' xmlns:xsi='http://www.w3.org/2001/XMLSchema-instance'> <record> <darwin:DateLastModified>19930717T225000Z</darwin:DateLastModified> <darwin:InstitutionCode>bioshare.com</darwin:InstitutionCode> <darwin:CollectionCode>pyy</darwin:CollectionCode> <darwin:CatalogNumber>4</darwin:CatalogNumber> <darwin:ScientificName>Diarsia mendica</darwin:ScientificName> </record> <record> <darwin:DateLastModified>19950526T220000Z</darwin:DateLastModified> <darwin:InstitutionCode>bioshare.com</darwin:InstitutionCode> <darwin:CollectionCode>pyy</darwin:CollectionCode> <darwin:CatalogNumber>6</darwin:CatalogNumber> <darwin:ScientificName>Lycia lapponaria</darwin:ScientificName> </record> <record> <darwin:DateLastModified>19950526T220000Z</darwin:DateLastModified> <darwin:InstitutionCode>bioshare.com</darwin:InstitutionCode> <darwin:CollectionCode>pyy</darwin:CollectionCode> <darwin:CatalogNumber>7</darwin:CatalogNumber> <darwin:ScientificName>Plutella maculipennis</darwin:ScientificName> </record> </content> <diagnostics> <diagnostic code="MATCH_COUNT" severity="info">42763</diagnostic> <diagnostic code="RECORD_COUNT" severity="info">3</diagnostic> <diagnostic code="END_OF_RECORDS" severity="info">false</diagnostic> </diagnostics> </response> </responseWrapper>

30. Paquete GBIF DiGIR Provider Incluye: El software del DiGIR Provider. Servidor Web Apache2 Y librer�as de PHP. Solo se necesita tener conocimientos b�sicos del sistema operativo. Disponibles para: (http://circa.gbif.net/Public/irc/gbif/ict/library?l=/digir_provider_package) Linux (RedHat 7.3, 8, 9) MS Windows (2000, XP) Permite registrar nuestro proveedor de datos de forma autom�tica en el Servidor UDDI de GBIF (GBIF UDDI Registry: http://registry.gbif.net)

31. Paquete GBIF DiGIR Provider Bases de datos soportadas: MySQL, PostgreSQL MS SQL Server, MS Access (solo en el pquete de DiGIR para MS Windows) Oracle 8i/9i Conexi�n a los datos Hay dos alternativas a la hora de conectar el software a la tabla/s con los datos a mostrar: Mapeando en la Base de Datos (r�pidas consultas con �ndices, disponible en Biotella). Mediante una vista, consulta, � Mapeando directamente desde DiGIR Provider (no es necesario del trabajo de la base de datos)

32. Paquete GBIF DiGIR Provider Herramientas de test: Metadata: http://nombreservidor:puerto/digir/test/eg_metadata.php Inventory: http://nombreservidor:puerto/digir/test/eg_inventory.php Search: http://nombreservidor:puerto/digir/test/eg_search.php Caso pr�ctico I.Instalaci�n DiGIR provider (I.DiGIR_Provider.pdf)

33. Monitorizaci�n DiGIR providers- The Big Dig The "Big Dig" es un proyecto de ecoforge.net desarrollado en 2006 por el Natural History Museum and Biodiversity Research Center of the University of Kansas Servicio que genera de manera autom�tica informes del estado y las caracter�sticas de los DiGIR providers Status:Una vez al d�a Schema: Una vez a la semana Evalua el estado de las instalaciones de los DiGIR provider Examina registros y reporta las caracter�sticas del software instalado Status, versi�n, n�mero de colecciones, n�mero de registros, schema, tiempo de respuesta, encoding Ayuda a los administradores ante posibles problemas http://bigdig.ecoforge.net/

34. UDDI (Universal Description Discovery & Integration ) Registro p�blico dise�ado para almacenar de forma estructurada informaci�n sobre empresas y los servicios web que �stas ofrecen Es accedido por mensajes SOAP y da paso a documentos WSDL Tiene m�todos para publicar y encontrar informaci�n de negocios y especificaciones de sus servicios. Los 4 principales tipos de datos: businessEntity: representa la informaci�n b�sica del negocio. Por ejemplo, informaci�n de contacto, clasificaci�n, descripciones, etc. businessService: describe un servicio proporcionado por el negocio. bindingTemplate: contiene la URL de su punto de acceso y una referencia a uno o m�s tModel tModel: descripci�n abstracta de una especificaci�n o comportamiento particular el cual forma el Servicio Web.

35. UDDI de GBIF Registro autom�tico: herramienta de registro on-line [recomendado]. http://www.gbif.org/DataProviders/registerme El proveedor ser� registrado y el GBIF Helpdesk (helpdesk@gbif.org) informar� al gestor del Nodo del dominio seleccionado Registro autom�tico en el GBIF UDDI registry.

36. Registro y Actualizaci�b en el UDDI de GBIF

37. Portales de B�squeda

38. TAPIR (TDWG Access Protocol for Information Retrieval ) TAPIR es un protocolo para acceso a datos estructurados provenientes de bases de datos distribuidas de estructura l�gica y f�sica diferentes TAPIR combina las caracter�sticas de los protocolos BioCASe y DiGIR y ampl�a las posibilidades de comunicaci�n entre aplicaciones cliente y proveedores de datos a trav�s de Internet Su potencialidad permite la interoperabilidad no solo entre especimenes u observaciones si no que se puede utilizar en otros dominios (geol�gico, ecol�gico, clima, secuenciaci�n gen�tica, geoespacial, etc.) Implementaciones: wrapper applications : PyWrapper (v3) primera implementaci�n del TAPIR provider TapirLink (0.3.1) La primera red en implementar TAPIR: Plant Genetic Resources Community � CGIAR (Grupo Consultivo para la Investigaci�n Agr�cola Internacional ) � Generation Challenge Programme Autores: Markus D�ring, Renato De Giovanni

39. TAPIR (TDWG Access Protocol for Information Retrieval ) Caracter�sticas: Trabaja con GUID�s TAPIR Request/Response requests pueden ser hechas en: documentos XML Key-Value Pairs (KVP) responses siempre codificadas en XML Operaciones posibles: ping metadata capabilities (servicios) inventory search No trabaja con un esquema en concreto Especificaciones y autores: http://www.tdwg.org/dav/subgroups/tapir/1.0/docs/TAPIRSpecification_2007-02-24.html Esquema: http://rs.tdwg.org/tapir/1.0/schema/tapir.xsd

40. TAPIR transporte Transporte: http get/post Puntos de acceso: urls pueden ser descubiertos por UDDI Request (encoding): KVP (get/post method) (Obligatorio para todas las implementaciones) XML (opcional) HTTP POST body HTTP POST/GET 'request' parameter Responses: En XML HTTP Content-Type= "text/xml� Compuesto por header section + resultado (estructurado seg�n el output model) + secci�n de diagn�stico (opcional)

41. TAPIR Conceptual Binding Conceptual Schemas (capa de abstraci�n de datos) Formatos: XML Schema, RDF Schema, etc DarwinCore, ABCD,� Concepts (definidos externamente) Concept Name Servers Output Models Para operaciones de b�squeda Definen qu� tipo de contenido + estructura Documentos que definen respuestas posibles de nuestro provider En XML, basadas en XML Schema Los nodos del esquema han de estar mapeados con conceptos de uno � m�s conceptual schemas Dos tipos de configuraci�n (capabilities) Knownoutputmodels (los creados � reconocidos por nosotros) Anyoutputmodels necesarios <mappedConcepts> CNS Query Templates A la definici�n de contenido +estructura a�ade filtros parametrizables predefinidos para search e inventory CNS

42. TAPIR Search request: Ejemplo de request en una operaci�n tipo serarch con XML �el outputModel en este caso est� definido in-line

43. TAPIR Search response:

44. TapirLink TapirLink es un software de implementaci�n del protocolo TAPIR desarrollado en PHP Una instalaci�n de TapirLink ?> n fuentes de datos Cada fuente de datos ?1 punto de acceso (interacciones) Cada fuente de datos puede ser mapeada con uno � m�s esquemas conceptuales basados en el patr�n de la nueva versi�n (1.4) de DwC Home: http://wiki.tdwg.org/twiki/bin/view/TAPIR/TapirLink Download: http://sourceforge.net/project/showfiles.php?group_id=38190&package_id=217873 Developers: RenatoDeGiovanni, DaveVieglais, CraigWieczorek, KevinRichards

45. TapirLink Caracter�sticas: Soporta todas las operaciones del protocolo: metadata, capabilities, inventory, search y ping request encodings: KVP and XML Inventory: conceptos mapeados Search: output models conceptos mapeados Response structures: basicSchemaLanguage Logs request Filtros "Equals" and "like" pueden ser sensitivos a may/min Interface web para configuraci�n. Incluye: Importaci�n de configuraci�n de DiGIR Registro autom�tico enel UDDI Cliente (test) LSID authority resolver Limitaciones: Sirve instancias de la misma clase, no de diferentes (n espec�menes a su vez con m�ltiples identificaciones, im�genes) Caso pr�ctico IV. Instalaci�n TapirLink, manejo y migraci�n desde DiGIR (IV.TapirLink.pdf)

Contenidos

Contenidos

Presentation Transcript

Contenidos

Contenidos

CONTENIDOS

Contenidos

CONTENIDOS

CONTENIDOS

Contenidos:

Contenidos

Contenidos

Contenidos

Contenidos

Contenidos

Contenidos

Contenidos

CONTENIDOS

Contenidos

CONTENIDOS

Contenidos

Contenidos

CONTENIDOS

CONTENIDOS

CONTENIDOS