1 / 29

Einsatz eines Thesaurus

Einsatz eines Thesaurus. Punktdaten (derzeit ca. 150.000 Einzelobjekte) Bohrungen, bodenkundliche Profile, geologische Aufschlüsse … Schichtenverzeichnisse Proben- und Labordaten. Flächendaten (31 Fachebenen mit ca. 270.000 Objekten) Geologische und Bodenkundliche Grundlagenkarten

basil
Download Presentation

Einsatz eines Thesaurus

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Einsatz eines Thesaurus

  2. Punktdaten (derzeit ca. 150.000 Einzelobjekte) • Bohrungen, bodenkundliche Profile, geologische Aufschlüsse … • Schichtenverzeichnisse • Proben- und Labordaten • Flächendaten (31 Fachebenen mit ca. 270.000 Objekten) • Geologische und Bodenkundliche Grundlagenkarten • Hydrogeologische Spezialkarten • Rohstoffkarten • Orientierungsdaten (13 Fachebenen) • Topographische Karten verschiedener Maßstäbe • Verwaltungsgrenzen • Naturräumliche Gliederung Fachdaten des BIS Alle Daten haben Raumbezug !

  3. BIS-Clients Behördennetz Client Java Swing basiert HTML basiert Internet Client (GeoFachdatenAtlas) • Zugang über Behördennetz • Datenrecherche • Datenpflege • Datenexport • Kompletter Datenumfang • Objektzugriff nach Berechtigungsprüfung • Exakte Lageinformation • Zugang über Internet • Keine Zugriffsbeschränkung • Alle Objekte • Wenig Objekt-Details • Ungenaue Lageinformation

  4. System-Architektur (einfach) Schichtenarchitektur Öffentlichkeit Behörden BIS-Client HTML-Client HTTP CORBA Firewall Applikations-Server Web-Server JDBC TCP/IP Datenbank Datenpool Datengenerierung

  5. Metadatenmodell (vereinfacht) Objekt Zukunft ? Fachklasse Tabelle Attributgruppe OODB XML-DB Attribut Feld

  6. Metadaten-Repository in Oracle DB Fachliches Modell Modellierung mit Metadaten

  7. Fachklasse Metadaten-Pflegewerkzeug Attributgruppe Attribut

  8. Abstraktes Metamodell Model Builder(Serverstart) Objektfabrik(Laufzeit) Abstraktes, statisches Metamodell Dynamische Klassen im Speicher Objekte instantiiert generiert Bohrung 7322BG000002 Fachklasse aus Metadaten Allgemeine Stammdaten Attributgruppe R-Wert: 44 50600 H-Wert 35 20400 Beziehung Proben-ID 7322BG0001G Probenart: Gesteinsprobe Probe

  9. Applikationsdaten Schlüssellisten & Schlüssel Fachthesaurus Daten referenzieren Schlüssel Schlüssellisten im BIS 300 Schlüssellisten 60.000 Fachbegriffe

  10. Schlüssellisten • Vorteile der „terminologischen Kontrolle“ • Eindeutigkeit bei der „Beschlagwortung“ • Erleichterung bei Formulierung von Recherchen • Vorgabe von zielführenden Recherchebegriffen • Generierung von Suchkriterien unter Zuhilfenahme von • Hierarchischen Strukturen

  11. Experten mit guten internen Kenntnissen über Datenmodell und internen Aufbau Interessierte „Laien“ ohne Datenmodellkenntniss + ISPU / UOK Zugänge zu den Inhalten des BIS u.U. lange Suchzeiten Im schlechtesten Fall erfolglose Recherche Verweise zu den gesuchten Objekten

  12. Schlüssellisten Thesaurus, z.B. UOK-Thesaurus, UMTHES, GEMET,SNS Felder im BIS Recherche und Beschlagwortung über Schlüssellisten Verbesserte, inhaltliche Erschließung durch Einsatz von Thesauri

  13. Eingesetzte Thesauri GEMET (General Multilingual Environmental Thesaurus) UOK Thesaurus SNS Semantischer Netzwerk Service UMTHES (Thesaurus des UDK)

  14. Datenmodell CONCEPT_PROPERTY CONCEPT concept property_type property_value language concept_id name base_cc TERM term_id concept cc term_type class cc_term_id RELATION RELATION_PROPERTY relation_id term_source term_target relation_type weight relation property_type property_value language

  15. Crosskonkordanzbildung zwischen Thesaurus und BIS

  16. Gewichtung der gefundenen Crosskonkordanzen 2 * nEqualStems weight= ___________________________________ nStemsThesaurus + nStemsDataSource nEqualStems = Anzahl gleicher Wortstämme zwischen Thesaurus und Datenquelle NStemsThesaurus = Anzahl aller Wortstämme im Thesaurusbegriff NStemsDataSource = Anzahl aller Stämme im BIS-Begriff

  17. TheVi XML <?xml version="1.0" encoding="ISO-8859-1"?> <thevi_documentxmlns:xi="http://www.w3.org/2001/XInclude"> <head> … </head> <concept_collection top="TheVi"> … </concept_collection> <concept_collection top=„BIS_SL3451"> … </concept_collection> <concept_collection top=„Gemet"> … </concept_collection> … </thevi_document> Dokumentbeschreibung Begriffssammlung Metamodell Begriffssammlung BIS Schlüsselliste Begriffssammlung Gemet

  18. TheVi XML – Concept Collection <concept_collection top="..."> <languages>… </languages> <representations> <node_representation> … </node_representation> … <edge_representation> … </edge_representation> … </representations> <terms> <term> … </term> … </terms> <relations> <relation> … </relation> … </relations> </concept_collection> Sprachen (Default, Alternativen) Darstellungsvorschriften Terme Relationen

  19. TheVi XML und Transformationen Webbrowser (Javascript enabled, Java Plugin) TheVi Applikation TheVi Applet z.B. Omnigator z.B. Protégé … … export RDF XTM GIRG (Webserver mit CGI-Perl-Skripten) XSLT TheVi XML DB (Oracle 10g)

  20. Thesaurus, z.B. Gemet BIS Arten von Verbindungen • Vom Thesaurus zu BIS Klassendaten • Thesaurus -> Fachklasse • Thesaurus -> Attributgruppe • Thesaurus -> Attribut • Vom Thesaurus zu BIS Instanzdaten • Thesaurus -> Instanz Stammdaten • Thesaurus -> Instanz Schichtdaten • Thesaurus -> Instanz Probendaten

  21. Art des Mappings zwischen Thesaurus und BIS ~ BIS Proxies Thesaurus

  22. Thevi Darstellung der gefundenen Beziehungen Einschränkung auf ein TK-Blatt Eine TheviXML Datei mit drei Concept Collections: 1. GEMET Thesaurus • Concept Collection mit den BIS Stellvertreterobjekten • des TK Blattes 7435 Pfaffenhofen a.d. Ilm 3. Eine ConceptCollection mit den zwischen GEMET und den BIS-Objekten des Blattes 7435 gefundenen Crosskonkordanzen

  23. BIS Objekte auf Blatt 7435 Pfaffenhofen 1517 Bohrungen BG 53 Aufschluss Bodenkunde AB 25 Quellen QU 71 Einzelfundpunkt EF 43 Geologisches Profil GP 196 Aufschluss Geologie AG 1905 BIS Objekte auf Blatt Pfaffenhofen

  24. Thevi Daten im Touchgraph

  25. Thevi Metamodell

  26. Thevi Instanzverweise

  27. Erste Ergebnisse Allein zwischen GEMET Terms und BIS ergeben sich über die gewählte Methode > 16.000.000 Crosskonkordanzen Den größten Anteil an den gefundenen Konkordanzen hatten die BIS Schlüssellisten mit 82 % Das Datenmodell hat sich zur Verwaltung der Thesauri sowie der Crosskonkordanzen bewährt

  28. Ausblick Weitere Thesauri sollen zur Crosskonkordanzbildung herangezogen werden Dazu soll auch versucht werden, die angebotenen Web-Services zu nutzen und nicht mit redundanten Offline-Beständen zu arbeiten

  29. Vielen Dank fürs Zuhören www.bis.bayern.de

More Related