1 / 56

Sudoc, Calames, theses.fr et le Web de données

Sudoc, Calames, theses.fr et le Web de données. Atelier JABES2011. Vers le Web de données. Il faut participer au Web de données [Acquis]. Objectifs de l’atelier. Faire un bilan d’étape Montrer les données Justifier certains choix Expliquer comment ça marche

coye
Download Presentation

Sudoc, Calames, theses.fr et le Web de données

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Sudoc, Calames, theses.fret le Web de données Atelier JABES2011

  2. Vers le Web de données

  3. Il faut participer au Web de données [Acquis]

  4. Objectifs de l’atelier • Faire un bilan d’étape • Montrer les données • Justifier certains choix • Expliquer comment ça marche • Manipuler quelques outils simples • Esquisser la suite du travail à mener • Nous • Vous

  5. Partons du connu

  6. S’agit-il de données RDF ou d’une simple notice Dublin Core ?

  7. RDF nu

  8. about • En RDF, il faut expliciter de quoi on parle en l’identifiant par une URL : http://www.sudoc.fr/013041932/id • http://www.sudoc.fr/013041932/id est l’identifiant du document décrit • http://www.sudoc.fr/013041932/id est décrit à cette page-là http://www.sudoc.fr/013041932

  9. triplets • En RDF, tout est décomposé en triplets • Chaque triplet est indépendant • Chaque triplet pourrait être stocké séparément • Pas de notice finie • Une autre source peut la compléter, si elle parle de la même chose : http://www.sudoc.fr/013041932/id • Interopérabilité. Extensibilité.

  10. Identifier la langue avec le référentiel Lexvo

  11. Mettre en relation un document et une langue • La langue n’est pas un code (‘fre’) • La langue est une entité à part entière • Avec son propre identifiant http://lexvo.org/id/iso639-3/fra • et ses propres propriétés • La propriété dcterms:language met en relation deux entités

  12. http://www.lexvo.org/id/iso639-3/fra décrite en HTML

  13. http://www.lexvo.org/id/iso639-3/fra décrite en RDF

  14. De fil en aiguille • La description de la langue poursuit la description du document Sudoc • Où s’arrêter ? • C’est sans fin • C’est le Web de données

  15. Identifier les personnes avec IdRef

  16. IdRef, fournisseur d’identifiants et de référentiels • www.idref.fr = application Web ouverte • Ouverte sur le Web de données • Ouverte à d’autres applications IST (France) • Par son Web Service de recherche • Par ses fonctions d’intégration (Javascript) • Différents moyens/services pour récupérer et exploiter les identifiants et les données des autorités Sudoc ABES.

  17. Sudoc et IdRef Sudoc IDREF Autorités Sudoc

  18. Les autorités Sudoc,pivot du Linked data ABES theses.fr Sudoc Thèses soutenues et Thèses en cours (2011) Autorités Sudoc Calames

  19. RDFa de Calames • Pas de page RDF/XML • Le RDF est caché dans le HTML de http://www.calames.abes.fr/pub/ms/Calames-2010914119419211 Pour révéler le RDF caché , utiliser un outil comme

  20. http://www.calames.abes.fr/pub/ms/Calames-2010914119419211 RDFa de Calames

  21. RDFa de theses.fr • Pas encore de page RDF/XML • Le RDF est caché dans le HTML de http://www.theses.fr/2009TOUR3802 Pour révéler le RDF caché , utiliser un outil comme

  22. Les thèsesportant sur les correspondants de Goethe PREFIX foaf: <http://xmlns.com/foaf/0.1/> PREFIX dc: <http://purl.org/dc/elements/1.1/> PREFIX ead: <info:ms#> PREFIX tef: <http://www.abes.fr/abes/documents/tef/> SELECT ?these { ?ms dc:creator <http://www.abes.fr/su/res/026895528>. ?ms ead:destinataire ?destinataire. ?these a tef:Thesis. ?these dc:subject ?destinataire } La requête exploite les données Calames et STAR

  23. Lier les données à IdRef, au-delà de l’ABES

  24. Linked data IST.fr ? ? theses.fr Sudoc Thèses soutenues et Thèses en cours ( 2011) Autorités Sudoc Plateforme pédagogiq. ? HAL ? revues. org ? Presses univ. de Y ? Calames Persée ?

  25. IdRef comme nœud régional • Positionnement d’IdRef : IST français • En complémentarité avec d’autres fournisseurs d’identifiants et de référentiels : • Local : identifiants propres à une application, à un annuaire • Régional : BnF, auteurs HAL, CERL, DAI (NL) • Global : VIAF, DBpedia

  26. DBpedia Autorités BnF VIAF theses.fr Sudoc Autorités Sudoc Plateforme pédagogiq. ? HAL ? revues. org ? Presses univ. de Y ? Calames Persée ?

  27. Lier les données de l’IST entre elles, au-delà d’IdRef

  28. Linked data IST.fr ? Les labos ! ? theses.fr Sudoc Autorités Sudoc Plateforme pédagogique X HAL revues. org Presses univ. de Y Calames Référentiel des laboratoires Persée

  29. Linked data IST.fr ? Les affiliations PRISMES (AMUE) locaux theses.fr Sudoc Autorités Sudoc Plateforme pédagogique X HAL revues. org Presses univ.s de Y Calames Référentiel des laboratoires Persée

  30. On parle de la même chose • owl:sameAs

  31. Identifier et nommer les personnes avec IdRef

  32. Identifier les concepts avec IdRef et RAMEAU

  33. IdRef et Rameau • Identifiants IdRef pour Rameau • A lier aux identifiants canoniques, ceux du centre national Rameau (BnF) quand ils seront officiellement publiés. • MeSH • Dewey

  34. Préciser le rôle des agents avec les MARC Relators

  35. L’embarras du choix ? • dcterms:creator • dcterms:contributor • marcrel:aut • rda:authorWork • tef:auteur ?

  36. Qui utilise explicitementmarcrel:aut utilise implicitementdc:contributor

  37. Raisonnement Le Sudoc dit : http://www.sudoc.fr/012367206/id marcrel:aut http://www.idref.fr/ 026975262 /id La Bibliothèque du Congrès dit (ici) : Marcrel:autrdfs:subPropertyOfdc:contributor Un outil de raisonnement pourra en déduire que : http://www.sudoc.fr/012367206/id dc:contributor http://www.idref.fr/ 026975262 /id

  38. Qui utilise marcrel:aut peut également tef:auteur, malgré la redondance apparente

  39. tef:auteur • Ne semble rien dire de plus que marcrel:aut • Mais possède une propriété intéressante : C’est une propriété fonctionnelle = Une thèse ne peut avoir qu’un auteur = si une thèse a deux auteurs, c’est deux fois le même !

  40. Raisonnement Quelqu’un dit : http://www.sudoc.fr/012367206/id tef:auteur http://www.idref.fr/035200898/id Quelqu’un d’autre dit : http://www.sudoc.fr/012367206/id tef:auteur http://www.viaf.org/123456789 Une ontologie TEF dit : http://www.abes.fr/tef/auteur rdf:typeowl:ObjectPropertyowl:FunctionalProperty (une thèse ne peut avoir qu’1 auteur, au sens de tef:auteur) (mais elle peut avoir 2 dc:creator) Un outil de raisonnement pourra en déduire que : http://www.idref.fr/035200898/id owl:sameAs http://www.viaf.org/123456789

  41. Fichier (fusion des triplets RDF) : http://193.52.69.127/xml/rdf/sperber_turtle.txt Outils de raisonnement : http://www.ivan-herman.net/Misc/2008/owlrl/ http://inspector.sindice.com Démo

  42. Raisonnement • RDF, c’est de la logique • Travaux en cours avec le LIRMM pour ADONIS sur les données Persée • Oblige à qualité des données et rigueur de la modélisation • Sinon : on génère n’importe quoi ! • Usages : • Enrichir les données • Expliciter les données • Mettre au jour des incohérences

  43. Page RDF complète

More Related