Réconciliation de références

Réconciliation de références LRI (UMR 8623 CNRS) / INRIA-Futurs, équipe IASI/Gemo Université Paris-Sud XI

Différents problèmes de réconciliation • Alignement/Réconciliation de schémas • Réconciliation de données • Apparier des données avec un schéma cible/annoter • Détecter que deux descriptions de données représentent la même entité (ex: hôtel, gene, publication,...) => intégration de données provenant de différentes sources (élimination des redondances, combiner des éléments d’informations) => nettoyage d’une source de données

http://hal.inria.fr/inria-0000006 Hélène Gagliardi “DS’05 c Ollivier Haemmerle Author PersName PersName Nathalie Pernelle “E.DOT" PublishedIn http://hal.inria.fr/#auth2 PersName Fatiha Saïs InProject http://hal.inria.fr/#auth4 Author PersName "A semantic enrichment …" http://hal.inria.fr/#auth5 Author http://hal.inria.fr/#auth6 Author Author Title http://hal.inria.fr/inria-00000930 “LNAI-3735 " "Discovery in Science " H. Gagliardi O. Haemmerle Notes PersName N. Pernelle PersName PublishedIn PersName http://www.lri.fr/~gag http://www.univ-tlse2.fr/ grimm/ ~ohaemmerle F. Saïs "A semantic enrichment …" Author PersName Author http://www.lri.fr/~pernelle Title Author http://www.lri.fr/~sais Author http://www.lri.fr/~sais/publis/DS-SML.pdf Source 2 Reconcile ? (http://www.lri.fr/~sais/publis/DS-SML.pdf, http://hal.inria.fr/inria-00000930) Reconcile ? (http://www.lri.fr/~sais/publis/DS-SML.pdf, http://hal.inria.fr/inria- inria-0000006) Reconcile ? (http://www.lri.fr/~sais/publis/DS-SML.pdf, http://hal.inria.fr/#auth12) Reconcile ? ("Discovery in Science ", “DS’05 ") Compare ({"Hélène G.",“Ollivier H.", “Nathalie P." , "Fatiha S."}, {"H. Gagliardi", “O. Haemmerle", “N. Pernelle" , "F. Saïs"}) Source 1

Approche LN2R - Combinaison de 2 méthodes • L2R : méthode logiquepartielle. • Génération automatique de règles d’inférence qui traduisent la sémantique logique des connaissances déclarées en RDFS+ (+ disjonction, PF) Exemple : traduction de PF(R): R6.1(R): Reconcile(X, Y)  R(X, Z)  R(Y, W)  Reconcile (Z, W) R6.1(Located): Reconcile(X, Y) Located (X, Z)Located (Y, W) Reconcile (Z, W) R6.2(A): Reconcile(X, Y)  A(X, Z)  A(Y, W) SynVals(Z, W) R6.2(MuseumName):Reconcile(X,Y)  MuseumName (X, Z)  MuseumName (Y,W) SynVals(Z, W) • Utilisation de la résolution unitaire pour inférer des décisions de réconciliation et de non réconciliation correctes.

Approche LN2R - Combinaison de 2 méthodes • N2R : méthode numériqueitérative qui complète les résultats de L2R. • Fondée sur un calcul de similarité informé et modélisé dans un système d’équations. • Décision de réconciliation, fondée sur les scores de similarité. • Approche LN2R automatique et déclarative, fondée sur la sémantique du schéma et des données. • Testées sur 2 corpus dont le benchmark CORA.

N2R: illustration b11 x2 x1 x1 = max(max(max(b11, x3), x4),  * x2) x2 = max(b21, x1) x3 = max(b31, * x1) x4 = max(b41 ,  * x1) “Le Louvre”, “Louvre” c1, c’1 m1, m’1 b21 “Paris”, “La ville de Paris” b41 x4 x3 “La Joconde”, “Joconde” “La Joconde”, “l’Européenne” p1, p’2 p1, p’1 b31 Solution : x1 = 0.8 x2 = 0.8 x3 = 0.4 x4 = 0.7 • = 1/(| CAttr | + | CRel |)  = 0.02 • b11 = 0.8, b21 = 0.3, b31 = 0.1, b41 = 0.7

Réconciliation de références