140 likes | 285 Views
Synonymies et vecteurs conceptuels. TALN 2001 Mathieu Lafourcade, Violaine Prince LIRMM - France. Objectifs. Evaluation aa Synonymie relative aa Synonymie subjective aa. Vecteurs conceptuels Espace vectoriel. Une idée = combination de concepts = un vecteur Espace des idées
E N D
Synonymies et vecteurs conceptuels TALN 2001 Mathieu Lafourcade, Violaine Prince LIRMM - France
Objectifs • Evaluation aa • Synonymie relative aa • Synonymie subjective aa
Vecteurs conceptuelsEspace vectoriel • Une idée = combination de concepts = un vecteur • Espace des idées = espace vectoriel • Un concept = une idée = un vecteur V = V = V + voisinage • Sense space = espace vectoriel + {v}*
Vecteurs conceptuelsThésaurus • H : Thesaurus hierarchy — K concepts • Thesaurus Larousse = 873 concepts • V(Ci) : <a1, …, ai, … , a873> • aj = 1/ (2 ** Dum(H, i)) 1/16 1/16 1/4 1 1/4 1/4 1/64 1/64 4 2 6
Vecteurs conceptuelsConceptc4:paix paix Les épisodes du conflit Le rapport hiérarchique La société Le monde, L’homme
Vecteurs conceptuelsTerme “paix” c4:paix
Distance angulaire • DA(x, y) = angle (x, y) • 0 DA(x, y) • si 0 alors x et y colinéaires — même idée • si /2 rien en commun • si alors DA(x, -x) avec -x as anti-idée de x x’ x y
Distance angulaire DA(x, y) = acos(sim(x,y) DA(x, y) = acos(x.y/|x||y|)) DA(x, x) = 0 DA(x, y) = DA(y, x) DA(x, y) + DA(y, z) DA(x, z) DA(0, 0) = 0 and DA(x, 0) = /2 par définition DA(x, y) = DA(x, y) avec 0 DA(x, y) = - DA(x, y) avec < 0 DA(x+x, x+y) = DA(x, x+y) DA(x, y)
Distance conceptuelle • Exemples • DA(mésange, mésange) = 0 • DA(mésange, passereau) = 0.4 • DA(mésange, oiseau) = 0.7 • DA(mésange, train) = 1.14 • DA(mésange, insecte) = 0.62 mésange = oiseau passériforme insectivore … …
Synonymie relative • SynR(A, B, C) — C = référence SynR(A, B, C) = DA(A+AC, B+BC) A+AC SynR(A, B, C) A B+BC C B
Relative synonymy • SynR(A, B, C) = SynR(B, A, C) • SynR(A, A, C) = DA(A C, A C) = 0 • SynR(A, B, 0) = DA(0, 0) = 0 • SynR(A, 0, C) = /2 • SynA(A, B) = SynR(A, B, 1) = D (A 1, B 1) = D (A, B) • DA(charbon,nuit) = 0.9 • SynR(charbon, nuit, couleur) = 0.4 • SynR(charbon, nuit, noir) = 0.35
Synonymie subjective • SynS(A, B, C) — C = point de vue SynS(A, B, C) = D(A-AC, B-BC) A A-AC C B SynS(A, B, C) B-BC
Synonymie subjective Quand DA(A, C) /2 et DA(B, C) /2 alors SynS(A, B, C) DA(A,B) SynS(A, B, 0) = DA(A, B) SynS(A, A, C) = 0 SynS(A, B, B) = DA(A-AB, 0) = /2 • SynS(mésange, hirondelle, animal) = 0.3 • SynS(mésange, hirondelle, oiseau) = 0.4 • SynS(mésange, hirondelle, passereau) = 1
Conclusion • Approche • statistique