250 likes | 454 Views
Synonymies et vecteurs conceptuels. TALN 2001 Mathieu Lafourcade, Violaine Prince LIRMM - France. Plan de la présentation. Objectifs : pourquoi la synonymie ? Les vecteurs conceptuels : rappel Représentation des « synonymies » Intérêt des fonctions lexicales. Objectifs. Evaluation
E N D
Synonymies et vecteurs conceptuels TALN 2001 Mathieu Lafourcade, Violaine Prince LIRMM - France
Plan de la présentation • Objectifs : pourquoi la synonymie ? • Les vecteurs conceptuels : rappel • Représentation des « synonymies » • Intérêt des fonctions lexicales
Objectifs • Evaluation • De la proximité sémantique aux contextes possibles de « l ’interchangeabilité » lexicale • Synonymie relative • éviction de la non transitivité de la synonymie • équicandidature au « punctum proximum » • Synonymie subjective • équicandidature au « punctum remotum »
Vecteurs conceptuelsEspace vectoriel • Une idée combinaison de concepts ; un vecteur • Espace des idées = espace vectoriel • Un concept = une idée = un vecteur V par augmentation : V + voisinage • Espace des significations = espace vectoriel + {v}*
Vecteurs conceptuelsThésaurus • H : Hiérarchie du thésaurus — K concepts • Thesaurus Larousse = 873 concepts • V(Ci) : <a1, …, ai, … , a873> • aj = 1/ (2 ** Dum(H, i, j)) 1/16 1/16 1/4 1 1/4 1/4 1/64 1/64 4 2 6
Vecteurs conceptuelsConceptc4:paix paix Les épisodes du conflit Le rapport hiérarchique La société Le monde, L’homme
Vecteurs conceptuelsTerme “paix” c4:paix
Distance angulaire • DA(x, y) = angle (x, y) • 0 DA(x, y) • si 0 alors x et y colinéaires — même idée • si /2 rien en commun • si alors DA(x, -x) avec -x “anti-idée” de x x’ x y
Distance angulaire DA(x, y) = acos(sim(x,y)) DA(x, y) = acos(x.y/|x||y|)) DA(x, x) = 0 DA(x, y) = DA(y, x) DA(x, y) + DA(y, z) DA(x, z) DA(0, 0) = 0 and DA(x, 0) = /2 par définition DA(x, y) = DA(x, y) avec 0 DA(x, y) = - DA(x, y) avec < 0 DA(x+x, x+y) = DA(x, x+y) DA(x, y)
Distance thématique • Exemples • DA(mésange, mésange) = 0 • DA(mésange, passereau) = 0.4 • DA(mésange, oiseau) = 0.7 • DA(mésange, train) = 1.14 • DA(mésange, insecte) = 0.62 mésange = oiseau passériforme insectivore … …
Synonymie relative • Polysémie des termes • un personnel trié sur le volet (CHOISIR) • une liste triée par ordre alphabétique (ORDONNER) • le courrier est trié (REPARTIR) • Un vecteur sert de « pivot » ou de référence • Quelle est la mesure de l ’interchangeabilité entre A et B dans le contexte de C ?
Synonymie relative • SynR(A, B, C) — C = référence SynR(A, B, C) = DA(A+AC, B+BC) A+AC SynR(A, B, C) A B+BC C B
Synonymie relative • SynR(A, B, C) = SynR(B, A, C) • SynR(A, A, C) = DA(A C, A C) = 0 • SynR(A, B, 0) = DA(0, 0) = 0 • SynR(A, 0, C) = /2 • SynA(A, B) = SynR(A, B, 1) = D (A 1, B 1) = D (A, B) • DA(charbon,nuit) = 0.9 • SynR(charbon, nuit, couleur) = 0.4 • SynR(charbon, nuit, noir) = 0.35
Synonymie relative • La synonymie relative est une mesure qui tend à favoriser le “rapprochement” de deux vecteurs : • “noir” meilleur punctum proximum pour “charbon” et “nuit” • “transitivité” de la synonymie • SynR(charbon, corbeau, noir) = 0.18 • SynR(corbeau,nuit, noir) = 0.5 • SynR(charbon, nuit, noir) = 0.35
Synonymie subjective • Problème de la portée de la discrimination sémantique • DA(mésange, oiseau) = 0.7 • DA(hirondelle, oiseau) = 0.48 • A partir de quel point de vue (ou contexte) des vecteurs corrélés deviennent interchangeables ? • plus proche punctum remotum
Synonymie subjective • SynS(A, B, C) — C = point de vue SynS(A, B, C) = D(A-AC, B-BC) A A-AC C B SynS(A, B, C) B-BC
Synonymie subjective Quand DA(A, C) /2 et DA(B, C) /2 alors SynS(A, B, C) DA(A,B) SynS(A, B, 0) = DA(A, B) SynS(A, A, C) = 0 SynS(A, B, B) = DA(A-AB, 0) = /2 • SynS(mésange, hirondelle, @les_animaux) = 0.4 • SynS(mésange, hirondelle, @les_oiseaux) = 0.5 • SynS(mésange, hirondelle, passereau) = 1.2
Limite de la synonymie subjective • non conservation de la chaîne hiérachique des concepts • dans la chaine des concepts : • @ le_monde > @ la_vie> @les_animaux > @les_oiseaux • SynS(mésange, hirondelle, @la_vie) = 0.6 • mais SynS(mésange, hirondelle, le_monde) = 0.83 • sont moins bons que • SynS(mésange, hirondelle, @les_animaux) = 0.4
Limites de la synonymie subjective • Polysémie : terme versus concept • SynS(mésange, hirondelle, @les_oiseaux) = 0.5 • SynS(mésange, hirondelle, oiseau) = 1.6 • Vecteurs peu corrélés comme point de vue • SynS(mésange, hirondelle, @or) = 0.7 • DA(mésange, @or) = 1.19 • DA(hirondelle, @or) = 1.15
Conclusion • Les synonymies comme enrichissement de l’analyse thématique • Le modèle des vecteurs conceptuels montre bien les interférences dues • à la polysémie : synonymie relative • à la relation complexe terme-concept (oiseau vs @les_oiseaux) • Le système est en apprentissage continu...les résultats sont évolutifs.