220 likes | 317 Views
L’utilisation de méthodes quantitatives dans l’étude de la polysémie lexicale. Bernard Victorri et Nabil Abdellaoui Lattice-CNRS, ENS. La « révolution » technologique. Un dispositif expérimental d’observation tout à fait inédit qui permet de « voir » la langue (cf. la lunette de Galilée)
E N D
L’utilisation de méthodes quantitatives dans l’étude de la polysémie lexicale Bernard Victorri et Nabil Abdellaoui Lattice-CNRS, ENS
La « révolution » technologique • Un dispositif expérimental d’observation tout à fait inédit qui permet de « voir » la langue (cf. la lunette de Galilée) • Des méthodes « brutales » d’une efficacité redoutable • Un discours très modeste sur des objectifs limités de TAL A quand l’émergence d’une assise théoriqueà la hauteur de ces bouleversements ?
Méthodes quantitatives et géométrie • Les méthodes quantitatives apportent du continu • Ce continu n’est pas une tare dont il faudrait se débarrasser. • Au contraire : cela rejoint des intuitions de linguistes • et des résultats de psycholinguistique. • Il faut un cadre mathématique adapté au continu pour donner • une légitimité aux méthodes quantitatives : notamment, il faut • pouvoir retrouver le qualitatif à l’intérieur de ce nouveau cadre. Le cadre de la géométrie différentielle et des systèmes dynamiques correspond à ce besoin
L’apport des graphes lexicaux(Bruno Gaume) Comment définir une distance sémantique lexicale ?
La méthode des cliques(Ploux et Victorri 1998) • Détermination des cliques du graphe de synonymie • Détermination d’une distance entre cliques • Détermination des axes de l’espace sémantique local associé à une unité lexicale
Un exemple : l’adjectif sec • sans eau: La route était sèche • maigre:Un vieil homme sec et ridé • sec improductif: Rester sec à un examen • insensible: Un homme au cœur sec • abrupt: Donner un coup sec • seul: Avoir un atout sec dans son jeu • … (TLF: plus de 30 subdivisions)
Le dictionnaire de synonymes • 56 synonymes (adjectivaux) de sec
sec austère stérile aride rude brusque maigre décharné Une partie du graphe de synonymie de sec Cliques : -sec, aride, maigre, stérile - sec, aride, maigre, décharné - sec, rude, austère - sec, rude, brusque
Calcul des cliques du graphe • 75 cliques pour sec • aride;desséché;décharné;maigre;sec • aride;désertique;ingrat;sec;stérile • aride;desséché;maigre;sec;stérile • aride;improductif;pauvre;sec;stérile;vide • austère;rude;sec;simple;sévère • autoritaire;brusque;cassant;sec;tranchant • bourru;brusque;brutal;cru;rude;sec • bref;brusque;brutal;sec • bref;concis;sec • dur;froid;indifférent;insensible;sec • fauché;pauvre;sec • indifférent;insensible;sec;égoïste • sec;seul;simple • ...
d2(ck, cl) = Calcul de la distance entre les cliques Métriquedu2 Soit : u1, u2, …, un les synonymes, c1, c2, …, cp les cliques, xk1, xk2,….;,xkn les coordonnées de ck, (xki = 1 si uick et xki = 0 si uic ) avec :
VisuSyn : une représentation géométrique (www.crisco.unicaen.fr ou www.dico.isc.cnrs.fr)
Calcul du sens à l’aide d’un corpus (Frantext)(Fabienne Venant, Guillaume Jacquet) Calcul du degré d’affinité d’un nom épithèteExemple : le nom terre
Calcul du degré d’affinité dij = avec f(x) = Soit : u1, u2, …, un les synonymes, c1, c2, …, cp les cliques, e1,e2,......,emles noms, nij le nombre d’occurrences du couple (ei, uj) dans le corpus. Degré d’affinité du nom ei avec l’adjectif uj Degré d’affinité aik du nom ei avec la clique ck et xkj=1 ssi ujck où le facteur de pondération pij vaut
Fonction potentielle induite par le nom régissantExemple:coup
Fonction potentielle induite par le nom régissantCas d’un sens précis: herbe
Fonction potentielle induite par le nom régissantCas d’ambiguïté-alternative : homme
Fonction potentielle induite par le nom régissantCas d’indétermination : ton
Evaluation quantitative des résultats (Venant 2002) • Calcul du taux d’adéquation d’un synonyme pour désambiguïser sec dans le contexte d’un nom donné : fj: fonction de pertinence associée à l’adjectif gi : fonction de pertinence associée au nom • Evaluation des performances du système à l’aide d’un test sur les 20 noms les plus fréquents et sur 5 synonymes désambiguïsants → Taux de réussite :79%