1 / 22

L’utilisation de méthodes quantitatives dans l’étude de la polysémie lexicale

L’utilisation de méthodes quantitatives dans l’étude de la polysémie lexicale. Bernard Victorri et Nabil Abdellaoui Lattice-CNRS, ENS. La « révolution » technologique. Un dispositif expérimental d’observation tout à fait inédit qui permet de « voir » la langue (cf. la lunette de Galilée)

Download Presentation

L’utilisation de méthodes quantitatives dans l’étude de la polysémie lexicale

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. L’utilisation de méthodes quantitatives dans l’étude de la polysémie lexicale Bernard Victorri et Nabil Abdellaoui Lattice-CNRS, ENS

  2. La « révolution » technologique • Un dispositif expérimental d’observation tout à fait inédit qui permet de « voir » la langue (cf. la lunette de Galilée) • Des méthodes « brutales » d’une efficacité redoutable • Un discours très modeste sur des objectifs limités de TAL A quand l’émergence d’une assise théoriqueà la hauteur de ces bouleversements ?

  3. Méthodes quantitatives et géométrie • Les méthodes quantitatives apportent du continu • Ce continu n’est pas une tare dont il faudrait se débarrasser. • Au contraire : cela rejoint des intuitions de linguistes • et des résultats de psycholinguistique. • Il faut un cadre mathématique adapté au continu pour donner • une légitimité aux méthodes quantitatives : notamment, il faut • pouvoir retrouver le qualitatif à l’intérieur de ce nouveau cadre. Le cadre de la géométrie différentielle et des systèmes dynamiques correspond à ce besoin

  4. L’apport des graphes lexicaux(Bruno Gaume) Comment définir une distance sémantique lexicale ?

  5. La méthode des cliques(Ploux et Victorri 1998) • Détermination des cliques du graphe de synonymie • Détermination d’une distance entre cliques • Détermination des axes de l’espace sémantique local associé à une unité lexicale

  6. Un exemple : l’adjectif sec • sans eau: La route était sèche • maigre:Un vieil homme sec et ridé • sec improductif: Rester sec à un examen • insensible: Un homme au cœur sec • abrupt: Donner un coup sec • seul: Avoir un atout sec dans son jeu • … (TLF: plus de 30 subdivisions)

  7. Le dictionnaire de synonymes • 56 synonymes (adjectivaux) de sec

  8. sec austère stérile aride rude brusque maigre décharné Une partie du graphe de synonymie de sec Cliques : -sec, aride, maigre, stérile - sec, aride, maigre, décharné - sec, rude, austère - sec, rude, brusque

  9. Calcul des cliques du graphe • 75 cliques pour sec • aride;desséché;décharné;maigre;sec • aride;désertique;ingrat;sec;stérile • aride;desséché;maigre;sec;stérile • aride;improductif;pauvre;sec;stérile;vide • austère;rude;sec;simple;sévère • autoritaire;brusque;cassant;sec;tranchant • bourru;brusque;brutal;cru;rude;sec • bref;brusque;brutal;sec • bref;concis;sec • dur;froid;indifférent;insensible;sec • fauché;pauvre;sec • indifférent;insensible;sec;égoïste • sec;seul;simple • ...

  10. d2(ck, cl) = Calcul de la distance entre les cliques Métriquedu2 Soit : u1, u2, …, un les synonymes, c1, c2, …, cp les cliques, xk1, xk2,….;,xkn les coordonnées de ck, (xki = 1 si uick et xki = 0 si uic ) avec :

  11. VisuSyn : une représentation géométrique (www.crisco.unicaen.fr ou www.dico.isc.cnrs.fr)

  12. VisuSyn : les cliques

  13. VisuSyn : les synonymes

  14. Zone de pertinence de aride

  15. Calcul du sens à l’aide d’un corpus (Frantext)(Fabienne Venant, Guillaume Jacquet) Calcul du degré d’affinité d’un nom épithèteExemple : le nom terre

  16. Calcul du degré d’affinité dij = avec f(x) = Soit : u1, u2, …, un les synonymes, c1, c2, …, cp les cliques, e1,e2,......,emles noms, nij le nombre d’occurrences du couple (ei, uj) dans le corpus. Degré d’affinité du nom ei avec l’adjectif uj Degré d’affinité aik du nom ei avec la clique ck et xkj=1 ssi ujck où le facteur de pondération pij vaut

  17. Fonction potentielle induite par le nom régissantExemple:coup

  18. Fonction potentielle induite par le nom régissantCas d’un sens précis: herbe

  19. Fonction potentielle induite par le nom régissantCas d’ambiguïté-alternative : homme

  20. Fonction potentielle induite par le nom régissantCas d’indétermination : ton

  21. Evaluation quantitative des résultats (Venant 2002) • Calcul du taux d’adéquation d’un synonyme pour désambiguïser sec dans le contexte d’un nom donné : fj: fonction de pertinence associée à l’adjectif gi : fonction de pertinence associée au nom • Evaluation des performances du système à l’aide d’un test sur les 20 noms les plus fréquents et sur 5 synonymes désambiguïsants → Taux de réussite :79%

More Related