1 / 16

Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques

Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques. É ric Laporte Université Paris-Est Marne-la-Vallée. Sommaire. Règles de priorité entre analyses Dépendances entre analyses Règles-exceptions Dépendances entre règles Chevauchements

africa
Download Presentation

Outils pour le traitement des textes Levée d'ambiguïtés morpho-syntaxiques

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Outils pour le traitement des textesLevée d'ambiguïtésmorpho-syntaxiques Éric Laporte Université Paris-Est Marne-la-Vallée

  2. Sommaire Règles de priorité entre analyses Dépendances entre analyses Règles-exceptions Dépendances entre règles Chevauchements Indépendance double : le système Elag

  3. Rappel : indépendance double Comment assurer que la construction de la grammaire peut être monotone ?Indépendance des analyses et des règlesLAL ((ai)1  i  m, (rj)1  j  n) = 1  j  n1  i  mLAL (ai, rj)a LAL ((ai)1  i  m, (rj)1  j  n) j [1, n] a LAL (a, rj)

  4. Indépendance double Réalisation par le système Elag :- chaque règle = un automate qui représente l'ensemble des séquences conformes à la règle- grammaire = intersection des règles- LAL(T, G) = T GInterface utilisateur :- format utilisateur lisible- format compilé prêt pour intersection

  5. Format utilisateur de grammaires Elag (1/6) Pour chaque règleFormat utilisateurLisible pour la construction et la maintenance manuellesFormat compiléUn automate qui représente l'ensemble des séquences conformes à la règle, prêt pour intersection

  6. Format utilisateur de grammaires Elag (2/6) l'un comme maître, l'autre comme domestiqueun,.A:msLa République est uneSupprimer l'analyse <un.A> après <le.DET>

  7. Format utilisateur de grammaires Elag (3/6) Supprimer toutes les analyses qui comportent une partie s1 suivie d'une partie s2 s2 s1

  8. Format utilisateur de grammaires Elag (4/6) Dans les règles de ce type,- les parties s1 et s2 peuvent être aussi complexes que nécessaire- peu importe où on place la séparation entre s1 et s2- les marqueurs <!> ne servent à rien s2 s1

  9. Format utilisateur de grammaires Elag (5/6) le Reform club de Londresde,.DET+Dind:mp:fpDe grands arbres entourent le parcCette analyse seulement devant <A:p> s2 s1 a1 a2

  10. Format utilisateur de grammaires Elag (6/6) Supprimer les analyses dans lesquelles un s1 n'est pas suivi d'un a2Les marqueurs <!> et <=> servent à identifier et délimiter s1 et a2 s1 s2 a1 a2

  11. Format général (1/2) Les marqueurs <!> et <=> servent à identifier et délimiter s1, s2, a1 et a2Si une analyse contient un s1 immédiatement suivi d'un s2, le point de séparation entre s1 et s2 doit aussi être précédé d'un a1 et suivi d'un a2, sinon elle est supprimée s1 s2 a1 a2

  12. Format général (2/2) Les marqueurs <!> et <=> servent à identifier et délimiter s1, s2, a1 et a2, etc.Si une analyse contient un s1 immédiatement suivi d'un s2, le point de séparation entre s1 et s2 doit aussi être précédé d'un a1 et suivi d'un a2 (ou précédé d'un b1 et suivi d'un b2, etc.), sinon elle est supprimée s1 s2 a1 a2

  13. Exemple avec 3 parties non vides l'un des membres les plus singuliersplus,plaire.V:J1s:J2sJe lui plus dès le premier regardSupprimer l'analyse <plaire.V> après <le.PRO>, sauf... s1 s2 a2 a1

  14. Quelques précautions (1/3) le Reform club de Londresde,.DET+Dind:mp:fpDe grands arbres entourent le parcCette analyse seulement devant <A:p> s1 s2

  15. Quelques précautions (2/3) Attention au positionnement de la séparation entre s1 et s2 : si plusieurs variantes, la règle peut s'appliquer plusieurs fois au même endroit s1 s2

  16. Quelques précautions (3/3) Ajouter des variantes de s1 et s2 augmente le nombre d'applications de la règle (donc la précision)Ajouter des variantes de a1 et a2 augmente le nombre d'analyses acceptées (la règle devient moins stricte)

More Related