280 likes | 412 Views
des Langages. Traitements Algorithmiques. Objectifs. Maîtriser la communication Concevoir un artefact Qui accepte des productions langagières Qui les interprète Applications Traductions Recherches d’informations. Thèmes de recherche. Outils et méthodes
E N D
desLangages TraitementsAlgorithmiques
Objectifs • Maîtriser la communication • Concevoir un artefact • Qui accepte des productions langagières • Qui les interprète • Applications Traductions Recherches d’informations
Thèmes de recherche • Outils et méthodes • Pour le traitement algorithmique des langages • Langage = naturel et/ou artificiel • Systèmes transformationnels Toujours un résultat • Langages Spécialisés SYGMART
Modèle • Un mode de représentation R Textes, Formes logiques, Arbres, Graphes, Vecteurs, … • Les instances potentielles : Univers de R Structure S(M) = Un objet acceptable dans M • Des opérations internes associées : Transformations S1(M) S2(M) Modèle =
Compréhension • Appréhension • transformation avec chgt de modèle • f : S1(M1) S2(M2) S1(LN) S2(Logique) Pierre aime Marie aimer(Pierre, Marie) • Compréhension • Appréhension + Évaluation de la structure obtenue / structure cible • Par exemple, une « bonne » compréhension Min. distance(arbre obtenu / arbre désiré) Min. rappel / (silence + bruit)
Moyens • Modèle • Textes (flots de caractères) - T • Forêts à multi-étiquette partagées - F • Vecteurs conceptuels - V • Transformation • Projections S1(T) S2 (F) • S1(F) S2 (F) • Traitement • algorithme de Markov sur F
Moyens • Algorithmes • Définition de linguiciels • Variables + Dictionnaires + Grammaires • Etiquettes • Instanciation du jeu de variables • Structures • Forêts à étiquettes partagés • Simulation de graphes, de treillis, etc.
Moyens • SYGMART • Rapide • Traitement sur de gros volumes Texte de 256 Ko (50000 mots - 100 pages) --> 20Min sur un pentium III 500 Mhz (128 Mo) --> structure de > 84000 points --> sortie (texte) > 1 Mo
Domaines Ressources lexicales Dictionnaires Vecteurs Contrôle Grammaire Réseau Applications LN LP
Projets Vecteur conceptuel lexique sémantique Fe* (Malais -Thai - Vietnamien) Intégration d’ontologies (Castro) Traduction interprétation - Cstar FranSYG (Français) Analyseur LaSYG Traduction et optimisation LP - IBM
Projets Vecteur conceptuel lexique sémantique Fe* (Malais -Thai - Vietnamien) Intégration d’ontologies (Castro) Traduction interprétation - Cstar FranSYG (Français) Analyseur LaSYG Traduction et optimisation LP - IBM
Vecteurs conceptuels • Un jeu de concepts • Th. Larousse (873 idées de bases) • Une idée = un 873 uplet d’entiers
Propagation • Sur des arbres d’analyse P GN GVA Les termites GV rapidement GNP attaquent les fermes GN du toit
Propagation • Sur des arbres d’analyse P GN GVA Les termites GV rapidement • Commencer • Agresser • Critiquer GNP attaquent les fermes GN du toit • Expl. Agricoles • Elément de charpente • Loyer • Toiture • Structure anat. • Haut, dessus
Propagation • Sur des arbres d’analyse P GN GVA Les termites GV rapidement • V5 • V1 GNP attaquent • V2= V2.1+V2.2+V2.3 les fermes GN • V3= V3.1+V3.2+V3.23 du toit • V4= V4.1+V4.2+V4.23
Propagation • Sur des arbres d’analyse P GN GVA Les termites GV rapidement • V1 • V5 GNP attaquent • V2 les fermes GN • V3 du toit • V4
Propagation • Sur des arbres d’analyse P GN GVA Les termites GV rapidement • V1 • V5 GNP attaquent • V2 les fermes GN • V3 du toit • V4
Propagation • Sur des arbres d’analyse P GN GVA Les termites GV rapidement • V1 • V5 GNP attaquent • V2 les fermes GN • V3 du toit • V4
Propagation • Sur des arbres d’analyse P GN GVA Les termites GV rapidement • V1 • V5 GNP attaquent • V2 les fermes GN • V3 du toit • V4
Propagation • Sur des arbres d’analyse P GN GVA Les termites GV rapidement • V1 • V5 GNP attaquent • V2 les fermes GN • V3 du toit • V4
Propagation • Sur des arbres d’analyse P GN GVA Les termites GV rapidement • V1’ • V5’ GNP attaquent • V2’ les fermes GN • V3’ du toit • V4’
Propagation • Tri sur les sens = selon dist(Vi.j, V’i). P GN GVA Les termites GV rapidement • Commencer • Agresser • Critiquer GNP attaquent les fermes GN du toit • Expl. Agricoles • Elément de charpente • Loyer • Toiture • Structure anat. • Haut, dessus
Vecteurs conceptuels • Distance • Angle entre deux vecteurs • Si 0 alors colinéaires - même idée • Si pi/2 alors ortho. - rien à voir.
Fonctions vectorielles • S: NP(ART,N) • --> V(NP) = V(N) • S: NP1(NP2,N) • --> V(NP1) = aV(NP1)+V(N) 0<a<1 • V(bateau à voile) = V(bateau) + 1/2V(voile) • V(voile de bateau) = 1/2V(bateau) + V(voile)
Fonctions vectorielles • Pas seulement linéaire • S: GA(GADV(ADV),ADJ) • --> V(GA) = V(ADJ)^p(ADV) • p(très) = 2 • V(très content) = V(content)^2 • p(peu) = 1/2 • V(peu content) = V(content)^1/2
Rétropropagation • V(Ni j) = V(Ni j) V(Ni) • produit terme à terme GNP les fermes GN • V3’ du toit • V4’
Application • Indexation de documents • Multilingue • Représente le domaine chevaux <--> équitation • Granularité Document, paragraphe, etc. • Index = (Vi, doc i)* rechercher = minimiser dist angle (V(requette) , V(doc i) )