190 likes | 298 Views
FipsGreek : Un analyseur syntaxique pour le grec moderne. Athina Michou LATL - Département de linguistique http:// www. latl.unige.ch. Problématique & Motivation. Développement d’un analyseur syntaxique automatique ( parser ) du grec moderne en vue de :
E N D
FipsGreek: Un analyseur syntaxique pour le grec moderne Athina Michou LATL - Département de linguistique http://www.latl.unige.ch Programme doctoral CUSO en sciences du langage
Problématique & Motivation • Développement d’un analyseur syntaxique automatique (parser) du grec moderneen vue de : • intégration dans un environnement multilingue • utilisation en TALN • validation de l’hypothèse que les langues partagent de structures et de phénomènes syntaxiques similaires. Programme doctoral CUSO en sciences du langage
Objectifs • Proposition de description et de représentation formelle de la grammaire du GM, laquelle est intégrée au système Fips multilingue. • Constitution d’une ressource linguistique scientifiquement satisfaisante et efficace pour des applications de TALN, notamment: • l’analyse de textes réels • leur traduction automatique Programme doctoral CUSO en sciences du langage
Définition • Analyse syntaxique automatique: fonction calculatrice de l’association d’une structure grammaticale à une séquence de mots qui constituent une phrase, qui a comme résultat la reconnaissance d’une phrase bien formée et sa représentation arborescente par l’ordinateur. Programme doctoral CUSO en sciences du langage
Développement du FipsGreek • Utilisation d’une plateforme déjà développée pour analyseurs syntaxiques (Wehrli 2004), capable de garantir: • cohérence et compatibilité des structures • intégrité du système • adaptabilité du système pour des langues aux propriétés inattendues • Langues traitées : • Anglais, français, allemand, italien, espagnol, grec, roumain et russe. Programme doctoral CUSO en sciences du langage
Schéma multilingue: hiérarchie à 3 niveaux Structure abstraite Traitement de phénomènes syntaxiques particuliers Langues Romanes roumain russe anglais grec allemand français roumain italien Langues spécifiques espagnol Famille de langues Programme doctoral CUSO en sciences du langage
Grammaire formelle • Inspirée des théories générativistes chomskyennes • basée sur un modèle procédural d’analyse syntaxique profonde pour le français et l’anglais • structures obéissant au schéma: {où X = tête de la projection XP, L et R = listes, éventuellement vides, de projections maximales (les sous- constituants gauches et droits de XP)}. [XP L X R ] Programme doctoral CUSO en sciences du langage
Quelques exemples des règles d’attachement (1) DP + NP standardRightAttachment a.IsType(definite)|(indefinite) b.IsType(commonNoun)|(properNoun)a.AgreeWith(b,{gender, number, case}) a.Select(b) ένας άνθρωπος«un homme » οι Ελβετοί« les Helvètes » κάποιες ομάδες « quelques équipes » Programme doctoral CUSO en sciences du langage
Quelques exemples des règles d’attachement (2) Adv + AstandardLeftAttachment a.IsType(intensity) b.HasDegree(positive)|(comparative) λίγο γνωστός« peu connu » πολύ ενδιαφέρων« très intéressant » αρκετά ζεστός « assez chaud » Programme doctoral CUSO en sciences du langage
Quelques exemples des règles d’attachement (3) DP + TP subjectAttachment a.HasCase(nominative) a.AgreeWith(b, {case,number,person}) a.IsArgumentOf(b,subject) τα παιδιά παίζουν «les enfants jouent » κάποιος κοιμάται«quelqu’un dort » οι αθλητές τρέχουν « les athlètes courent » Programme doctoral CUSO en sciences du langage
Implémentation de phénomènes syntaxiques en grec • Différents ordres des mots (SVO,VSO) • Sujet nul (phénomène pro-drop) • Coordination et subordination simples • Cliticisation (proclise, enclise, redoublement clitique) • Phrases-wh Programme doctoral CUSO en sciences du langage
Fips: la procédure d’analyse Analyse lexicale Projection syntaxique Assemblage Déplacement (formation de chaînes) Filtrage(association de rôles thématiques, cas) Interprétation Programme doctoral CUSO en sciences du langage
Quelques exemples (1) • Sujet postverbal • Ήρθε το καλοκαίρι « L’été est arrivé » • Φέτος είναι η σειρά της Αυστρίας « Cette année c’est le tour de l’Autriche » • Cliticisation(proclise) • Τους τα είπαμε • « Nous les leur avons dit » • Σας την έδωσαν « ils vous l’ont donnée » Programme doctoral CUSO en sciences du langage
Quelques exemples (2) • Phrases-wh • Ποιος έφυγε; « Qui est parti? » • Τι προβλέπει ο Πελέ για το Μουντιάλ; «Que prévoit Pelé pour la Coupe du monde?» Programme doctoral CUSO en sciences du langage
Exemple d’une entrée lexicale: προβλέπω« prévoir »
L’aide du tagger (étiquetage) τιPRO-INT-SIN-NOM-ACC 711005511 0 τι OBJ προβλέπει VER-IND-SUB-PRE-3-SIN 711008293 2 προβλέπω οDET-SIN-MAS-NOM 711004809 12 ο SUBJ Πελέ NOM-SIN-MAS-NOM 711008284 14 Πελέ για PRE 711000818 19 για τοDET-SIN-NOM 711004809 23 ο Μουντιάλ NOM-SIN-NOM 711008217 26 Μουντιάλ Programme doctoral CUSO en sciences du langage
Quelques exemples(3) • European Jazz Festival Για έκτη συνεχή χρονιά, ο δήμος Αθηναίων φιλοξενεί το ευρωπαϊκό φεστιβάλ τζαζ, που αποτελεί μια από τις πιο σημαντικές στιγμές της καλλιτεχνικής συνεργασίας των κρατών μελών της ευρωπαϊκής ένωσης.Κάθε χρονιά την ευθύνη της οργάνωσης έχει η προεδρεύουσα χώρα στο συμβούλιο της ευρωπαϊκής ένωσης. Φέτος είναι η σειρά της Αυστρίας. « Pour la sixième année consécutive, la municipalité d’Athènes accueille le festival européen de jazz, qui constitue un des événements les plus importants de la collaboration artistique des états membres de l’union européenne. Chaque année la responsabilité de l’organisation appartient au pays qui préside le Conseil de l’union européenne. Cette année c’est le tour de l’Autriche ». Programme doctoral CUSO en sciences du langage
Développements futurs • Incorporation d’autres structures syntaxiques dans la grammaire • Enrichissement du lexique monolingue et bilingue (grec-français) • Évaluation du système et comparaison avec d’autres analyseurs existants (p.ex. Modern Greek Resource Grammar, Kordoni et al., 2005) Programme doctoral CUSO en sciences du langage
Merci de votre attention! Programme doctoral CUSO en sciences du langage