130 likes | 263 Views
La situation actuelle : Coexistence de « tunnels méthodologiques». Hétérogénéité des procédures 1. Hétérogénéité des procédures (2). Procédures de Type 1 Entièrement formalisables Procédures de Type 2 Nécessitant une intervention humaine Appuyées sur des ressources complexes.
E N D
La situation actuelle : Coexistence de « tunnels méthodologiques» Lyon Janvier 2007
Hétérogénéité des procédures 1 Lyon Janvier 2007
Hétérogénéité des procédures (2) • Procédures de Type 1 Entièrement formalisables • Procédures de Type 2 Nécessitant une intervention humaine Appuyées sur des ressources complexes Lyon Janvier 2007
Meta objets textométriquesLa segmentation Lyon Janvier 2007
Distance entre textes 1 Calcul d’une distance • Segmentation • Identification • Formalisation de la distance • Formule de calculJaccard, chi-deux, etc. • Visualisations d2(j, j’) = S(…) i Lyon Janvier 2007
Distance entre textes 2 <T=a1> aa abab bba ba ba abababr fdf av hh o o o hjhh oo oo bba ba ba abababr fdf av hh bba ba ba abababr fdf av hh o aa abab <T=a2> aa abab bba ba ba abababr fdf av hh o o o hjhh oo oo bba ba ba abababr fdf av hh bba ba ba abababr fdf av hh o o <T=a3> bab bba ba ba abababr fdf av fdf av hh bba ba ba fdf a1 a2 a3 …. an a1 a2 a3 an 0 .78 .35 .35 0 .35 .42 0 .56 .0 89 78 35 28 15 0 1 99 58 45 28 19 1 0 82 58 35 24 20 0 0 76 63 38 28 20 0 0 de la les et des yy zz a1 a2 a3 … an Lyon Janvier 2007
Echange d’objets textométriques Lyon Janvier 2007
Texte & structures • Segmentation • Trame textométrique il est un air Lyon Janvier 2007
Texte, structure & forme intégrée • Etiquettes Représentationintégrée Partitions il est un air Annot. div. Lyon Janvier 2007
Les sélections 1types généralisés (Tgen) • sous-ensemble d ’occurrences du corpus • Exemples de Tgen(s) • les occurrences d ’un segment répétés • les cooccurrences de deux formes à l ’intérieur de phrases. • un ensemble de formes présentant un lien au plan sémantique • le résultat d ’un surlignage sélectif par un humain • une classe de fréquence Lyon Janvier 2007
Les sélections 2zones (ou topes) • sous-ensemble d ’occurrences du corpus • Exemples de Topes • une partie du corpus • une section particulière (paragraphe, phrase, etc.) • une zone mise en évidence lors d’une analyse. • un ensemble de zones sélectionnées Lyon Janvier 2007
XML : Norme de stockage et d’échange des méta objets • Textes, textes balisés, textes catégorisés • Segmentation • Trame textométrique • Localisation des occurrences d’une unité • Partition du corpus textuel • Tableau lexicaux, tableaux de segments • Résultats d’analyses statistiques sur la répartition dans les corpus d’objets textométriques Lyon Janvier 2007