160 likes | 394 Views
Cordial, le TAL et les aides à la rédaction . Synapse Développement. Dominique Laurent, Sophie Nègre. Plan. Présentation du logiciel Cordial Historique Principales fonctions Les éléments d’aide à la rédaction Quelques technologies issues du TAL dans Cordial Niveau syntaxique
E N D
Cordial, le TALet les aides à la rédaction Synapse Développement Dominique Laurent, Sophie Nègre
Plan • Présentation du logiciel Cordial • Historique • Principales fonctions • Les éléments d’aide à la rédaction • Quelques technologies issues du TAL dans Cordial • Niveau syntaxique • Niveau sémantique • Niveau stylistique • Un vrai « plus » pour les rédacteurs • L’aide à la correction orthographique et grammaticale • L’aide à la compréhension / visualisation • L’aide stylistique • L’aide à la traduction multilingue • Conclusion et Perspectives Présentation ATALA Aide à la rédaction – Apports du Traitement Automatique des Langues
Présentation de Cordial • Historique • Cordial : Le descendant lointain d'un traitement de texte conçu pour le journal Libération en 1986. • Public visé : Les rédacteurs de ce journal • Objectif : Créer des outils d'aide à la rédaction (correction, statistiques ...) • Méthode : Utiliser des technologies issues du TAL • Aujourd’hui : Version 12 La palette de ces outils s'est énormément développée → Peu d'utilisateurs utilisent la totalité des outils proposés • L'essentiel est que ces outils soient disponibles. Présentation ATALA Aide à la rédaction – Apports du Traitement Automatique des Langues
Principales fonctions • La correction orthographique, typographique et grammaticale • Correction orthographique multilingue • Correction typographique pour faciliter la lecture en unifiant la présentation des documents et respecter les normes éditoriales. • Correction grammaticale : désambiguïsations (syntaxique et sémantique), découpe en propositions, délimitation des groupes, etc. Présentation ATALA Aide à la rédaction – Apports du Traitement Automatique des Langues
Les éléments d’aide à la rédaction • Les Dictionnaires : • Dictionnaire de synonymes et d'antonymes • Dictionnaire d'analogies • Dictionnaire des difficultés de la langue française • Dictionnaire d'homonymes et de paronymes • Dictionnaire d'anglicismes • Dictionnaire de faux amis (français-anglais, anglais-français) • Dictionnaires de langue (Littré, TLF, Synapse) • Dictionnaires de traductions (français/anglais/allemand/espagnol/italien) • Dictionnaire de codes postaux et communes Présentation ATALA Aide à la rédaction – Apports du Traitement Automatique des Langues
Les indispensables : • Analyse logique de la phrase • Morphologie du mot • Conjugueur • Thématique du texte • Comparaison avec 2600 ouvrages classiques ou actuels • Les outils spécialisés pour le linguiste : • Occurrences orthographiques et grammaticales (mots/lemmes) • Rapport de correction sur un fichier / dossier • Mots-clés et mots délaissés • Phrases-clés, concepts-clés et délaissés • Concordancier, Segments répétés • Nombreux outils d’analyse statistique Présentation ATALA Aide à la rédaction – Apports du Traitement Automatique des Langues
Quelques technologies issues du TAL dans Cordial • Niveau syntaxique • L’analyse syntaxique • Analyse volontairement floue • Reconnaître la nature des mots et des propositions et celle de leurs liens • Fonction « analyse en arbre » insistant davantage sur les articulations et la découpe en propositions • Fonction « analyse en liste » plus tournée vers les informations • La résolution d’anaphores • Permet de repérer des erreurs grammaticales difficilement décelables car liées à la cohérence de la phrase. Présentation ATALA Aide à la rédaction – Apports du Traitement Automatique des Langues
Niveau sémantique • La désambiguïsation sémantique • Prise en compte des homonymes (accentués ou non) • Gestion des mots polysémiques (plus de 10 000 mots polysémiques, tentative de désambiguïsation de plus de 26 000 sens) Présentation ATALA Aide à la rédaction – Apports du Traitement Automatique des Langues
Les dictionnaires et le conjugueur • Dictionnaire des noms communs : plus de 200 000 lemmes, 300 000 sens et 50 000 expressions • Dictionnaire des noms propres • Dictionnaire Littré • Dictionnaire du Trésor de la Langue Française • Dictionnaires de traductions du français vers anglais, allemand, espagnol, italien, portugais • Le Conjugueur : 13 000 verbes. Présentation ATALA Aide à la rédaction – Apports du Traitement Automatique des Langues
Les synonymes et antonymes • Plus de 280 000 entrées pour 3 millions et demi de synonymes. • 4 dictionnaires : mots simples, noms propres, expressions verbales, expressions nominales et adverbiales • Proximité entre l’entrée et chacun des synonymes Présentation ATALA Aide à la rédaction – Apports du Traitement Automatique des Langues
L’analyse thématique • Comptabilité des concepts utilisés selon les grands domaines racines de l’ontologie • Représentation « en éclaté » des informations thématiques et des concepts clés Présentation ATALA Aide à la rédaction – Apports du Traitement Automatique des Langues
Niveau stylistique • L’analyse stylistique • Comparaison stylistique avec 2600 ouvrages • Pas de jugement sur le style Résumé visant l’aspect formeldu texte • Comptabilité étendue des unités du texte (caractères, paragraphes, phrases, mots) • Etude de la longueur de période et de la ponctuation Présentation ATALA Aide à la rédaction – Apports du Traitement Automatique des Langues
Un vrai « plus » pour les rédacteurs • L’aide à la correction orthographique et grammaticale • Les rédacteurs ne peuvent pas se permettre de laisser des erreurs orthographiques et grammaticales • Les fautes d'orthographe deviennent un handicap pour faire carrière « Commettre des fautes d'orthographe, de syntaxe ou de grammaire n'est plus une erreur innocente dans les entreprises. D'une remarque acerbe ou d'un sourire narquois intercepté lors d'une réunion, la faute peut être pointée par un chef tyrannique ou des rivaux ambitieux, jusqu'à provoquer un malaise, voire un état de blocage, chez le fautif. » Extrait de LE MONDE.fr | 03.05.06 Présentation ATALA Aide à la rédaction – Apports du Traitement Automatique des Langues
L’aide à la compréhension / visualisation • Compréhension optimale grâce à des dictionnaires comportant au choix des définitions courtes sans renvois ou détaillées. • Représentation graphique de la thématique d’un texte et de la liste de ses concepts clés afin d’avoir rapidement une vue d’ensemble. • L’aide stylistique • Des corrections typographiques et stylistiques permettant de repérer l’utilisation d’un terme sorti de l’usage ou l’emploi d’expressions contestées • Les statistiques stylistiques et sémantiques riches permettant de repérer les éventuelles incorrections ou imperfections selon le type de texte choisi. Présentation ATALA Aide à la rédaction – Apports du Traitement Automatique des Langues
L’aide à la traduction multilingue • Traduction mot-à-mot multilingue • Permet d’assister le rédacteur sans lui imposer la traduction complète, forcément imparfaite de la phrase. • Conséquences directes : • Gain de temps • Plus grande liberté du rédacteur Présentation ATALA Aide à la rédaction – Apports du Traitement Automatique des Langues
Conclusion et Perspectives • Conclusion • Intégration de nombreuses technologies issues du TAL • Une aide à la rédaction entièrement paramétrable • Un enrichissement constant sur 12 versions du produit • Pertinence pour le rédacteur : gain en qualité et surtout en temps • Perspectives • Intégration dans Open Office • Amélioration de l’ergonomie • Amélioration de l’analyse syntaxique et de la correction • Enrichissement et mise à jour des dictionnaires Présentation ATALA Aide à la rédaction – Apports du Traitement Automatique des Langues