300 likes | 445 Views
8 e Journées INTEX / NooJ. La flexion des verbes acadiens en NooJ Michael LONG Univ. De Moncton, Canada Univ. du Nouveau-Brunswick, Canada avec un soutien du Gouvernement du Canada Conseil de Recherche en Sciences Humaines. Verbes acadiens :.
E N D
8eJournées INTEX / NooJ La flexion des verbes acadiens en NooJ Michael LONGUniv. De Moncton, CanadaUniv. du Nouveau-Brunswick, Canada avec un soutien du Gouvernement du CanadaConseil de Recherche en Sciences Humaines
Verbes acadiens : • Introduction - Le français acadien contexte et influences • Trois Groupes - VFS + VANG + VVF • VVF - Les défis • VVF - 2 approches pour l’identification- description flexionnelle - grammaires morphologiques • VVF - du nouveau • Conclusion
Introduction…Contexte et influences Le français acadien… • Langue parlé par le peuple acadien • La nature du « territoire » acadien • Selon la région … … contexte de contacte étroit avec l’anglais … peu de contact avec l’anglais Influences… • le français standard • l’anglais
Introduction…Corpus Chiac Kasparian (1,988 ko – 317,662 mots) Maillet(9,522 ko – 188,191 mots) Malenfant (1,550 ko – 20,777 mots) Nord-Est (2,806 ko – 54,671 mots) Parkton (8.335 ko – 192,293 mots) 773,594 mots • Corpus oraux – 2 de plus, dont une région avec peu de contacte avec l’anglais. • Corpus lit. – Riche en vieux formes; étend la couverture par rapport aux régions.
Trois Groupes – VFS + VANG + VVF VFS - DELAF VENG - « pis il dit, you know mémére, you need a boy » Contexte anglais …pas tellement traîtés encore VANG - « ils allont runner out de prêtres » « …que mes enfants turnont out de même » - Contexte de phrase français - VANG conjuguer en français - description de l’an dernier tient
VANG: trois graphes suffisent WorkerWork GiverGive SetterSet
Trois Groupes – VFS + VANG + VVF VVF - « on a arrangé le bas pour que s’a saye chaud » … que ce soit « c’est souvent qu’ils veniont toute la famille » … qu’ils viennent «Le prêtre se gréyait dans ses pus belles hardes » … s’habillait
VVF – Les défis • Terminaison « -ont », « -iont »ils parlont ils parlent Pils parliont ils parlaient Iils parliont qu’ils parlent S • Régularisation de la racineils devenont ils deviennent Pils deveniont ils devenaient Iqu’ils deveniont qu’ils deviennent S • Emplois variés du passé simple à l’oral « … fallit espérer après que le petit seyit au monde. »« ila fallu / fallaitattendre que le petitsoitau monde. »
VVF – Les défis • Transcriptions « fautives »- accents mére vs. mère- consonnes raccomoder vs. raccommoder - voyelles supprimées décidra vs. décidera- pour souligner la prononciation? - forme voulu? - manque de cohérence dans la transcription? • Substitution / inversion de sons.- il counnaît vs. il connaît- consarver vs. conserver - erssouder vs. ressouder
VVF – Deux approches - (Flexion) Avoir = <E>/W +<BW>(ai/P+1+s … +ont/P+3+p) +<B3>(ais/I+1+2+s … +aient/I+3+p) +<BW>aur(ais/C+1+s … +aient/C+3+p) + <BW> arr(aient/C+3+p+acad + iont/C+3+p+acad) +<BW>(aie/S+1+s … +aient/S+3+p)
VVF – Deux approches - (Flexion) Avoir =<E>/W +<BW>(ai/P+1+s … + ont/P+3+p +avont/P+3+p+acad) +<B3>(ais/I+1+2+s … + aient/I+3+p +iont/I+3+p+acad) +<BW>aur(ais/C+1+s … + aient/C+3+p + iont/C+3+p+acad) +<BW>arr(aient/C+3+p+acad + iont/C+3+p+acad) +<BW>(aie/S+1+s … + aient/S+3+p + ayiont/S+3+p+acad) Avantage : Consolidation de la description Contrainte :Description limitée à Avoir(pas un problème puisque nul autre verbe ne se conjugue selon cette description)
VVF – Deux approches - (Flexion) Tenir =<E>/W +<BW>tiendre/W+acad +tchendre/W+acad +<B4>iens/P+1+s … +enons/P+1+p +<BW>tchens/P+1+s+acad …+tchenons/P+1+p+acad + <B4>ienne/S+1+s …+enions/S+1+p +<BW>tchenne/S+1+s+acad +tchenions/S+1+p+acad
VVF – Deux approches - (Flexion) Tenir=<E>/W +<BW>tiendre/W+acad +tchendre/W+acad + <B4> iens/P+1+s … + enons/P+1+p + <BW> tchens/P+1+s+acad …+ tchenons/P+1+p+acad + <B4> ienne/S+1+s …+ enions/S+1+p + <BW> tchenne/S+1+s+acad + tchenions/S+1+p+acad 3 formes infinitifs
VVF – Deux approches - (Flexion) Tenir = <E>/W + <BW> tiendre/W+acad + tchendre/W+acad +<B4>iens/P+1+s … +enons/P+1+p +<BW>tchens/P+1+s+acad …+tchenons/P+1+p+acad + <B4> ienne/S+1+s …+ enions/S+1+p + <BW> tchenne/S+1+s+acad + tchenions/S+1+p+acad formes multiples pour P
VVF – Deux approches - (Flexion) Tenir = <E>/W + <BW> tiendre/W+acad + tchendre/W+acad + <B4> iens/P+1+s … + enons/P+1+p + <BW> tchens/P+1+s+acad …+ tchenons/P+1+p+acad + <B4>ienne/S+1+s …+enions/S+1+p +<BW>tchenne/S+1+s+acad +tchenions/S+1+p+acad formes multiples pour S
VVF – Deux approches - (Flexion) Tenir =<E>/W +<BW>tiendre/W+acad +tchendre/W+acad +<B4>iens/P+1+s … +enons/P+1+p +<BW>tchens/P+1+s+acad …+tchenons/P+1+p+acad + <B4>ienne/S+1+s …+enions/S+1+p +<BW>tchenne/S+1+s+acad +tchenions/S+1+p+acad Problème :Description fautive pour Venirqui se conjugue comme Tenir en français standard.Besoin donc de multiplier les conjugaisons « modèles »
VVF – Deux approches - (.nom) On demande à NooJ de trouver la combinaison (Variable 1)ar(Variable 2)
VVF – Deux approches - (.nom) On lui met une contrainte, disant que s’il trouve « ér » ou « er » entre les même deux variables, et que ce mot est accompagné du code « V »…
VVF – Deux approches - (.nom) Il doit associer le lemme du mot trouvé dans la contrainte,ainsi que les informations flexionnelles, à la combinaison (Variable 1)ar(Variable 2)
VVF – Deux approches - (.nom) Il doit également lui associer une information « source ».
VVF – Deux approches - (.nom) Cette information « source »,(inclus dans le fichier« properties.def ») apparaît alors dans le vocabulaire, etpermet de repérer la source d’une analyse donnée. Ce qui permet de vérifier l’efficacité du grammaire.
VVF – Deux approches Transcriptions « fautives » .nom - accents mére vs. mère* consonnes raccomoder vs. raccommoder* voyelles supprimées décidra vs. décideraSubstitution / inversion de sons. .nom - il counnaît vs. il connaît- consarver vs. conserver - erssouder vs. ressouder Terminaison « -ont », « -iont » .nom / .nod ils parlont ils parlent Régularisation de la racine .nod ils devenont ils deviennent
VVF – Deux approches-résultats Corpus base Acad.dic ont.nom les deux Chiac 4,841 5,261 4,858 5,273 1,108 994 1,092 982 Maillet 25,750 25,980 25,988 26,177 2,189 2,099 2,019 1,960 Malenfant 3,108 3,633 3,145 3,650 516 418 496 401 NE 4,849 4,980 4,878 5,004 250 218 225 197 Parkton 10,380 11,125 10,488 11,125 1,394 1,212 1,310 1,212
VVF – Deux approches-résultats Corpus base les deux + autres delta Chiac 4,841 5,273 5,477 + 636 1,108 982 916 - 192 Maillet 25,750 26,177 26,648 + 898 2,189 1,960 1,717 - 472 Malenfant 3,108 3,650 3,697 + 589 516 401 387 - 129 NE 4,849 5,004 5,041 + 192 250 197 190 - 60 Parkton 10,380 11,125 11,307 + 927 1,394 1,212 1,105 - 289
VVF – Deux approches-résultats Corpus base les deux + autres delta Chiac 4,841 5,273 5,477 + 636 1,108 982 916 - 192 Maillet 25,750 26,177 26,648 + 898 2,189 1,960 1,717 - 472 Malenfant 3,108 3,650 3,697 + 589 516 401 387 - 129 NE 4,849 5,004 5,041 + 192 250 197 190 - 60 Parkton 10,380 11,125 11,307 + 927 1,394 1,212 1,105 - 289 Tenir compte de la réduction en termes inconnu, plus que l’augmentation de termes connus (double analyses)
VVF – du nouveau… Grammaire syntaxique qui comprend des éléments orthographique… qui permet de trouver des mots inconnus, qui terminent par « is / it / i », et qui sont précédés de <PRO>
VVF – Deux approches-Intérrogation Inclusion du standard et des variants en un dictionnaire+ permettra une ressource à base large+ minimisera les analyses fausses- implique redondance de paradigmes flexionnelles - travail de longue haleine Inclusion des variants en .nom+ identification rapide de formes - multiplication de ressources - introduction d’analyses fausses Autres possibilités…- maintien du DELAF et ajout de « filtre » Acad.dic- hiérarchie de « .nom » embriqués
Conclusion… L’étude effectuée jusqu’à présent commence à permettre de repérer les verbes « non standards » en français acadien, avec des résultats encourageants. Le travail révèle que certains éléments pourraient améliorer et/ou rendre plus efficace le processus, dont… • Inclure un élément journalistique dans le corpus- pour étendre la base- pour voir un français acadien dit un peu plus neutre • Souligner l’importance d’ une transcription conséquente • Trancher sur la question du dédoublement (dictionnaires ou morphologie?)
8eJournées INTEX / NooJ La flexion des verbes acadiens en NooJ Michael LONGUniv. De Moncton, CanadaUniv. du Nouveau-Brunswick, Canada avec un soutien du Gouvernement du CanadaConseil de Recherche en Sciences Humaines