230 likes | 474 Views
Le corpus de référence du français contemporain (CRFC). Plan. Point de départ : les corpus existants Présentation du CRFC Études de cas. Point de départ. sérieux retard pris par la France en matière de corpus
E N D
Plan • Point de départ: les corpusexistants • Présentation du CRFC • Études de cas
Point de départ • sérieuxretardpris par la France en matière de corpus • aucunegrammaire des usageseffectifs du françaisdansdifférentsgenres • manque de statistiquesfiablessur le lexique (etc.)
Corpus écritsexistants • Frantext(surtoutlittéraire) • Leipziger corpus français(journaux) • KölnerromanistischeKorpusdatenbank/Varitext (journaux) • Sketchengine: frWaC, FrTenTen (Web) • corpus plus spécifiques: Varilex, Emolex, Manulex, etc. • corpus de tailleparfoisimpressionnante • surreprésentation des genres littéraires et journalistiques
Corpus oraux disponibles • Traitement de corpus oraux en français (TCOF): 70000 mots • L'Enquête Socio-Linguistique à Orléans (ESLO 1 et 2): 6,5 millions de mots • Corpus de LAngue Parlée en Interaction (CLAPI): 100000 mots • Corpus de tailletrèsmodeste: p.ex. ÉcoleMassy I et II, Rhapsodie, etc. • Communication langagièrechez le jeuneenfant (CoLaJe): 3 millions de mots D‘autrescorpusen accèsrestreint: • Corp-Aix-2 (Cresti&Moneglia 2005): 300000 mots • Ciel-F: ? • taille de l‘ensemble des corpus< 10 millions de mots • possibilité de faire des recherchessyntaxiques et phonologiques (cf. le GroupeAixois de Recherche en Syntaxe [GARS]) • impossibilité de faire des recherchesstatistiquessur le lexique-grammaire (segmentsrépétés, collocations, valence, …)
Vued‘ensemble du CRFC • français de France • environ 310 millions de mots • équilibreappréciable entre contrôle et naturel • ~ 60-65 millions de mots de parolespontanée • 14 genres • corpus de suivi
Usages • élaboration de grammaires et de dictionnairesfondéssurcorpus • lexicologie et phraséologie de l‘oral • ouverture au grandpublic en 2018
Corpus oral • tailleimportante de la partie informelle: 30-35 millions de mots • gammeétendue de situationslangagières • 75 pourcent: transcriptionsprovenant de 70 types d’émissions télévisées différentes (3000 h de parole) • 25 pour cent: corpus existants; interviews du Figaro
Désavantages des gros corpus Web • pléthore de données => difficultésd‘identification de certainstypes de collocation • présence de biaisd‘échantillonage
Études de cas I: néologismes vapoteur, bombasse, itinérance, agence de notation, mot-dièse, kéké, chelou, texter, …
Études de cas II: l‘oral (conceptionnel) dans les dictionnaires
Études de cas II: l‘oral (conceptionnel) dans les dictionnaires
Étude de cas III: le subjonctif • (1) J‘aimais bien l‘idée de laisser un produit quelque part et qu‘une personne vienne et le demande gratuitement. (CRFC) • (2) Ça bouge le larynx et la trachée pour ne pas faire de fausse route et que ça descende bien … (CRFC) • (3)Ça permet aussi de faire que la confiture ne soit pas trop liquide. (CRFC) • (4)Je me présente à Pau, j'essaierai de faire qu'il y ait autour de moi toutes les sensibilités républicaines de la ville. (CRFC) • c‘est + ADJ(au lieu de il est); je m‘en fous; sympa; marrant; bien; pas mal; ça me fait chier; ça + me + étonner/inquiéter/faire plaisir/…; je trouve ça ADJ; il y a des chances/peu de chances/…; fais/faites gaffe/attention; pour pas/plus que (= pour que … ne … pas/plus) • (5) Ça fait peur ? Oui, que mon fils puisse … (CRFC) • (6) Tu veux quoi? Que je fasse la majorette ? (CRFC)
Fonctionsspécifiques de quesuivi du subjonctif • (valeur volitive) : Qu’est-ce qu’il reste à améliorer ? Des petites choses, des petits accessoires à mettre, des boucles d’oreilles, qu’elle le fasse naturellement, que je lui dise pas qu’il manque quelque chose • (valeur alternative) : Que vous ayez fait ce test ou non, les médecins recommandent de ne pas prendre d'ibuprofène en cas de mal de gorge. ; Aux Etats-Unis, le showbiz est vraiment la culture, que ce soit sur le plan cinématographique, de la danse, des spectacles … • que = pour que (souvent avec l’impératif)Vous la renvoyez, que l'on < puisse > jouer avec.Remue bien, que les pommes < soient > couvertes de sucre.Soulève-moi ça que je < sente >.File-moi ton poing dans la figure, qu’on en < finisse >. • que = assez/trop … pour que J’ai passé l’âge qu’on me dise …
Études de cas IV: différencesd‘emploi par genre: avecpour+ GN
Études de cas IV: différencesd‘emploi par genre: avecpour+ nom