1 / 23

Le corpus de référence du français contemporain (CRFC)

Le corpus de référence du français contemporain (CRFC). Plan. Point de départ : les corpus existants Présentation du CRFC Études de cas. Point de départ. sérieux retard pris par la France en matière de corpus

Download Presentation

Le corpus de référence du français contemporain (CRFC)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Le corpus de référence du français contemporain (CRFC)

  2. Plan • Point de départ: les corpusexistants • Présentation du CRFC • Études de cas

  3. Point de départ • sérieuxretardpris par la France en matière de corpus • aucunegrammaire des usageseffectifs du françaisdansdifférentsgenres • manque de statistiquesfiablessur le lexique (etc.)

  4. Corpus écritsexistants • Frantext(surtoutlittéraire) • Leipziger corpus français(journaux) • KölnerromanistischeKorpusdatenbank/Varitext (journaux) • Sketchengine: frWaC, FrTenTen (Web) • corpus plus spécifiques: Varilex, Emolex, Manulex, etc. • corpus de tailleparfoisimpressionnante • surreprésentation des genres littéraires et journalistiques

  5. Corpus oraux disponibles • Traitement de corpus oraux en français (TCOF): 70000 mots • L'Enquête Socio-Linguistique à Orléans (ESLO 1 et 2): 6,5 millions de mots • Corpus de LAngue Parlée en Interaction (CLAPI): 100000 mots • Corpus de tailletrèsmodeste: p.ex. ÉcoleMassy I et II, Rhapsodie, etc. • Communication langagièrechez le jeuneenfant (CoLaJe): 3 millions de mots D‘autrescorpusen accèsrestreint: • Corp-Aix-2 (Cresti&Moneglia 2005): 300000 mots • Ciel-F: ? • taille de l‘ensemble des corpus< 10 millions de mots • possibilité de faire des recherchessyntaxiques et phonologiques (cf. le GroupeAixois de Recherche en Syntaxe [GARS]) • impossibilité de faire des recherchesstatistiquessur le lexique-grammaire (segmentsrépétés, collocations, valence, …)

  6. Vued‘ensemble du CRFC • français de France • environ 310 millions de mots • équilibreappréciable entre contrôle et naturel • ~ 60-65 millions de mots de parolespontanée • 14 genres • corpus de suivi

  7. Usages • élaboration de grammaires et de dictionnairesfondéssurcorpus • lexicologie et phraséologie de l‘oral • ouverture au grandpublic en 2018

  8. Corpus oral • tailleimportante de la partie informelle: 30-35 millions de mots • gammeétendue de situationslangagières • 75 pourcent: transcriptionsprovenant de 70 types d’émissions télévisées différentes (3000 h de parole) • 25 pour cent: corpus existants; interviews du Figaro

  9. Comparaison ESLO 2 – CRFC (occurrences par million de mots)

  10. Désavantages des gros corpus Web • pléthore de données => difficultésd‘identification de certainstypes de collocation • présence de biaisd‘échantillonage

  11. Biaisd‘échantillonagedans Fr-Ten-Ten

  12. Études de cas I: néologismes vapoteur, bombasse, itinérance, agence de notation, mot-dièse, kéké, chelou, texter, …

  13. Études de cas II: l‘oral (conceptionnel) dans les dictionnaires

  14. Études de cas II: l‘oral (conceptionnel) dans les dictionnaires

  15. Études de cas III: le subjonctif

  16. Étude de cas III: le subjonctif • (1) J‘aimais bien l‘idée de laisser un produit quelque part et qu‘une personne vienne et le demande gratuitement. (CRFC) • (2) Ça bouge le larynx et la trachée pour ne pas faire de fausse route et que ça descende bien … (CRFC) • (3)Ça permet aussi de faire que la confiture ne soit pas trop liquide. (CRFC) • (4)Je me présente à Pau, j'essaierai de faire qu'il y ait autour de moi toutes les sensibilités républicaines de la ville. (CRFC) • c‘est + ADJ(au lieu de il est); je m‘en fous; sympa; marrant; bien; pas mal; ça me fait chier; ça + me + étonner/inquiéter/faire plaisir/…; je trouve ça ADJ; il y a des chances/peu de chances/…; fais/faites gaffe/attention; pour pas/plus que (= pour que … ne … pas/plus) • (5) Ça fait peur ? Oui, que mon fils puisse … (CRFC) • (6) Tu veux quoi? Que je fasse la majorette ? (CRFC)

  17. Fonctionsspécifiques de quesuivi du subjonctif • (valeur volitive) : Qu’est-ce qu’il reste à améliorer ? Des petites choses, des petits accessoires à mettre, des boucles d’oreilles, qu’elle le fasse naturellement, que je lui dise pas qu’il manque quelque chose • (valeur alternative) : Que vous ayez fait ce test ou non, les médecins recommandent de ne pas prendre d'ibuprofène en cas de mal de gorge. ; Aux Etats-Unis, le showbiz est vraiment la culture, que ce soit sur le plan cinématographique, de la danse, des spectacles … • que = pour que (souvent avec l’impératif)Vous la renvoyez, que l'on < puisse > jouer avec.Remue bien, que les pommes < soient > couvertes de sucre.Soulève-moi ça que je < sente >.File-moi ton poing dans la figure, qu’on en < finisse >. • que = assez/trop … pour que J’ai passé l’âge qu’on me dise …

  18. Études de cas IV: différencesd‘emploi par genre: avecpour+ GN

  19. Études de cas IV: différencesd‘emploi par genre: avecpour+ nom

  20. Le corpus de référence du français contemporain (CRFC)

More Related