1 / 15

Les recherches dans Frantext

Les recherches dans Frantext.

fleta
Download Presentation

Les recherches dans Frantext

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Les recherches dans Frantext ATTENTION : Seule la version catégorisée de Frantext permet de désambiguïser les cas d’homographie (en précisant la catégorie grammaticale du mot recherché). Avant de lancer une recherche sur un mot (ou une séquence) dans la base non catégorisée, il faut s’assurer ce mot (ou cette séquence) ne possède pas une forme homographe appartenant à une autre catégorie grammaticale (ex : pouvoir n.m. vs pouvoir v.inf). Pour les deux bases de Frantext, le formulaire de recherche se présente de la même manière. On accède au formulaire depuis le menu déroulant :

  2. Recherches dans la base non catégorisée Malgré le problème de l’homographie, la base non catégorisée de Frantext peut être utilisée pour rechercher des graphies données (mots ou séquences de mots). Toute recherche intervient après avoir défini un corpus de travail. 1. Rechercher une graphie donnée Pour rechercher une forme donnée d’un mot, il suffit de « taper » cette forme dans le formulaire de recherche. Exemple : Recherche du mot maison dans La Peau de chagrin

  3. On obtient alors le nombre de résultats, que l’on peut ensuite visualiser : La visualisation des résultats permet de vérifier si la formule utilisée répond bien à la requête. Si ce n’est pas le cas, on peut retourner au formulaire pour corriger la formule, en utilisant l’icone du navigateur.

  4. Ce mode de rédaction permet également de rechercher une séquence donnée. Exemple : Recherche de la séquence maison blanche La recherche d’une graphie donnée constitue la manière la plus simple de faire une requête sur Frantext.

  5. 2. Intégrer des expressions de choix Admettons à présent que l’on veuille chercher les séquences suivantes : petite maison, grande maison, jolie maison et vieille maison, qui mettent chacune en jeu un adjectif qualificatif différent. On doit construire une formule qui intègrera un choix entre les différents adjectifs. L’expression de ce choix se note : (choix1|choix2|choix3|….) Pour cet exemple, la formule sera donc : (petite|grande|jolie|vieille) maison On peut, sur ce principe, combiner plusieurs expressions de choix. Question : à quelles séquences correspond la formule suivante ? homme (riche(et généreux|et célèbre)|pauvre) Réponse : homme riche et généreux, homme riche et célèbre, homme pauvre.

  6. 3. Intégrer une séquence « quelconque » La notation &q(n1,n2)désigne une suite quelconque de mots dont le nombre est compris entre n1 et n2. Ce paramètre est très utile lorsque l’on recherche par exemple les occurrences de un homme riche et que l’on ne veut pas pour autant exclure les séquences du type un homme très riche ou un homme assez riche. La formule pour cet exemple serait donc : un homme &q(0,1) riche Si l’on voulait également inclure les exemples du type un homme bon et riche, on noterait la formule suivante : un homme &q(0,2) riche Le signe &q peut également être employé seul (sans indication numérale) mais dans ce cas il équivaut à &q(1,1). Exemple : la formuleun homme &q richecorrespond uniquement aux cas ou un mot quelconque s’intercale entre homme et riche (cette formule exclue donc la séquence un homme riche).

  7. 4. Intégrer une séquence facultative Le symbole &?placé devant une expression signifie que cette expression est facultative. Exemples : a- une &?toute petite voix permettra de rechercher les occurrences de une petite voix et de une toute petite voix. b- une &?(toute petite) voix une voix et une toute petite voix. c- une &?(&?toute petite) voix  une voix, une petite voix, une toute petite voix. d- une &?(petite|grosse) voix  unevoix, unepetitevoix, unegrossevoix.

  8. 5. Le symbole de négation Le symbole ^exprime la négation (ou plus exactement, l’exclusion). On le place devant l’expression que l’on veut rejeter. Exemple : un homme ^très riche Cette formule permet de rechercher toutes les occurrences de un homme XXX riche dans lesquelles XXX n’est pas égal à très. On trouvera donc des occurrences telles que un homme excessivement riche. On peut combiner le symbole de négation à une expression de choix : un homme très ^(gros|vieux|intelligent) Cette formule permet de rechercher toutes les occurrences de un homme très XXX dans lesquelles XXX n’est ni égal à gros, ni à riche, ni à intelligent.

  9. 6. Formes fléchies Dans tous les exemples précédents, la recherche portait sur une séquence donnée. Les formes fléchies des mots n’étaient donc pas prises en compte. Or, il est possible, dans la base non catégorisée de Frantext, de rédiger des formules intégrant les formes fléchies des verbes, noms et adjectifs. Codes utilisés pour désigner les formes fléchies : Verbes : &cXXX(exemple : &caimer) Noms et adjectifs : &mXXX(exemples : &mmaison, &msale) ATTENTION : ces formules permettent de rechercher toutes les occurrences des formes qui s’écrivent comme une des formes du verbe, du nom ou de l’adjectif spécifié, sans aucune garantie qu’elles appartiennent à la même catégorie grammaticale. Si on lance une recherche &caimer dans la base non catégorisée, on obtiendra également le nom aimant (forme homographe du participe présent du verbe).

  10. Exercice d’application Rédigez une formule permettant de rechercher toutes les occurrences de l’expression faire peur  tout en intégrant les occurrences de faire très peur, faire drôlement peur, etc. (FAIRE + adverbe + peur) Formule : &cfaire &q(0,1) peur Il est vivement conseillé d’utiliser les symboles de formes fléchies pour des recherches portant sur des séquences lexicalisées plutôt que sur des mots isolés afin de limiter les problèmes d’homographie, et d’effectuer les recherches portant sur les formes fléchies d’un mot à partir de la base catégorisée.

  11. Recherches dans la base catégorisée La base catégorisée de Frantext permet de construire des formules dans lesquelles on spécifie la catégorie grammaticale d’un ou plusieurs mots. Pour reprendre l’exemple d’aimer, la base catégorisée va donner la possibilité de spécifier que l’on recherche uniquement les formes fléchies du verbe et permettre ainsi d’exclure les occurrences du nom aimant. On va également pouvoir rechercher des constructions nues (sans contenu lexical). Exemple : Nom + adverbe + adjectif  homme très riche, femmeassez sympathique… L’utilisation des fonctions de la base catégorisée nécessite une connaissance du code attribué à chaque catégorie grammaticale.

  12. 1. Principes généraux La plupart des règles d’écriture utilisées dans la base non catégorisée sont réutilisables dans la base catégorisée. Il faut seulement combiner les éléments de la requête en respectant certains principes. Les entités catégorisées (entités dont on va préciser la catégorie grammaticale) sont introduites par &e et suivies du code grammatical correspondant entre parenthèses. Exemples de notations : 1- Pour une recherche de substantifs : &e(g=S) 2- Pour une recherche de verbes : &e(g=V) 3-Pour une recherche de substantifs ou de noms propres : &e(g=S Np) Le signe ! accolé à g signifie que l’on ne veut pas que l’entité catégorisée appartienne à la catégorie grammaticale spécifiée. Exemple : &e(g!=V) désigne une entité catégorisée qui n’est pas un verbe.

  13. 2. Préciser la catégorie grammaticale d’un mot Reprenons à présent l’exemple du verbe aimer et supposons que nous ayons à construire la formule précisant que seules les occurrences verbales nous intéressent. Il va falloir mentionner le mot dont on va préciser la catégorie grammaticale. La mention d’un mot se note c=MOT Formule pour l’exemple du verbe aimer : &e(c=&caimer g=V) A l’inverse, si seules les occurrences du nom aimant nous intéressent : &e(c=&maimant g=S) On peut, sur le même principe, rechercher une forme particulière d’un mot (et non les formes fléchies) : &e(c=pouvoir g=S)

  14. Exercices 1. Déchiffrer des formules Proposez un exemple d’occurrence que l’on obtiendrait avec chacune des formules suivantes : a- &e(g=S) &e(g=Adv) &e(g=Apr) Nom + Adverbe + Adjectif participe présent  histoire très amusante b- comment &e(c=&cpouvoir g=V) - (tu|vous)&e(g=Inf) cela Comment + verbe pouvoir + - + tu ou vous + 1 verbe à l’infinitif + cela  Comment pouvez-vous dire cela c- &e(g=S Np) &e(g=V) &?(&e(g=D)) &e(g=S Np) à &e(g=Inf) 1 Nom ou 1 Nom propre + 1 verbe (+ 1 déterminant) + 1 Nom ou 1 Nom propre + à + 1 verbe à l’infinitif  Pierre incite Marie à partir  patron pousse les employés à démissionner

  15. 2. Rédiger des formules Proposez une formule permettant de rechercher les occurrences de : a- Venir de faire quelque chose (formes fléchies de venir + de + vb infinitif) &e(c=&cvenir g=V) de &e(g=Inf) b- Prendre part à quelque chose (formes fléchies de prendre + part + à + nom) ATTENTION : pour cette expression, on peut rencontrer : prendre part à / au / aux &e(c=&cprendre g=V) part (à|au|aux) &?(&e(g=D)) &e(g=S)

More Related