1 / 36

INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER

INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER. Teorie psicologiche del lessico e del significato lessicale. GENUS. DIFFERENTIAE. DEFINIZIONI NEI DIZIONARI. horse noun

parry
Download Presentation

INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale

  2. GENUS DIFFERENTIAE DEFINIZIONI NEI DIZIONARI horsenoun 1 a solid-hoofed plant-eating domesticated mammal with a flowing mane and tail, used for riding, racing, and to carry and pull loads New Oxford Dictionary of English

  3. DEFINIZIONI NEI DIZIONARI contascàtti: Dispositivo installato a richiesta presso l’utente per la documentazione del traffico telefonico (Zingarelli 1995) maneggevole: Che si puo’ maneggiare facilmente || Fig. trattabile, arrendevole || T. mar. del vento, quando permette l’esecuzione di qualsiasi manovra (Palazzi-Folena, 1992)

  4. EVIDENZA IN LESSICOGRAFIA • Su che base vengono • Identificate le accezioni di una parola? • Sviluppate le definizioni? • WordNet: Un tentativo di fondare la ricerca lessicografica su basi psicologica • Questa settimana: • Evidenza psicologica • Evidenza da corpora

  5. RAPPRESENTAZIONE LESSICALE IN PSICOLOGIA E NEI CORPORA • La psicologia e la linguistica dei corpora sono arrivate ad idee simili per quel che riguarda il significato lessicale • Queste idee possono essere utili • Per sviluppare lessici piu’ accessibili • Per sviluppare metodi automatici per la scoperta delle accezioni

  6. EVIDENZA PSICOLOGICA SUL SIGNIFICATO • Semantic priming • Teorie dei concetti in psicologia: • Reti semantiche • Teoria dei prototipi • Disambiguazione lessicale

  7. SEMANTIC PRIMING • Uno degli effetti fondamentali rilevati dalla ricerca psicolinguistica a partire dagli anni ’60 • Per esempio, Schvaneveldt & Meyer 1971 • Udire una parola (o vedere un’immagine) ATTIVA parole / concetti associati

  8. SEMANTIC PRIMING: ESEMPIO (SCHVANEVELDT & MEYER)

  9. ASSOCIAZIONI TRA PAROLE (O CONCETTI) • I risultati di Schvaneveldt ed altri portarono allo sviluppo di teorie del lessico basate sull’associazione • Ed alla compilazione di liste di parole associate sulla base di dati psicologici

  10. RETI SEMANTICHE: RISULTATI DALLA PSICOLOGIA COGNITIVA • Collins & Quillian, 1969: tempi per decidere se un oggetto ha una certa proprieta’ aumentano a seconda della ‘distanza’ • A canary is yellow • A canary has feathers • A canary eats food • Haviland & Clark 1974, Sanford & Garrod 1979: • I looked around the house. • The lounge was very spacious.

  11. LE RETI SEMANTICHE

  12. RETI SEMANTICHE E LESSICO Evidenza per relazioni di iponimia

  13. TEORIE DEI CONCETTI IN PSICOLOGIA: PROTOTIPI • La teoria dominante dei concetti in Psicologia e’ la teoria dei PROTOTIPI proposta da Rosch negli anni ’70

  14. IL PROBLEMA DI PLATONE For many concepts, there simply aren’t any definitions” (LM p.14) A theory that correctly describes the behavior of perhaps three hundred words has been asserted to correctly describe the behavior of the tens of thousands of general names (Putnam)

  15. WITTGENSTEIN: ‘GAME’ • What is common to all games? • Are they all ‘amusing’? • Cfr. chess • Or is there always winning and losing? • Counterex: child throwing his ball at the wall • Look at the parts played by skill and luck • “I can think of no better expression that FAMILY RESEMBLANCE” • ‘games form a family’

  16. PUTNAM • the term ‘lemon’ not definable by simply conjoining its ‘definining characteristics’ yellow color / tart taste / a certain kind of peel • Abnormal members (green lemon) • Three legged tiger (Also: three-legged chair, see below)

  17. CONCLUSIONE • Le definizioni genus+differentia non riflettono la nostra conoscenza lessicale sui concetti

  18. EVIDENZA PER TEORIA DEI PROTOTIPI • Typicality effects • Is a tomato a vegetable or a fruit? • ‘Is this art?’ • Failures of transitivity • If A is a B and B is a C, is A a C?

  19. ‘Fuzzy’ or ‘graded’ categorization • A necessary and sufficient definition should pick up all the category members and none of the non-members • But this is not what happens: • Hampton (1979): no clear division between members and non-members of 8 categories • Kitchen utensils: SINK? SPONGE? • Vegetables: TOMATOES? GOURDS? • Agreement on typicality judgments • (‘think of a fish, any fish’) • Rosch (1975): very high correlation (.97) between subjects’s typicality rankings for 10 categories

  20. Typicality effects • The ease with which people judge CATEGORY MEMBERSHIP depends on typicality • Rips, Shoben and Smith (1973): Fast to affirm that a robin is a bird; not so fast to affirm that a chicken is a bird • Posner & Keele: similarity to visual pattern • Learning: typical items learned before atypical ones (Rosch Simpson & Miller 1976) • Learning is faster if subjects are taught on typical items • Typicality affects speed of inference • Rips 1975: • Garrod & Sanford 1977: faster reading time for “The bird came in through the front door” when ROBIN than when GOOSE

  21. La teoria in breve • Manteniamo rappresentazioni dei concetti sulla base delle loro ‘features’ (TRATTI) • Per ogni classe di oggetti esistono dei rappresentanti piu’ TIPICI • Per decidere se un oggetto e’ una sedia od una poltrona calcoliamo la SOMIGLIANZA tra questo oggetto e la ‘tipica sedia’ e la ‘tipica poltrona’

  22. FEATURE NORMS • Psychologists have been collecting concept features from subjects at least since Rosch and Mervis (1975) • Different methodologies used (from free association to very tightly controlled) • Three such databases currently available • Garrard et al (2001) - GA • Vinson and Vigliocco (2004) - VV • McRae et al (2005) – MCRA - the largest, also classified

  23. SPEAKER-GENERATED FEATURES (VINSON AND VIGLIOCCO)

  24. FEATURE NORMS (GARRARD)

  25. What makes an item typical? Rosch & Mervis 1975 • Items are typical when they have HIGH FAMILY RESEMBLANCE with members of the category: • Typical items have many of the attributes of members • Do not have properties of nonmembers • Irrespective of frequency: ORIOLE vs CHICKEN • Evidence 1: checked that subjects agree on typicality for several natural categories • Asked subjects to list attributes (actually, check) • Weighed each attribute by how many items it occurred with within the category • ‘SCORE’ indicates how many common features • Found that score highly predictive of typicality (.84-.91) Five most typical ‘furniture’ (CHAIR, SOFA, TABLE, DRESSER, DESK) have 13 features in common Five least typical (CLOCK, PICTURE, CLOSET, VASE, TELEPHONE) had 2 attributes in common

  26. Rosch and Mervis 1975 (2) • Evidence 2: non-typical elements have more features in common with other categories • Evidence 3: speed of learning with artificial stimuli belonging to 2 classes • Items with more features in common with family easier to learn • Items with more features in common with contrast category harder to learn

  27. CONCETTI COME ‘CLUSTER’ CHICKEN GOOSE ORIOLE ROBIN OSTRICH

  28. FEATURE NORMS & DIZIONARI • Questi dati sui tratti tipici di concetti raccolti da soggetti potrebbero essere utili per guidare lo sviluppo di definizioni o delle relazioni semantiche in un dizionario tipo WordNet

  29. FEATURE NORMS PER ELDIT • Un progetto congiunto European Academy Bolzano / UniTN (CIMEC) per raccogliere feature norms su parole in Italiano e Tedesco

  30. METODI • Dati raccolti da studenti nelle scuole di Bolzano • ~70 studenti di lingua madre Italiana e 70 di lingua madre tedesca • Raccolto dati su 50 concetti

  31. RISULTATI • ~200 paia concetto / attributo in comune tra tutti e 70 i soggetti tedeschi ed altrettante per gli Italiani • Tipi di proprieta’ piu’ importanti: • Iponimia ( il cane e’ un animale ) • Parte ( il cane ha le zampe) • Qualita’ esterna ( le fragole sono rosse) • Comportamento ( il cane abbaia )

  32. EVIDENZA PSICOLOGICA SULLE ACCEZIONI • Molta ricerca psicologica a partire dagli anni ’70 si e’ occupata del problema della DISAMBIGUAZIONE LESSICALE • Questo tipo di ricerca puo’ aiutare a risolvere il problema della distinzione tra OMONIMIA (gru) e POLISEMIA (bocca)

  33. DISAMBIGUAZIONE LESSICALE: OMONIMI

  34. DISAMBIGUAZIONE LESSICALE: POLISEMIA

  35. CONCLUSIONI • I risultati della ricerca psicologica potrebbero aiutare nello sviluppo di nuovi dizionari • Aiutando ad identificare le accezioni • Assicurando che le definizioni contengano le proprieta’ di un concetto che i parlanti della lingua trovano piu’ significative

  36. LETTURE

More Related