360 likes | 510 Views
INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER. Teorie psicologiche del lessico e del significato lessicale. GENUS. DIFFERENTIAE. DEFINIZIONI NEI DIZIONARI. horse noun
E N D
INFORMATICA UMANISTICA D: LESSICOGRAFIA E COMPUTER Teorie psicologiche del lessico e del significato lessicale
GENUS DIFFERENTIAE DEFINIZIONI NEI DIZIONARI horsenoun 1 a solid-hoofed plant-eating domesticated mammal with a flowing mane and tail, used for riding, racing, and to carry and pull loads New Oxford Dictionary of English
DEFINIZIONI NEI DIZIONARI contascàtti: Dispositivo installato a richiesta presso l’utente per la documentazione del traffico telefonico (Zingarelli 1995) maneggevole: Che si puo’ maneggiare facilmente || Fig. trattabile, arrendevole || T. mar. del vento, quando permette l’esecuzione di qualsiasi manovra (Palazzi-Folena, 1992)
EVIDENZA IN LESSICOGRAFIA • Su che base vengono • Identificate le accezioni di una parola? • Sviluppate le definizioni? • WordNet: Un tentativo di fondare la ricerca lessicografica su basi psicologica • Questa settimana: • Evidenza psicologica • Evidenza da corpora
RAPPRESENTAZIONE LESSICALE IN PSICOLOGIA E NEI CORPORA • La psicologia e la linguistica dei corpora sono arrivate ad idee simili per quel che riguarda il significato lessicale • Queste idee possono essere utili • Per sviluppare lessici piu’ accessibili • Per sviluppare metodi automatici per la scoperta delle accezioni
EVIDENZA PSICOLOGICA SUL SIGNIFICATO • Semantic priming • Teorie dei concetti in psicologia: • Reti semantiche • Teoria dei prototipi • Disambiguazione lessicale
SEMANTIC PRIMING • Uno degli effetti fondamentali rilevati dalla ricerca psicolinguistica a partire dagli anni ’60 • Per esempio, Schvaneveldt & Meyer 1971 • Udire una parola (o vedere un’immagine) ATTIVA parole / concetti associati
ASSOCIAZIONI TRA PAROLE (O CONCETTI) • I risultati di Schvaneveldt ed altri portarono allo sviluppo di teorie del lessico basate sull’associazione • Ed alla compilazione di liste di parole associate sulla base di dati psicologici
RETI SEMANTICHE: RISULTATI DALLA PSICOLOGIA COGNITIVA • Collins & Quillian, 1969: tempi per decidere se un oggetto ha una certa proprieta’ aumentano a seconda della ‘distanza’ • A canary is yellow • A canary has feathers • A canary eats food • Haviland & Clark 1974, Sanford & Garrod 1979: • I looked around the house. • The lounge was very spacious.
RETI SEMANTICHE E LESSICO Evidenza per relazioni di iponimia
TEORIE DEI CONCETTI IN PSICOLOGIA: PROTOTIPI • La teoria dominante dei concetti in Psicologia e’ la teoria dei PROTOTIPI proposta da Rosch negli anni ’70
IL PROBLEMA DI PLATONE For many concepts, there simply aren’t any definitions” (LM p.14) A theory that correctly describes the behavior of perhaps three hundred words has been asserted to correctly describe the behavior of the tens of thousands of general names (Putnam)
WITTGENSTEIN: ‘GAME’ • What is common to all games? • Are they all ‘amusing’? • Cfr. chess • Or is there always winning and losing? • Counterex: child throwing his ball at the wall • Look at the parts played by skill and luck • “I can think of no better expression that FAMILY RESEMBLANCE” • ‘games form a family’
PUTNAM • the term ‘lemon’ not definable by simply conjoining its ‘definining characteristics’ yellow color / tart taste / a certain kind of peel • Abnormal members (green lemon) • Three legged tiger (Also: three-legged chair, see below)
CONCLUSIONE • Le definizioni genus+differentia non riflettono la nostra conoscenza lessicale sui concetti
EVIDENZA PER TEORIA DEI PROTOTIPI • Typicality effects • Is a tomato a vegetable or a fruit? • ‘Is this art?’ • Failures of transitivity • If A is a B and B is a C, is A a C?
‘Fuzzy’ or ‘graded’ categorization • A necessary and sufficient definition should pick up all the category members and none of the non-members • But this is not what happens: • Hampton (1979): no clear division between members and non-members of 8 categories • Kitchen utensils: SINK? SPONGE? • Vegetables: TOMATOES? GOURDS? • Agreement on typicality judgments • (‘think of a fish, any fish’) • Rosch (1975): very high correlation (.97) between subjects’s typicality rankings for 10 categories
Typicality effects • The ease with which people judge CATEGORY MEMBERSHIP depends on typicality • Rips, Shoben and Smith (1973): Fast to affirm that a robin is a bird; not so fast to affirm that a chicken is a bird • Posner & Keele: similarity to visual pattern • Learning: typical items learned before atypical ones (Rosch Simpson & Miller 1976) • Learning is faster if subjects are taught on typical items • Typicality affects speed of inference • Rips 1975: • Garrod & Sanford 1977: faster reading time for “The bird came in through the front door” when ROBIN than when GOOSE
La teoria in breve • Manteniamo rappresentazioni dei concetti sulla base delle loro ‘features’ (TRATTI) • Per ogni classe di oggetti esistono dei rappresentanti piu’ TIPICI • Per decidere se un oggetto e’ una sedia od una poltrona calcoliamo la SOMIGLIANZA tra questo oggetto e la ‘tipica sedia’ e la ‘tipica poltrona’
FEATURE NORMS • Psychologists have been collecting concept features from subjects at least since Rosch and Mervis (1975) • Different methodologies used (from free association to very tightly controlled) • Three such databases currently available • Garrard et al (2001) - GA • Vinson and Vigliocco (2004) - VV • McRae et al (2005) – MCRA - the largest, also classified
What makes an item typical? Rosch & Mervis 1975 • Items are typical when they have HIGH FAMILY RESEMBLANCE with members of the category: • Typical items have many of the attributes of members • Do not have properties of nonmembers • Irrespective of frequency: ORIOLE vs CHICKEN • Evidence 1: checked that subjects agree on typicality for several natural categories • Asked subjects to list attributes (actually, check) • Weighed each attribute by how many items it occurred with within the category • ‘SCORE’ indicates how many common features • Found that score highly predictive of typicality (.84-.91) Five most typical ‘furniture’ (CHAIR, SOFA, TABLE, DRESSER, DESK) have 13 features in common Five least typical (CLOCK, PICTURE, CLOSET, VASE, TELEPHONE) had 2 attributes in common
Rosch and Mervis 1975 (2) • Evidence 2: non-typical elements have more features in common with other categories • Evidence 3: speed of learning with artificial stimuli belonging to 2 classes • Items with more features in common with family easier to learn • Items with more features in common with contrast category harder to learn
CONCETTI COME ‘CLUSTER’ CHICKEN GOOSE ORIOLE ROBIN OSTRICH
FEATURE NORMS & DIZIONARI • Questi dati sui tratti tipici di concetti raccolti da soggetti potrebbero essere utili per guidare lo sviluppo di definizioni o delle relazioni semantiche in un dizionario tipo WordNet
FEATURE NORMS PER ELDIT • Un progetto congiunto European Academy Bolzano / UniTN (CIMEC) per raccogliere feature norms su parole in Italiano e Tedesco
METODI • Dati raccolti da studenti nelle scuole di Bolzano • ~70 studenti di lingua madre Italiana e 70 di lingua madre tedesca • Raccolto dati su 50 concetti
RISULTATI • ~200 paia concetto / attributo in comune tra tutti e 70 i soggetti tedeschi ed altrettante per gli Italiani • Tipi di proprieta’ piu’ importanti: • Iponimia ( il cane e’ un animale ) • Parte ( il cane ha le zampe) • Qualita’ esterna ( le fragole sono rosse) • Comportamento ( il cane abbaia )
EVIDENZA PSICOLOGICA SULLE ACCEZIONI • Molta ricerca psicologica a partire dagli anni ’70 si e’ occupata del problema della DISAMBIGUAZIONE LESSICALE • Questo tipo di ricerca puo’ aiutare a risolvere il problema della distinzione tra OMONIMIA (gru) e POLISEMIA (bocca)
CONCLUSIONI • I risultati della ricerca psicologica potrebbero aiutare nello sviluppo di nuovi dizionari • Aiutando ad identificare le accezioni • Assicurando che le definizioni contengano le proprieta’ di un concetto che i parlanti della lingua trovano piu’ significative