410 likes | 577 Views
Az alaktan az információs pszicholingvisztikában. Pléh Csaba 3. Óra Információs Pszicholingvisztika a PPKE diákjainak 2014 ősz pleh.csaba@ektf.hu. Áttekintés. A morfológia fogalma Szófelismerés és alaktani elemzés. A szuffixumok feldolgozása agglutinatív nyelvekben.
E N D
Az alaktan az információs pszicholingvisztikában Pléh Csaba 3. Óra Információs Pszicholingvisztika a PPKE diákjainak 2014 ősz pleh.csaba@ektf.hu
Áttekintés • A morfológia fogalma • Szófelismerés és alaktani elemzés. • A szuffixumok feldolgozása agglutinatív nyelvekben. • Elemző és egészleges modellek kombinációja. • Az igekötő levágás és a komplex igék képviselete. • Az alaktani szabályok és az allomorfia: észlelés, produkció és elsajátítás. • A szabályok és szokások vitája az alaktanban: a konnekcionisták és Pinker. • Alaktan afáziás és egyéb patológiás folyamatokban. • Alternatívák az alaktanban és a nyelvhasználat mint értékhordozó (stigmatizációs folyamatok).
Morfológia • A szavak belső szerkezetét vizsgálja • Morféma: legkisebb jelentéssel bíró nyelvi egység • Szó és szóalak • elkelkáposztásíthatatlanságaitokért • Hány morféma ez a szóalak?
Morfológiai folyamatok • A morfémák kombinációkészsége nyelvről nyelvre változik: • Poliszintetikus nyelvek: többszörösen összetett szavak, teljes mondatokat fejezhet ki egy szó. • Ajjiliurumavagit.(inuktitut)Le akarlak fényképezni. • Izoláló nyelvek: ritka az összetett szó, a grammatikai morfémák is szabadon állnak. • I want to take a picture of you. (angol)Le akarlak fényképezni. • Flektáló nyelv: szláv, latin. Tőtípusok • Agglutináló nyelvek: nyelvtani morfémák többnyire kötöttek, lexikai morfémák többnyire szabadok. • Le akarlak fényképezni. • Szatellita szerveződés: minden megkülönböztetés másik morféma kalap-ja-im-nak • Egy-egy nyelv története mozoghat a típusok között.
Az alaktan bonyolódása csökkenti a beszélők számát Nettle, 2012
Szavak száma és szóalakok a bibliafordításban. Ragozóknál sok alak s kevés szó Sekély morfológiai: sok fonéma, sok szó
Gazdag alaktan gyors döntések lokálisabb megértés emlékezet szavaknál (Németh Dezső) Szegényes alaktan lassabb döntés egészlegesebb megértés emlékezet frázisoknál Az alaktan viszonylagos szerepének következményei(Gergely és Pléh, 1995)
A morfémákat emlékezetünkben tároljuk: mentális lexikon morfématár része • A tárolt morfémákból kombinációs szabályok szerint alkotunk szavakat. • prefixáció: be-megy, be-olvas, ? ki-rándul • Szuffixáció drájv-ot, kólá-val • Szóösszetétel sörkorcsolya • kettőzés (egyszer-egyszer, tutyi-mutyi) • szóvegyülés (citrancs) • A kombinációs szabályok többnyire nem egyéni szavakra vonatkoznak, hanem kategóriákra: • Főnév + bAn : helyet jelölő főnév • Le + mozgást jelentő ige : lefelé mozgást jelentő ige
A szavak világa • Tövek és végződések: a szavak felépítése
Mi történik egy bonyolult szónál? A pszichológusok régóta méricskélik ezt • Holisztikus hozzáférés: erdők • Teljesen analitikus • erdőben • egyes kenyeret kenyér kenyeret ? ? ? gyakori idiomatikus szabálytalan
100 90 80 70 60 Előfeszítés (msec) 50 40 30 20 10 0 Áttetsző Szeszély - Szeszélyes Homályos Ír - Iroda Az áttetszőség szerepe Magyari Lilla előfeszítéses kiolvasási kísérletei
Magyar példák • Meg-olvas • Fel-gondol • Ki-teg • Melyiket nehezebb eldönteni? • Levágás: megolvas meg + olvas • nem megy a kombináció
A levágási modell a a magyarban • Szegmentálást segíti: hangsúly elől, szóalak korlátok • A töveket és a ragot dolgozzuk fel elsődlegesen (Juhász és Pléh), lassabban, mint az angol vagy olasz • Fürdőkád hatás
Döntések hosszú sok morfémás szavaknál: Pléh és Juhász 1995 bathtub effect Aithchison
A szavak rekonstrukciója sikeresebb, ha mind a szó eleje mind a vége helyesen van leírva
Az előfeszítési helyzet RPOBLÉMA PROBLÉMA
Előfeszítési hatás a kezdetnél: A rontott szó lelassít az elején és a végén Várhelyi Klára PROBLMÉA PROLBÉMA PORBLÉMA PROBLÉAM
Hasonló szavak, mint a gatingnél Böllár Tő Böllér-ak bölléruk Jel Böllér-nak böllér-nuk Rag Böllér-ak-nek böllér-uk-nek Jel belül
A vizsgálati anyag alapja • 60 kétszótagú főnév, Németh Kornél gating vizsgálata alapján • Forrás: MOKK korpusz(www.szoszablya.hu) • 4 csoport egyediségi pont és gyakoriság alapján
A ragozott szavak • Előfordulások: csak tő, jel, rag vagy jel és rag • Rontás a tőben (kunyérem) a jelben (kenyérid) vagy a ragban (kenyeredbun) • Létező, de rosszul illesztett (kenyérim) vagy nem létező toldalékok (kenyérum)
A vizsgálat felépítése • 72, 18 és 34 év közötti résztvevő a Budapesti Műszaki Egyetem hallgatói közül • 44 (átlag életkor: 21,41 év) nő és 28 (átlag életkor: 21,75 év) férfi • Minden kísérleti személy döntést hozott az összes szóról, az ingerek fele létező, fele nem létező szó volt • A szavak egy fixációs kereszt felvillanása után jelentek meg és a kísérleti személyek az i (létező) és r (nem létező) billentyűk segítségével válaszoltak
Eredmények – helyes válaszok ritka gyakori • Mind a gyakoriság mind a hibatípus hatása szignifikáns • A szó gyakorisága és a hibatípus felismerésének gyakorisága között is szignifikáns korreláció figyelhető meg • Minél később fordul elő a hiba a szóban, elutasítása annál könnyebb és gyorsabb
Eredmények - reakcióidők • Mind a gyakoriság, mind a hibatípus hatása szignifikáns • A létező szavak elfogadása lassabb, mint a nem létezők elutasítása • A nem létező tövek elutasítása lassabb, mint a nem létező toldalékoké • Nincs egyértelmű fürdőkád hatás • A két magánhangzó harmóniát sértő hibatípus közt nincs különbég, viszont ezekhez képest a nem létező toldalékok elutasítása gyorsabb ritka gyakori
Szóközepén előforduló rontások gyakori szavaknál • Gyorsabb reakcióidő, de gyakoribb hibázások • Lehet egy optimalizálási mechanizmus eredménye Gyakori Helyes válaszok Reakcióidő
A rontás alattomossága • A rontás előtt lévő 4 karakter előfordulási gyakorisága a MOKK korpuszban, pl.: bölléred - böllérudléru-782 előforduláslére-75283 előfordulás • A két szám hányadosának logaritmusa (ngram-faktor) határozza meg a rontás alattomosságának a mértékét
Tényleg külön dolgozzuk fel a ragokat hallva is ? „A hálószobában kóválygott a fejem a csókjaidtól.” „A hálószobában mindent belengett illatával a levendula.” A második közben nehezebb meghallani a kattanást, mert fel kell dolgozni a szót.
Menetközbeni feldolgozás és az alaktan (Gergely és Pléh) • Extra hang felismerése és az alaktani terhelés • A végződés feldolgozás már menet közben, hallgatáskor végbemegy
Jellegzetes hangrekonstrukciós anyag (Dankovics Natali ) A majmot nézik a gyerekek. – kattanó zaj
Mondatpéldák a rekonstrukcióban • Többesszám helye • (1a) A macskák megették a kolbászt. • (1b) A kolbászt megették a macskák. • Tárgyrag helye • (2a) A macskát kergeti a kutya. • (2b) A kutya kergeti a macskát. • Ige vonzatkerete • (3 a) Kati hitt Imrének Velencében. • (3b) Kati hitt az ének erejében. • Elhagyható esetragok: • (4a) Hiányzik a papucsomnak a bojtja. • (4b) Hiányzik a motorcsónak a partról.
Az alaktan hatásai • A komplexebb alaktan-mondattan kölcsönhatás megfigyelhető
Kostic, Baayen, Moscoso • Kostic: infomennyiség szabja meg az időt, nem a formaszám
Kostic adatai és az Információ mércéje a morféma összes alakjához viszonyítva az adott alak Pl. háznak Dat Gen
Házi feladat • Szuffixumok információs elemzése a magyarban. Entrópiamércék ragokkal s képzőkkel • Különböző gyakoriságú tövek szaturációja. Hány alakjuk fordul elő, s milyen entrópiával. • Entrópia és szegmentáció. Hogyan segít? • Főnevek és igék entrópiája • Szóhossz, nyelvtani komplexitás és mozgósított szókincs (tokenek) irodalom szövegben