1 / 24

Valenční slovník českých sloves

Valenční slovník českých sloves. Zdeněk Žabokrtský ÚFAL, 23.5.2005. Jak zmenšit VALLEX?. Osnova : 1) Stručně o VALLEX 1.0 2) Jak snížit počet hesel? 3) Jak snížit počet rámců v heslech? 4) Shrnutí. VALLEX.

jagger
Download Presentation

Valenční slovník českých sloves

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Valenční slovník českých sloves Zdeněk Žabokrtský ÚFAL, 23.5.2005

  2. Jak zmenšit VALLEX? • Osnova: 1) Stručně o VALLEX 1.0 2) Jak snížit počet hesel? 3) Jak snížit počet rámců v heslech? 4) Shrnutí

  3. VALLEX • Valence – „the range of syntactic elements either required or specifically permitted by a verb or other lexical unit“ • stát – někde, o někoho, za něco, za něčím, při někom… • odpovídat – někomu na něco, za někoho, něčemu • brát – něco někomu, za něco, roha, zasvé,… • Teorie valence ve Funkčním generativním popisu • aktanty-volná doplnění, posouvání, obligatornost… • VALLEX • valenční slovník českých sloves budovaný na základě FGP od jara 2001 • verze 1.0 zveřejněná na podzim 2003 (cca 1400 sloves) • http://ckl.mff.cuni.cz/zabokrtsky/vallex/1.0

  4. Volba termínů pro popis slovníku • Filipec, 1994 – lexém trojí úrovně: • 1. odpovídat, 2. odpovídat2 (čemu), 3. „ Neodpovídá požadavkům“ • Mel’čuk, Žolkovskij, 1984 • vocabel (odpovídat) vs. lexeme (odpovídat2) • Filipec,Čermák, 1985 • lexém vs. lexie • Cruse, 1986 • lexém vs. lexikální jednotka

  5. Jak snížit počet hesel ve VALLEXu • tradiční pohled: • 1 slovníkové heslo ~ 1 lexém ~ 1 lemma • řešení: • více slovesných lemmat v jednom lexému

  6. Sloučení vidových „dvojic“do jediného lexému dát dávávat dávat + přiblížení k FGP (na tg. rovině je rozdíl ve vidu považován za rozdíl v morfologickém, nikoli lexikálním významu - gramatémy aspect a iterativeness) + snížení redundance slovníku (předpoklad: vidové protějšky se víc podobají než liší, rozdíly jsou výjimky) –vidové protějšky nesdílí všechny významy/rámce –problematické vymezení vidové dvojice – ztráta stromové struktury slovníku – nestandardní makrostruktura slovníku –jak má vypadat tektogramatické lemma (t-lemma v PDT 2.0)?

  7. Vidové dvojice • způsoby tvoření vidových dvojic: (a) – sufixace (vypsat-vypisovat) (b) – prefixace (psát-napsat) (c) – supletivní dvojice (vzít-brát) • problematické (b) • nejednoznačný dok. protějšek (zblednout/vyblednout) • hypotéza čistě vidové předpony • kritérium sekundární imperfektivizace (napisovat?) • závěr: • ve VALLEXu do jednoho lexému raději jen (a) a (c)

  8. Změna datové struktury • VALLEX 2.0 • VALLEX 1.0 lemma-pf lemma-pf -attr1 -attr2 -attr1 -attr2 -attr1 -attr2 lemma-impf -attr1 -attr2 -attr1 -attr2 -attr1 -attr2 -attr1 -attr2 -attr1 -attr2 lemma-impf -attr1 -attr2 -attr1 -attr2 -attr1 -attr2 -attr1 -attr2

  9. Kvantitativní důsledky sloučení vidových dvojic ve VALLEX 1.5 • před sloučením vid. dvojic: • 2451 lexémů (1338 impf, 1075 perf, 38 biasp) • 6411 lexikálních jednotek • po sloučení vidových dvojic • 1585 lexémů (866 perf+impf, 472 impf, 209 perf, 38 biasp) • 4303 lexikálních jednotek, • z toho 2623 u sloučených lexémů • z toho jen 515 lex. jednotek platilo jen pro jedno sloveso z dvojice • závěr: • sloučením vidových dvojic lze slovník zmenšit zhruba o třetinu (co do počtu lexémů i lexikálních jednotek) při zachování stejné informace

  10. Další kandidáti na sloučení • determinovaná / nedeterminovaná slovesa • jít-chodit, jet-jezdit, běžet-běhat ... • pro: • posun v (základním) lexikálním významu je srovnatelný s posunem u vidových dvojic • proti: • jen malá uzavřená skupina • další zkomplikování datové struktury

  11. Jak snížit počet rámců? • tradiční pohled: • 1 podheslo (LU) ~ 1 rámec ~ 1 význam • řešení • více rámců/významů v jedné LU

  12. Kandidáti na sloučení • odevzdat nález policii – na policii • ukradl bance peníze – peníze z banky • vyčistit šaty od bláta – bláto z šatů • naložit vůz cementem – cement na vůz • osázet park stromy – stromy do parku • prorazit hřebík plechem – plech hřebíkem • vyjít na kopec – vyjít kopec • oloupat slupku z jablka – jablko • umístit nábytek do bytu – nábytek v bytě • slunce vyzařuje světlo – světlo vyzařuje ze slunce • tričko pouští barvu – barva pouští z trička

  13. Alternace • Volba termínu • diateze - Mel’čuk, Cholodovič, 1970 • hierarchizace – Daneš, 1985 • alternace – Levinová, 1993 • Trojí projev alternace (1) změna (povrchové) formy predikátoru (2) změna valenčního rámce (3) změna lexikálního významu Pozn.: model alternace je účelné zavádět jen tam, kde jde o pravidelné změny, které se týkají celé skupiny lexikálních jednotek

  14. (1) Změna formy predikátoru • alternace v širokém pojetí: • pasivizace (být vybrán) • reflexivizace (mýt se) • složený tvar s pomocným slovesem (dostat slíbeno) • dispoziční modalita (Knížka se mi čte dobře.) • ? prefixace (nachodit se - alternace přes hranice lexému!)

  15. (2) Změna valenčního rámce • Změny ve valenčních rámcích: • přibyde aktant (Vyběhl kopec.) • ubyde aktant (Pepík už čte.) • záměna dvou valenčních členů s různým funktorem – např. ADDR-DIR3(možný souvýskyt: Poslal jeden dopis babičce a dva domů.) • náhrada jednoho funktoru skupinou: • DIFF – DIR1+DIR3 , DIFF – ORIG+EFF (klesl o 10cm/ze 150 na 140 cm), LOC – DIR1+DIR3

  16. (3) Změna lexikálního významu • ne nutně zcela totožná situace, ale změna významu po provedení alternace je (pro třídu sloves, která se této alternace může účastnit) predikovatelná • různý (ontologický,pragmatický?) vztah argumentů a predikátu • ... hřebík.PATplechem – plech.PAThřebíkem

  17. Příklad 1:„odstraňování z kontejneru“ • vybalit (dárky,kufr), vykácet (stromy, zahradu), vyklidit (pokoj, nábytek), vyložit (zboží, vagón), vysypat (popel, popelník)... (Daneš,1985) • změna formy predikátoru: žádná • změna valenčního rámce: ubude obl. DIR1 (ale: vysypat popelník z okna(?)) • změna významu: • před alternací je kontejner na tg.rovině obsažen v DIR1, po alternaci je PAT • po alternaci: předpokládáme úplnější dokončení děje (vykácel zahradu ~ vykácel ze zahrady všechny stromy)

  18. Příklad 2:dispoziční modalita • dobře se mi čte (ta kniha) (ale: *zná se mi dobře, *umí se mi dobře, *cítí se mi dobře) • změna formy predikátu: reflex. • změna valence: přibude hodnotící obl.MANN, ACT(3) a non-obl PAT(1) • změna významu: modální příznak

  19. Příklad 3: „ztranzitivnění“ sloves pohybu • vyjít/vyběhnout/vyjet/vylézt na kopec/kopec • změna formy predikátu: žádná • změna valence: ubude obl.DIR3, přibude obl. PAT • změna významu: před alternací jde jen o dosažení cíle, po alternaci jde o zdolání úseku

  20. ČNK: plavat + ak.

  21. Alternační model valenčního slovníku LEXÉM LEXÉM LEX. FORMY LEX. FORMY lemma1 lemma2 lemma1 lemma2 LEX. JEDNOTKA LEX. JEDNOTKA RÁMEC ZÁKL. RÁMEC ODV. RÁMCE ... ... ... ... ... ...

  22. Další výhody alternačního modelu • valence komparativů a superlativů • tatáž lexikální jednotka, ale jiná valence • valence substantiv („přetížený“ genitiv) • Karlův dluh dvou miliónů / dluh Karla • valence anglických sloves • He gave Mary a book /He a book to Mary. • „nadfunktory“ • DIR1-TFRWH: pochází z osmého století / ze střední Asie • krok k vyšší (sémanticko-logické?) rovině popisu jazyka • napustil vanu vodou napustilvodudo vany

  23. Závěr • sloučení vidových dvojic • významné snížení redundance slovníku • přiblížení FGP • komplikovanější datová struktura slovníku • alternační model valenčního slovníku • snížení redundance slovníku • jednotný mechanismus pro popis řady dosud (v rámci VALLEXu) nezachytitelných situací • zásah do valenční teorie FGP • komplikovanější datová struktura slovníku • otevřené otázky ...

  24. „Lituji, slečno, manžel dnes nepřijde, je upoután na lůžko.“

More Related