1 / 25

I. Characteristics of the Corpus

An Older Czech Text Corpus for Linguistic Purposes František Martínek, Charles University in Prague, Faculty of Arts (frantisek.martinek@ff.cuni.cz) Kateřina Rysová, Charles University in Prague, Faculty of Mathematics and Physics (katerina.rysova@post.cz). I. Characteristics of the Corpus.

Download Presentation

I. Characteristics of the Corpus

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.


Presentation Transcript

  1. An Older Czech Text Corpus for Linguistic PurposesFrantišek Martínek, Charles University in Prague, Faculty of Arts (frantisek.martinek@ff.cuni.cz)Kateřina Rysová, Charles University in Prague, Faculty of Mathematics and Physics (katerina.rysova@post.cz)

  2. I. Characteristics of the Corpus - ballanced electronic corpus of printed texts from 1500 to 1620 - more than 500 000 word forms - approximately 50 texts and extracts of longer texts

  3. <a>Abraham z Gynterrodu</a><t>Cyri paedia</t><r>1605</r><s>1a</s> <k> <o>Cyri paedia</o>, hodnověrná starožitná historia o chvalitebném ve všelikých <e>wewsselikých</e> knížecích <e>Knjžetcých</e> ctnostech vycvičení a zvedení, o slavných skutcích, vítězných válkách a právě heroitském <l>heroický</l> šlechetném životu Cýra Staršího, prvního monarchy perského. V níž se vypisuje, jakým spůsobem <l>způsob</l> Pán Bůh monarchí <l>monarchie</l> kaldejskou <l>chaldejský</l> skrze Daria […] a Cýra […] na médský <e>Medský</e> a perský národ přenesti <l>přenésti</l> a monarchí médskou <e>Medskou</e> a perskou zříditi a utvrditi ráčil. […] </k>Léta Páně 1605. <e>M. DC. V.</e>

  4. <a>Abraham z Gynterrodu</a><t>Cyri paedia</t><r>1605</r><s>1a</s> <k> <o>Cyri paedia</o>, hodnověrná starožitná historia o chvalitebném ve všelikých <e>wewsselikých</e> knížecích <e>Knjžetcých</e> ctnostech vycvičení a zvedení, o slavných skutcích, vítězných válkách a právě heroitském <l>heroický</l> šlechetném životu Cýra Staršího, prvního monarchy perského. V níž se vypisuje, jakým spůsobem <l>způsob</l> Pán Bůh monarchí <l>monarchie</l> kaldejskou <l>chaldejský</l> skrze Daria […] a Cýra […] na médský <e>Medský</e> a perský národ přenesti <l>přenésti</l> a monarchí médskou <e>Medskou</e> a perskou zříditi a utvrditi ráčil. […] </k>Léta Páně 1605. <e>M. DC. V.</e>

  5. <a>Abraham z Gynterrodu</a><t>Cyri paedia</t><r>1605</r><s>1a</s><k> <o>Cyri paedia</o>, hodnověrná starožitná historia o chvalitebném ve všelikých <e>wewsselikých</e> knížecích <e>Knjžetcých</e> ctnostech vycvičení a zvedení, o slavných skutcích, vítězných válkách a právě heroitském <l>heroický</l> šlechetném životu Cýra Staršího, prvního monarchy perského. V níž se vypisuje, jakým spůsobem <l>způsob</l> Pán Bůh monarchí <l>monarchie</l> kaldejskou <l>chaldejský</l> skrze Daria […] a Cýra […] na médský <e>Medský</e> a perský národ přenesti <l>přenésti</l> a monarchí médskou <e>Medskou</e> a perskou zříditi a utvrditi ráčil. […] </k>Léta Páně 1605. <e>M. DC. V.</e>

  6. <a>Abraham z Gynterrodu</a><t>Cyri paedia</t><r>1605</r><s>1a</s> <k> <o>Cyri paedia</o>, hodnověrná starožitná historia o chvalitebném ve všelikých <e>wewsselikých</e> knížecích <e>Knjžetcých</e> ctnostech vycvičení a zvedení, o slavných skutcích, vítězných válkách a právě heroitském <l>heroický</l> šlechetném životu Cýra Staršího, prvního monarchy perského. V níž se vypisuje, jakým spůsobem <l>způsob</l> Pán Bůh monarchí <l>monarchie</l> kaldejskou <l>chaldejský</l> skrze Daria […] a Cýra […] na médský <e>Medský</e> a perský národ přenesti <l>přenésti</l> a monarchí médskou <e>Medskou</e> a perskou zříditi a utvrditi ráčil. […] </k>Léta Páně 1605. <e>M. DC. V.</e>

  7. -- common abreviations in prints, - graphical variants of some letters (two letters for s (ſ), r or b),- distribution of capital and small letters, - using of Gothic and Latin type, - original punctuation (changed to the syntactic one), - some orthographical variants: wijera/wiera → viera, wijra/wjra → víra, naylepſſij/naglepſſij → najlepší What (ortho)graphical phenomena have been changed in the transcription:

  8. Teoretical background of the transcription A three-level approach: 1. individual phenomenon (anomaly) 2. collective phenomenon Examples from vowel quantity: litost in place of lítost; míle, kníha, pozdvíhnouti, náděje etc. in place of -i-/-a-, probably also in imperatives of verbs with the suffix -ova-/-uj- (6th infinitive class) like nekupůj/nekupuoj in place of nekupuj and doubtless in masculine nominatives like muží, doktoří in place of muži, doktoři. 3. systematic phenomenon

  9. II. A Possible Use of the Corpus Word order in Older Czech constructions “somebody deals withsomebody somehow”

  10. Position of actant and free verbal modification • (Ty jsi) přístup sobě k dosáhnutí toho království strojil, <velmi oulisně a přívětivěs knížaty a lidem země francské zacházel>. • < ... (you have) very greasily and amiablywith the princes and with the people of Frankish country dealt>

  11. Free modification vs. actant • Free verbal modification expressing manner: (to deal) “somehow” • Actant (inner participant) – patient: (to deal) “with somebody”

  12. Sentences from the Corpus • affirmative • declarative • predicative verb – valency frame: ACT (obligatory), PAT (obligatory), MANN (obligatory) • predicative verb – semantics: mental action (e.g., ‘deal’, ‘handle’, ‘treat’)

  13. The aim of the paper • Is it more typical in Older Czech to use “(to deal) with someone somehow” or “(to deal) somehow with someone”?

  14. Results of the paper • Basic word-order position: • context unbound MANN • context unbound PAT “(to deal) somehow with somebody”

  15. Example 1 • A v městě Brodě Uherském tolikéž vnově najatý soldát učiněn byl profousem (dosti postavy krásné a spanilé) a tolikéž <nekřesťanskys lidem obecním zacházel> • < ... (he) in an unchristian mannerwith ordinary people dealt>

  16. Example 2 • Když sme pak k Solnaku přitáhli, tu sme novinu uslyšeli, kterak jest Hatvan od našich vzat, <jak pesky a nekřesťansky Balouni s Turky, s ženami i s dětmi jejich sou zacházeli, těhotné ženy rozřezovaly, dítky při prsech napoly rozpoltili>. • < ... how like with dogs and in an unchristian manner„Balons“with the Turks, with the women and with their children dealt ... >

  17. Example 3 • I dí: Nebude více nazýváno jméno tvé toliko Jákob, ale také Izrael; <nebo jsi statečně zacházel s Bohem i lidmi>, a přemohls. • < ... because you bravely dealt with God and the people ... >

  18. Another typical word-order position: 1. context bound PAT 2. context unbound MANN „(to deal) with him/her somehow“

  19. Example 1 • Proti tomu neučiní-li to, že jim budou živnosti zastavené, vojáky že mušejí chovati, kteréž že je bíti <a s nimico nejhůř zacházeti že budou>. • < ... and that with themas bad as possible (they) will deal>

  20. Example 2 • V nenávisti máte dobré a milujete zlé, násilně snímáte kůži z lidu mého i maso z těla jejich, jedli ste tělo lidu mého a z kůže jste je vyvlékli a kosti jejich jste zlámali a jako v moždíři stloukli <a zacházeli ste s nimijako s masem uprostřed hrnce>. • < ... and you dealt with themlike with meat in the middle of the pot>

  21. Example 3 • V čemž naříkáno bylo na některé přední pány a biskupy uherské, <že by s týmž králem a pánem jich mladýmneupřímně a nevěrně podle vůle své zacházeli, málo ho sobě vážíce>. • < ... that they would with the same king and their young lorddishonestly and unfaithfullyaccording to their will deal ... >

  22. Word-order “exceptions” 1. context unbound MANN 2. context bound PAT - syntactic needs: • <Žena lépejí jedním prstem dítek se dotýkati a s nimi zacházeti umí nežli muž všemi oudy těla.> • <Woman better with one finger touch the children and with them deal can than man with all members of the body.>

  23. Word-order “exceptions” • I byl nákulhavý na obě nohy, na obě strany, a tu se na Horách Kutnách osadil, pojav k manželství Alžbětu, dceru nebožtíka kněze Jakuba Melisea, děkana tu na Horách Kutnách, <a nesvorněs sebou zacházeli>. • <and (they) discrepantlywith themselves dealt>

  24. Thank you for your attentionThis talk was supported by the grants GAUK 16 809 Linguistic Analysis of Czech Humanistic Texts (Lingvistická analýza českých humanistických textů) and GA ČR 405/09/0729 From the structure of a sentence to textual relationships (Od struktury věty k textovým vztahům).

More Related