250 likes | 384 Views
An Older Czech Text Corpus for Linguistic Purposes František Martínek, Charles University in Prague, Faculty of Arts (frantisek.martinek@ff.cuni.cz) Kateřina Rysová, Charles University in Prague, Faculty of Mathematics and Physics (katerina.rysova@post.cz). I. Characteristics of the Corpus.
E N D
An Older Czech Text Corpus for Linguistic PurposesFrantišek Martínek, Charles University in Prague, Faculty of Arts (frantisek.martinek@ff.cuni.cz)Kateřina Rysová, Charles University in Prague, Faculty of Mathematics and Physics (katerina.rysova@post.cz)
I. Characteristics of the Corpus - ballanced electronic corpus of printed texts from 1500 to 1620 - more than 500 000 word forms - approximately 50 texts and extracts of longer texts
<a>Abraham z Gynterrodu</a><t>Cyri paedia</t><r>1605</r><s>1a</s> <k> <o>Cyri paedia</o>, hodnověrná starožitná historia o chvalitebném ve všelikých <e>wewsselikých</e> knížecích <e>Knjžetcých</e> ctnostech vycvičení a zvedení, o slavných skutcích, vítězných válkách a právě heroitském <l>heroický</l> šlechetném životu Cýra Staršího, prvního monarchy perského. V níž se vypisuje, jakým spůsobem <l>způsob</l> Pán Bůh monarchí <l>monarchie</l> kaldejskou <l>chaldejský</l> skrze Daria […] a Cýra […] na médský <e>Medský</e> a perský národ přenesti <l>přenésti</l> a monarchí médskou <e>Medskou</e> a perskou zříditi a utvrditi ráčil. […] </k>Léta Páně 1605. <e>M. DC. V.</e>
<a>Abraham z Gynterrodu</a><t>Cyri paedia</t><r>1605</r><s>1a</s> <k> <o>Cyri paedia</o>, hodnověrná starožitná historia o chvalitebném ve všelikých <e>wewsselikých</e> knížecích <e>Knjžetcých</e> ctnostech vycvičení a zvedení, o slavných skutcích, vítězných válkách a právě heroitském <l>heroický</l> šlechetném životu Cýra Staršího, prvního monarchy perského. V níž se vypisuje, jakým spůsobem <l>způsob</l> Pán Bůh monarchí <l>monarchie</l> kaldejskou <l>chaldejský</l> skrze Daria […] a Cýra […] na médský <e>Medský</e> a perský národ přenesti <l>přenésti</l> a monarchí médskou <e>Medskou</e> a perskou zříditi a utvrditi ráčil. […] </k>Léta Páně 1605. <e>M. DC. V.</e>
<a>Abraham z Gynterrodu</a><t>Cyri paedia</t><r>1605</r><s>1a</s><k> <o>Cyri paedia</o>, hodnověrná starožitná historia o chvalitebném ve všelikých <e>wewsselikých</e> knížecích <e>Knjžetcých</e> ctnostech vycvičení a zvedení, o slavných skutcích, vítězných válkách a právě heroitském <l>heroický</l> šlechetném životu Cýra Staršího, prvního monarchy perského. V níž se vypisuje, jakým spůsobem <l>způsob</l> Pán Bůh monarchí <l>monarchie</l> kaldejskou <l>chaldejský</l> skrze Daria […] a Cýra […] na médský <e>Medský</e> a perský národ přenesti <l>přenésti</l> a monarchí médskou <e>Medskou</e> a perskou zříditi a utvrditi ráčil. […] </k>Léta Páně 1605. <e>M. DC. V.</e>
<a>Abraham z Gynterrodu</a><t>Cyri paedia</t><r>1605</r><s>1a</s> <k> <o>Cyri paedia</o>, hodnověrná starožitná historia o chvalitebném ve všelikých <e>wewsselikých</e> knížecích <e>Knjžetcých</e> ctnostech vycvičení a zvedení, o slavných skutcích, vítězných válkách a právě heroitském <l>heroický</l> šlechetném životu Cýra Staršího, prvního monarchy perského. V níž se vypisuje, jakým spůsobem <l>způsob</l> Pán Bůh monarchí <l>monarchie</l> kaldejskou <l>chaldejský</l> skrze Daria […] a Cýra […] na médský <e>Medský</e> a perský národ přenesti <l>přenésti</l> a monarchí médskou <e>Medskou</e> a perskou zříditi a utvrditi ráčil. […] </k>Léta Páně 1605. <e>M. DC. V.</e>
-- common abreviations in prints, - graphical variants of some letters (two letters for s (ſ), r or b),- distribution of capital and small letters, - using of Gothic and Latin type, - original punctuation (changed to the syntactic one), - some orthographical variants: wijera/wiera → viera, wijra/wjra → víra, naylepſſij/naglepſſij → najlepší What (ortho)graphical phenomena have been changed in the transcription:
Teoretical background of the transcription A three-level approach: 1. individual phenomenon (anomaly) 2. collective phenomenon Examples from vowel quantity: litost in place of lítost; míle, kníha, pozdvíhnouti, náděje etc. in place of -i-/-a-, probably also in imperatives of verbs with the suffix -ova-/-uj- (6th infinitive class) like nekupůj/nekupuoj in place of nekupuj and doubtless in masculine nominatives like muží, doktoří in place of muži, doktoři. 3. systematic phenomenon
II. A Possible Use of the Corpus Word order in Older Czech constructions “somebody deals withsomebody somehow”
Position of actant and free verbal modification • (Ty jsi) přístup sobě k dosáhnutí toho království strojil, <velmi oulisně a přívětivěs knížaty a lidem země francské zacházel>. • < ... (you have) very greasily and amiablywith the princes and with the people of Frankish country dealt>
Free modification vs. actant • Free verbal modification expressing manner: (to deal) “somehow” • Actant (inner participant) – patient: (to deal) “with somebody”
Sentences from the Corpus • affirmative • declarative • predicative verb – valency frame: ACT (obligatory), PAT (obligatory), MANN (obligatory) • predicative verb – semantics: mental action (e.g., ‘deal’, ‘handle’, ‘treat’)
The aim of the paper • Is it more typical in Older Czech to use “(to deal) with someone somehow” or “(to deal) somehow with someone”?
Results of the paper • Basic word-order position: • context unbound MANN • context unbound PAT “(to deal) somehow with somebody”
Example 1 • A v městě Brodě Uherském tolikéž vnově najatý soldát učiněn byl profousem (dosti postavy krásné a spanilé) a tolikéž <nekřesťanskys lidem obecním zacházel> • < ... (he) in an unchristian mannerwith ordinary people dealt>
Example 2 • Když sme pak k Solnaku přitáhli, tu sme novinu uslyšeli, kterak jest Hatvan od našich vzat, <jak pesky a nekřesťansky Balouni s Turky, s ženami i s dětmi jejich sou zacházeli, těhotné ženy rozřezovaly, dítky při prsech napoly rozpoltili>. • < ... how like with dogs and in an unchristian manner„Balons“with the Turks, with the women and with their children dealt ... >
Example 3 • I dí: Nebude více nazýváno jméno tvé toliko Jákob, ale také Izrael; <nebo jsi statečně zacházel s Bohem i lidmi>, a přemohls. • < ... because you bravely dealt with God and the people ... >
Another typical word-order position: 1. context bound PAT 2. context unbound MANN „(to deal) with him/her somehow“
Example 1 • Proti tomu neučiní-li to, že jim budou živnosti zastavené, vojáky že mušejí chovati, kteréž že je bíti <a s nimico nejhůř zacházeti že budou>. • < ... and that with themas bad as possible (they) will deal>
Example 2 • V nenávisti máte dobré a milujete zlé, násilně snímáte kůži z lidu mého i maso z těla jejich, jedli ste tělo lidu mého a z kůže jste je vyvlékli a kosti jejich jste zlámali a jako v moždíři stloukli <a zacházeli ste s nimijako s masem uprostřed hrnce>. • < ... and you dealt with themlike with meat in the middle of the pot>
Example 3 • V čemž naříkáno bylo na některé přední pány a biskupy uherské, <že by s týmž králem a pánem jich mladýmneupřímně a nevěrně podle vůle své zacházeli, málo ho sobě vážíce>. • < ... that they would with the same king and their young lorddishonestly and unfaithfullyaccording to their will deal ... >
Word-order “exceptions” 1. context unbound MANN 2. context bound PAT - syntactic needs: • <Žena lépejí jedním prstem dítek se dotýkati a s nimi zacházeti umí nežli muž všemi oudy těla.> • <Woman better with one finger touch the children and with them deal can than man with all members of the body.>
Word-order “exceptions” • I byl nákulhavý na obě nohy, na obě strany, a tu se na Horách Kutnách osadil, pojav k manželství Alžbětu, dceru nebožtíka kněze Jakuba Melisea, děkana tu na Horách Kutnách, <a nesvorněs sebou zacházeli>. • <and (they) discrepantlywith themselves dealt>
Thank you for your attentionThis talk was supported by the grants GAUK 16 809 Linguistic Analysis of Czech Humanistic Texts (Lingvistická analýza českých humanistických textů) and GA ČR 405/09/0729 From the structure of a sentence to textual relationships (Od struktury věty k textovým vztahům).