420 likes | 577 Views
Wstęp do językoznawstwa synchronicznego 3003-11A1WS Filologia polska, I rok * 2013/2014. Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego Instytut Języka Polskiego UW e-mail: m .r. swidz inski @uw. edu.pl Konsultacje w pok. 1: środa 16.30-17.30
E N D
Wstępdo językoznawstwa synchronicznego3003-11A1WSFilologia polska, I rok * 2013/2014 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego Instytut Języka Polskiego UW e-mail: m.r.swidzinski@uw.edu.pl Konsultacje w pok. 1: środa 16.30-17.30 Strona przedmiotu — szukaj pod: www.mswidz.republika.pl/
Program • Przedmiot językoznawstwa. • Cechy definicyjne języka naturalnego. • Struktura języka I: słownik i morfologia. • Struktura języka II: składnia. • Formalne rozumienie języka. Lingwistyka formalna i informatyczna. • Komunikacja językowa. • Podstawy leksykologii. Leksykografia. • Słowniki – analiza zawartości, klasyfikacja. • Zróżnicowanie języków świata. Podstawy typologii. • Typy badań lingwistycznych. • Kolokwium.
Temat 7 Podstawy leksykologii. Leksykografia.
Przypomnienie • Kompetencja językowa: znajomość słownika i gramatyki. • Słownik to zbiór pewnych jednostek (= haseł słownikowych); głównie – leksemów. • Leksem – zbiór form wyrazowych mających to samo odniesienie do rzeczywistości (= znaczenie). • Leksemy identyfikuje się i klasyfikuje na podstawie cech gramatycznych. • Utrwalona fizycznie postać słownika: leksykon.
Jednostki słownika Użytkownik identyfikuje i pamięta JS: • jako kształty • jako pakiety cech semantycznych • jako komplety cech gramatycznych JS to: • leksemy • pewne klasy wyrażeń
Leksykologia Leksykologia – dziedzina językoznawstwa zajmująca się opisem zasobu JS. Dla gramatyka: istotne własności gramatyczne (= morfologiczne i składniowe) JS. Dla leksykologa (i leksykografa): istotne własności semantyczne.
Typy JS Leksemy: KOT, CZEKAĆ, ON, WESOŁY, ALE, KRÓTKOWZROCZNOŚĆ, JAN, WCZORAJ, KTÓRY, PRZED, PIĘĆSET, OJEJ,... Wyrażenia: BAĆ SIĘ, PO OMACKU, KLUB PARLAMENTARNY, KOCIE ŁBY, ZOSTAĆ NA LODZIE, PIJANY JAK BELA, CIEMNO CHOĆ OKO WYKOL, BYLE JAK, CZARNA KAWA,...
Jednostki złożone Wyrażenia: • leksemy „nieciągłe” (BAĆ SIĘ, PO OMACKU, BYLE JAK) • idiomy (ZOSTAĆ NA LODZIE, PIJANY JAK BELA, CIEMNO CHOĆ OKO WYKOL) • kolokacje (KLUB PARLAMENTARNY, CZARNA KAWA)
Klasyfikacje JS Porządkowanie zbioru JS • według cech gramatycznych (klasy gramatyczne) • według cech semantycznych (pola semantyczne, semantyka składnikowa; synonimia, hiponimia, antonimia, konwersja; wieloznaczność) • według cech pozalingwistycznych (warianty stylistyczne, socjalne, terytorialne, chronologiczne, idiolektalne)
Semantyka Znaczenie a oznaczanie [Znaczenie – prymarnie: to, co wynika z danego wyrażenia (to, co wyrażenie mówi bezpośrednio). Semantyka zdaniowa] • JS ma pewną strukturę semantyczną. Jest to przedmiotem semantyki leksykalnej. Znaczenie JS – wtórne w stosunku do znaczenia wyrażeń: da się wywnioskować ze znaczenia wyrażenia. • oznaczanie (denotacja) – relacja między wyrażeniem a klasą obiektów rzeczywistych • referencja (odniesienie) – relacja między aktem mowy a konkretnym fragmentem rzeczywistości.
Semantyka leksykalna Semantyka leksykalna formułuje definicje JS – główny komponent słownika jako kompendium. PISAĆ • «kreślić na papierze lub innym materiale znaki graficzne (litery, cyfry itp.) ręcznie lub odbijać je za pomocą maszyny dla wyrażenia czegoś słowami»] • «tworzyć, układać co na piśmie, np. jakiś artykuł, jakieś dzieło literackie, naukowe; komponować» • «formułować, ujmować swoje myśli na piśmie, utrwalać je za pomocą pisma» • «donosić, komunikować coś na piśmie lub w druku» • zwykle w imiesł. przymiotnikowym biernym, przestarz. «malować we wzory, zdobić rysunkami, deseniami itp.»
Semantyka leksykalna Różne szkoły semantyki leksykalnej • Pola semantyczne: Jost Trier, Walter Porzig • Semantyka składnikowa: Manfred Bierwisch • Semantyka sensów elementarnych: Anna Wierzbicka, Andrzej Bogusławski, Igor Mielczuk • Tezaurus: zbiór tematyczny JS
Semantyka leksykalna Relacje semantyczne w zbiorze JS Synominia • mocna: równoznaczność JS1 i JS2 LINGWISTYKA – JĘZYKOZNAWSTWO UMRZEĆ – SKONAĆ DUŻY – WIELKI KARTOFLE – ZIEMNIAKI DOZORCA – CIEĆ .........
Semantyka leksykalna • słaba: bliskoznaczność JS1 i JS2 ZESTAW – KOLEKCJA – ZBIÓR BAĆ SIĘ – TRZĄŚĆ PORTKAMI – OBAWIAĆ SIĘ MĄDRY – ROZUMNY – ROZSĄDNY ......... Niemożliwe do zdefiniowania...
Semantyka leksykalna Hiponimia (inkluzja) WRÓBEL – PTAK MATKA – KOBIETA – CZŁOWIEK POWIEDZIEĆ – ZAKOMUNIKOWAĆ OGROMNY – DUŻY ZIMA – PORA ROKU – OKRES ..................... Kohiponimia
Semantyka leksykalna Konwersja OJCIEC – SYN OŻENIĆ SIĘ (Z) – WYJŚĆ (ZA) WYŻSZY – NIŻSZY ....................
Semantyka leksykalna Antonimia PRAWDA – FAŁSZ KRÓTKI – DŁUGI TAKI SAM (JAK) – RÓŻNY (OD) OŻENIĆ SIĘ – ROZWIEŚĆ SIĘ WESOŁY – SMUTNY .....................
Semantyka leksykalna Wieloznaczność DOM: ‘budynek’, ‘mieszkanie’, ‘rodzina’, ‘gospodarstwo’, ‘ród’ PISAĆ: ‘utrwalać znaki na papierze’, ‘tworzyć’, ‘komunikować na piśmie’, ‘malować (ikony)’ PŁYWAK: ..... O: ..... SZARY: .....
Semantyka leksykalna Relacje niesemantyczne stylistyczne: UMRZEĆ – ODEJŚĆ – ZEJŚĆ – WYKITOWAĆ – ZGASNĄĆ socjalne: WIĘZIENIE – PIERDEL – ZAKŁAD KARNY terytorialne: KARTOFLE – GRULE – PYRY – ZIEMNIAKI chronologiczne: SAMOCHÓD – AUTOMOBIL idiolektalne:
Leksykografia Leksykologia – podstawa leksykografii Leksykografia: (a) teoria słowników (= nauka), (b) inżynieria budowy słowników (= rzemiosło), (c) wydawanie słowników (= przemysł)
Leksykografia Literatura • Grochowski M., Zarys leksykologii i leksykografii, Toruń 1982. • Bańko M., Z pogranicza leksykografii i językoznawstwa, Warszawa 2001. • Żmigrodzki P., Wprowadzenie do leksykografii polskiej, Katowice 2003.
Słownik Słownik: kolekcja artykułów hasłowych podana w jakimś porządku (niekoniecznie alfabetycznym). Słowniki różnią się: • koncepcją artykułu hasłowego („Co jest hasłem?”) • ogólną zawartością artykułu hasłowego („Co mówi artykuł hasłowy?”) • liczbą i doborem artykułów hasłowych – siatką haseł („Ile i jakie?”) • adresatem („Dla kogo?”) • celem („Po co?”).
Słownik Nie są słownikami w sensie lingwistycznym • spisy słów dla krzyżówkowiczów • „słowniczki” do spell checkerów • słowniki encyklopedyczne • słowniki terminów zawodowych • encyklopedie Słownik w sensie lingwistycznym: taki, że artykuł hasłowy odpowiada jakiejś jednostce języka.
Słownik Leksykografia jednojęzyczna i dwu-(wielo-)języczna (1L//2L-lexicography). Podstawa: wielki jednojęzyczny słownik ogólny. Słowniki pochodne: - średni//mały słownik ogólny - słowniki specjalne: • ortoepiczny, • wyrazów obcych, • ortograficzny, • frazeologiczny, • synonimów, • ................ - słowniki dwu- i wielojęzyczne
Parametry słownikowe • hasło • artykuł hasłowy • nazwa hasła • głowa hasła • kwalifikator • informacja fleksyjna • informacja składniowa • znaczenie // podznaczenie • definicja • ilustracja empiryczna • idiomatyka
KSJP Nazwa hasła Hasło: PŁYWAK
Głowa hasła KSJP
Informacja fleksyjna KSJP
KSJP Definicje Znaczenia Podznaczenia
KSJP Ilustracja empiryczna Kwalifikatory
Idiomatyka SJP Dor.
CIDE CIDE (1995)
Warsztat współczesnego leksykografa • korpus zrównoważony • narzędzia przeszukiwania • komercyjne oprogramowanie leksykograficzne (baza danych, narzędzie sporządzania konkordancji, edytor haseł) • konwerter bazy danych na podstawę tekstową wydruku (SGML) • oprogramowanie automatycznej korekty
Korpusy British National Corpus Collins COBUILD: Corpus Concordance Sampler Český Národní Korpus Korpus IPIPAN NKJP Korpus PWN Narzędzia wyszukiwania
COBUILD 1987
Korpus PWN Dostęp: • korpus.pwn (wersja demonstracyjna) • Korpus Języka Polskiego PWN, płyta CD, Warszawa 2003 (7 mln: PWN + „Rzeczpospolita”) • Pełny korpus sieciowy (oferta komercyjna)
Perspektywy leksykografii Leksykografia w Polsce UE – perspektywy obiecujące!!! Jest rynek pracy dla polonistów...
Podsumowanie • Leksykologia: opis JS. • JS: proste (leksemy) i złożone (leksemy „nieciągłe”, idiomy, kolokacje). • Różne typologie JS. • Semantyka leksykalna. Różne szkoły. Relacje semantyczne: synonimia – bliskoznaczność – antonimia - konwersja. • Leksykografia: nauka – rzemiosło – komercja. • Tworzenie wielkiego słownika ogólnego: budowa korpusu – narzędzia przetwarzania korpusu – konwerter „baza danych => tekst”). • Leksykografia – ważny rynek pracy dla humanistów, informatyków i wydawców.