210 likes | 225 Views
Słowniki i korpusy języka polskiego. Leksykografia opracowywanie słowników, słownikarstwo nauka o metodach i technice opracowywania słowników
E N D
Leksykografia opracowywanie słowników, słownikarstwo nauka o metodach i technice opracowywania słowników Słownik – zbiór słów lub wyrażeń ułożonych i opracowanych według jakiejś zasady. Dzieli się na artykuły hasłowe ułożone w porządku alfabetycznym, rzadko tematycznym. Rodzaj słownika określa zasadę budowy artykułu hasłowego i sposób uporządkowania. Kwalifikator – skrót podawany przed definicjami w słowniku, encyklopedii zawierający informację o zakresie używania danego wyrazu lub jego różnorodnym nacechowaniu, np. stylistycznym, chronologicznym, ekspresywnym (Engelking, Markowski, Weiss 1989, 300) Stosowane są różnego rodzaju kwalifikatory – najczęściej we wstępie do danej publikacji można znaleźć ich opis.
Rodzaje słowników jednojęzycznych • ogólny języka polskiego • ortograficzny języka • frazeologiczny • terminologiczny (np. prawniczy) • grup społecznych i zawodowych • etymologiczny • częstotliwościowy (frekwencyjny) • synonimiczny • onomastyczny • skrótów • ortoepiczny • wyrazów bliskoznacznych itd.
Rodzaje kwalifikatorów • Kwalifikatory chronologiczne: daw., przestarz. • Kwalifikatory frekwencyjne: rzadziej • Kwalifikatory dotyczące zasięgu użycia innego niż zasięg czasowy • Zasięg sytuacyjny/stylistyczny: książk., pot., urzęd., • zasięg geograficzny: białost., krak., lubel. • zasięg środowiskowy: młodz., przestęp., • Kwalifikatory specjalistyczne, odsyłające do dziedziny działalności ludzkiej, w tym wiedzy fachowej lub nauki: - odsyłające do konkretnej dziedziny: anat., archeol., med., bank., bibliot., biol., biznes., chem., ekon., filoz., geogr., inform., zool., itd. - Odsyłające do grupy dziedzin: techn., nauk., kultur., • Kwalifikatory ekspresywne, informujące o treści emocjonalno- wartościującej jednostki: pogard., pejorat., wulg., żart., iron. (Kurkiewicz 2007, 44-45)
Słownik języka polskiego pod red. Mieczysława Szymczaka (1978) • Najpopularniejszy ogólny słownik dostępny w licznych wariantach • 3 tomy • zawiera około 80 000 haseł: wyrazy używane powszechnie, terminy specjalistyczne. • Podaje także frazeologię, przykłady użycia, informacje fleksyjne , kwalifikatory zakresowe i stylistyczne, najważniejsze synonimy i informacje etymologiczne.
Słownik współczesnego języka polskiego pod red. Bogusława Dunaja (1996) • słownik jednotomowy • obejmuje ponad 62 000 haseł • uwzględniono w nim słownictwo specjalistyczne (tylko najbardziej rozpowszechnione). • zawiera niektóre wyrazy potoczne i środowiskowe, słownictwo dawne, dotyczące realiów i kultury wcześniejszych epok i sporo wyrazów nowych
Nowy słownik języka polskiego PWN pod red. Mirosława Bańki (2000) • jednotomowy • obejmuje objaśnieniami około 100 000 jednostek leksykalnych • Każda jednostka leksykalna jest zaopatrzona w informację gramatyczną, rejestr synonimów i antonimów w postaci przypisów na marginesach, oraz informacje z zakresu pragmatyki językowej. • Innowacją są kontekstowe definicje, formułowane naturalną polszczyzną
Uniwersalny słownik języka polskiego pod red. Stanisława Dubisza (2003) • cztery tomy • koncentruje się na opisie słownictwa polszczyzny ogólnej drugiej połowy XX w. • obejmuje ok. 100 000 jednostek hasłowych oraz kilkaset tysięcy zestawień terminologicznych, frazeologizmów i przysłów • Wprowadza wiele nowego – opis słownictwa wg zasady klasyfikacji na nacechowane i nienacechowane, podawanie podstaw etymologicznych wyrazów pochodzenia obcego, definiowanie treści przysłów, podawanie schematów typowych połączeń składniowych, informacji dotyczących pisowni, wymowy i pragmatyki. Szeroko uwzględnia słownictwo potoczne, wtręty o genezie obcojęzycznej, formy najczęściej stosowanych skrótowców.
Popularny słownik języka polskiego (2007) • zawiera 30 000 podstawowych, używanych na co dzień wyrazów i zwrotów a także wybrane związki frazeologiczne oraz wskazówki poprawnościowe • dobór i opracowanie haseł jest wynikiem pracy zespołu językoznawców Uniwersytetu Jagiellońskiego pod kierunkiem Bogusława Dunaja
Nowy słownik poprawnej polszczyzny pod red. Andrzeja Markowskiego (1999) • jednotomowy • ok. 31 000 haseł • największy słownik poprawnościowy, oprócz ułożonych alfabetycznie haseł z objaśnieniem poprawnego użycia i wskazaniem najczęstszych błędów zawiera artykuły przeglądowe dotyczące różnych zagadnień poprawnościowych • W osobny blok wydzielone nazwy geograficzne skróty i skrótowce i nazwiska
Inny słownik języka polskiego pod red. Mirosława Bańki (2000) • Ok. 100 000 jednostek • Obszerny ogólny słownik języka polskiego • wyróżnia się innym od tradycyjnego sposobem definiowania znaczenia słów (sposób ten może być szczególnie przydatny m. in. w nauce języka polskiego przez cudzoziemców)
Praktyczny słownik współczesnej polszczyzny pod red. Haliny Zgółkowej (1994) • Wydawany od 1994, 50 tomów • prezentuje zasób leksykalny znajdujący już opis we wcześniejszych opracowaniach i sumujący rejestr słownictwa polskiego końca XX w. • zawiera sporo słów obcego pochodzenia • adresowany do najszerszego kręgu odbiorców
Wielki słownik języka polskiego • trwają nad nim prace – polszczyzna po 1945 r. (Żmigrodzki, Przybylska) • Tylko w wersji elektronicznej • Źródłem komputerowe korpusy języka polskiego
Internetowe korpusy języka polskiego • Korpus językowy to zbiór tekstów, w którym szukamy typowych użyć słów i konstrukcji oraz innych informacji o ich znaczeniu i funkcji. Bez dostępu do korpusu nie da się dziś prowadzić badań językoznawczych, pisać słowników ani podręczników języków obcych, tworzyć wyszukiwarek uwzględniających polską odmianę, tłumaczy komputerowych ani innych programów zaawansowanej technologii językowej. • Narodowy Korpus Języka Polskiego (NKJP) • Korpus Języka Polskiego Wydawnictwa Naukowego • Korpus IPI PAN
Narodowy korpus języka polskiego (NKJP) • wspólna inicjatywa Instytutu Podstaw Informatyki PAN, Instytutu Języka Polskiego PAN, Wydawnictwa Naukowego PWN oraz Zakładu Językoznawstwa Komputerowego i Korpusowego uniwersytetu Łódzkiego • korpus referencyjny polszczyzny wielkości kilkuset milionów słów • Lista źródeł korpusu zawiera nie tylko klasykę literatury polskiej, ale też prasę codzienną i specjalistyczną, nagrania rozmów, teksty ulotne i internetowe. Zróżnicowanie tematyczne i gatunkowe tekstów, dbałość o reprezentację rozmówców obu płci, w różnym wieku i z różnych regionów, są dla wiarygodności korpusu równie ważne jak jego wielkość. • Dwie wyszukiwarki – konkordancje i kolokacje • http://www.nkjp.uni.lodz.pl/
Korpus Języka Polskiego Wydawnictwa Naukowego • Wydawnictwo Naukowe PWN przygotowało i udostępniło sieciową wersję Korpusu Języka Polskiego PWN wielkości 40 milionów słów. • Korpus składa się z fragmentów 386 różnych książek, 977 numerów 185 różnych gazet i czasopism, 84 nagranych rozmów, 207 stron internetowych oraz kilkuset ulotek reklamowych. • Pełna wersja sieciowa korpusu jest dostępna odpłatnie, a bezpłatnie wersja demonstracyjna wielkości ponad 7,5 miliona słów na stronie: • http://korpus.pwn.pl/
Korpus IPI PAN • Korpus IPI PAN jest dużym (obecnie ponad 250 mln segmentów), anotowanym morfosyntaktycznie, publicznie dostępnym korpusem języka polskiego, stworzonym przez Zespół Inżynierii Lingwistycznej w Instytucie Podstaw Informatyki PAN, w ramach projektów Komitetu Badań Naukowych oraz w ramach badań statutowych IPI PAN. • http://korpus.pl/
Český národní korpus (ČNK) • je akademický projekt zaměřený na budování rozsáhlého počítačového korpusu především psané češtiny. Pracuje na něm Ústav Českého národního korpusu na Filozofické fakultě Univerzity Karlovy v Praze (ÚČNK). Od svého založení roku 1994 má ÚČNK na starosti budování ČNK, jeho rozvoj a rovněž činnosti související, zvláště v oblasti výuky a pěstování oboru korpusová lingvistika. • Korpusy języka pisanego i mówionego • Pełny opis na stronie: http://ucnk.ff.cuni.cz/
Literatura: Kania S., Tokarski J., 1984, Zarys leksykologii i leksykografii polskiej,Warszawa. Kurkiewicz J., 2007, Kwalifikatory w Wielkim Słowniku języka polskiego, [w:] Nowe Studia Leksykograficzne, pod red. P. Żmigrodzkiego i R. Przybylskiej, Kraków. Lewandowska-Tomaszczyk B. (red.), 2005, Podstawy językoznawstwa korpusowego, Łódź. Piotrowski T., 2001, Zrozumieć leksykografię, Warszawa. Piotrowski T., 2004, Komputerowe korpusy tekstowe polszczyzny. Materiały Zjazdu polonistów, Kraków.