340 likes | 464 Views
NOWA DEFINICJA FORMALNA POLSKIEJ FRAZY NOMINALNEJ IPIPAN * 21.01.2008. Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego Instytut Języka Polskiego UW e- mail : m .r. swidz inski @ uw. edu.pl Konsultacje: śr 14.00-15.00, pok. 1 Adres internetowy: www.mswidz.republika.pl.
E N D
NOWA DEFINICJA FORMALNAPOLSKIEJ FRAZY NOMINALNEJIPIPAN * 21.01.2008 Prof. dr hab. Marek Świdziński Zakład Językoznawstwa Komputerowego Instytut Języka Polskiego UW e-mail: m.r.swidzinski@uw.edu.pl Konsultacje:śr 14.00-15.00, pok. 1 Adres internetowy: www.mswidz.republika.pl
Program • Cel • Motywacja • (Pre)historia • Dziury i błędy w opisie fno • fno: co to jest? • Format i parametry • Przykładowe reguły • Rozwiązanie I: jałowa rekursja • Rozwiązanie II: realizacje atrybutywne • Rozwiązanie III: opis przecinka • Luźne końce…
Cel • Prezentacja projektu przebudowy GFJP. • „Łóżko testowe”: opis jednej jednostki składniowej. • Pokaz gotowych rozwiązań kilku problemów teoretycznych i praktycznych.
Motywacja • GFJP była / jest testowana (Świgra). • GFJP musi być poprawiona / rozbudowana (?). • Dlaczego nie napisać GFJP lepiej? • Zacząć od jakiejś jednostki składnikowej. • fno: • fraza (jednostka prostsza niż zdaniowa); • nominalna (jednostka ważna, częsta w tekstach, strukturalnie bogata); • jednostka „oddolna”.
(Pre)historia (1) • Szpakowicz, S., Świdziński, M.: Formalna definicja równorzędnej grupy nominalnej we współczesnej polszczyźnie pisanej. Warszawa 1981. 74. Maszynopis powielony. Również w: Studia gramatyczne t. IX, Wrocław 1990. 9-54. • Świdziński, M.: Gramatyka formalna języka polskiego, Warszawa 1992. • Świdziński, M., Derwojedowa , M., Rudolf, M.: „A computational account of multi-word numeral phrases in Polish”. Linguistik International Band 10. Investigations into Formal Slavic Linguistics. Contributions of the FDSL IV. Frankfurt am Main i in. 2003. 405-415.
(Pre)historia (2) • Świdziński, M., Derwojedowa , M., Rudolf, M.: „Two formal approaches to Polish numeral phrases implemented”. Studia z gramatyki i leksykologii języka polskiego. Red. M. Gębka-Wolak, I. Kaproń-Charzyńska, M. Urban. Toruń 2003. 93-108. • Woliński, M.: Komputerowa weryfikacja gramatyki Świdzińskiego. Rozprawa doktorska. IPI PAN: Warszawa 2005. • Świdziński, M.: „A DCG account of Polish relative constructions”. [W:] Human Language Technologies as a Challenge for Computer Science and Linguistics. Proceedings of the 3rd L&T Conference, October 5-7, 2007, Poznań, Poland. Poznań 2007. 478-482.
(Pre)historia (3) • Świdziński, M., Woliński, M.: „Towards a new version of the formal grammar of Polish: the NP redefined”. [W:] Formal Description of Slavic Languages FDSL-7. University of Leipzig, 30 November – 2 December, 2007. Book of Abstracts, Leipzig 2007. 101-103.
Dziury i błędy w opisie fno (1) • Brak definicji fraz z koordynacją. • Brak definicji fraz z liczebnikiem. • Brak definicji fraz liczebnikowych. • ………….
Dziury i błędy w opisie fno (2) Są to także błędy ogólne!!! • Mechanizm jałowej rekursji. • Realizacja przymiotnikowa fno. • Opis przecinka.
Dziury i błędy w opisie fno (3) 1. Jałowa rekursja • Hierarchia kanoniczna: • Fraza nominalna (FNO) • Konstrukcja nominalna z dopełniaczem (KNODOP) • Konstrukcja nominalna z frazą przyimkową (KNOPM) • Konstrukcja nominalna z atrybutem (KNOATR) • Konstrukcja nominalna z inkorporacją (KNOINK) • Konstrukcja nominalna (KNOM)
Dziury i błędy w opisie fno (4) • FNO = KNODOP FZD • KNODOP = KNOPM FNO • …………….. • KNOM = FNO • KNOM (p, rl, o, neg, z, kl) = FNO (p, rl, o, neg, NI, z, kl). (NO48)
Dziury i błędy w opisie fno (5) 2. Realizacja przymiotnikowa fno • FNO = KNODOP FZD • KNODOP = KNOPM FNO • …………….. • KNOATR = FPT • …………….. KNOATR (p, rl, 3, neg, i, z, kl) = FPT (p, rl, st, neg, i, z, kl). (NO38)
Dziury i błędy w opisie fno (6) 3. Opis przecinka • Przecinek jako jednostka składniowa – duży problem ogólny: • wielofunkcyjność słowa , • wielomotywacyjność wystąpień przecinka ortograficznego • opcjonalność w pewnych kontekstach • W GFJP – przecinek pusty międzyspójnikowy: % Wiem, że jeśli przyjdą, umrę. % * Wiem, że, jeśli przyjdą, umrę.
fno: co to jest? (1) • Występuje jako realizacja lub składnik: • frazy wymaganej, • frazy luźnej, • frazy przyimkowo-nominalnej, • frazy nominalnej (w szczególności skoordynowanej), • frazy przymiotnikowej.
fno: co to jest? (2) • Ma różne struktury: • współrzędną • podrzędną • egzocentryczną • Ma różne centra: • rzeczownikowe • liczebnikowe • zaimkowe różnych typów • przymiotnikowe (?) • gerundialne (?)
fno: co to jest? (3) • Ma bogaty zestaw cech gramatycznych: • przypadek • rodzaj • liczba • osoba • klasa (centrum) …….. • Gęsta sieć uzgodnień wewnętrznych i zewnętrznych
Format i parametry (1) fno(P, R/L, O, Neg, I, Pnw, Kl, Tak, Sub, Pk [, Poz]) fnokoor(P, R/L, O, Neg, I, Pnw, Kl, Tak, Sub, Pk [, Poz, Sp])
Format i parametry (2) • P przypadek • R/L rodzaj i liczba • O osoba • Neg negacja • I inkorporacja: bowiem, natomiast, więc, zaś, ni, bp; R/L • Pnwpytajno-niepytajność: npyt, pyt, pz, wz • Kl klasa: rzecz, os, co, kto, który, jaki, nuzg, uzg • Tak taktylowatość: tk, tyle • Sub nad-podrzędność: na, po • Pk przecinkowość końcowa: bp, stan • Poz pozycja: pre, post, egz • Sp oznaczenie spójnika
Format i parametry (3) • Porządek zapisu reguł: • Pnw dowolne • Pnw = pyt • Pnw = npyt • Pnw = wz • Pnw = pz
Przykładowe reguły (1) fno(P, R/L, O, Neg, I, Pnw, Kl, Tak, Sub, Pk) --> s(no#), fno(P, R/L, O, Neg, I, Pnw, Kl, Tak, na, bpk), { rozne(Kl, co) }, fzd(który, nk, A, C, T, Neg2, R/L, po, Pk). % Chłopiec, którego znam, [umarł.] % Chłopiec, którego znam [, który umarł, nie przyjdzie.]
Przykładowe reguły (2) fno(mian, nij/poj, 3, Neg, I, pyt, licz, Tak, Sub, Pk) --> s(no#), fpt(mian, R/L, St, Neg1, I1, Pnw1, Kl1, Tak1, po, Pk1), { oblink(I, I1, I2), oblink(I, I2, I3), oblnegf(Neg, Neg1, Neg2) }, flicz(mian, R/L, O, Neg2, I2, Pnw2, nuzg, Tak2, na, Pk2), fno(dop, R/L, O, Neg3, I3, Pnw3, Kl3, Tak3, po, Pk), { rozne(R, mos), rowne(pyt, Pnw1.Pnw2), rowne(Pnw1, npyt.pyt), rowne(Pnw2, npyt.pyt), rowne(Pnw3, npyt.pyt), obltak(Tak, Tak1, Tak2), rozne(Kl3, licz), obltak(Tak, Tak2, Tak3) }. % Które pięć facetek [było zaproszonych?] % Te pięć z której klasy facetek [przyszło?]
Rozwiązanie I: jałowa rekursja fno przec spoj fno fno spoj fno spoj fno przec spoj fno fnokoor fno fzd <flicz fno> <fno fno(dop,...)> <fno fpm> <fno fpt> fno(...,I,...) spoj(Tsp, I, ni) fno bez podrzędnika [różne realizacje]: formarzecz, zaimpyt, zaimwzg, zaimos,...
Rozwiązanie II: realizacje atrybutywne (1) • Nie ma takiej realizacji ogólnej!!! • Zamiast niej – wyliczanka realizacyj szczegółowych: Pnw dowolne: Przymiotnik fno(P, R/L, 3, Neg, I, Pnw, Kl, Tak, Sub, Pk) --> s(no#), fpt(P, R/L, St, Neg, I, Pnw, Kl, Tak, na, Pk), { rowne(St, wyz.naj) }. % Nowszą od czego [czytano?] % Najnowszej [nie czytano.]
Rozwiązanie II: realizacje atrybutywne (2) Liczebnik porządkowy fno(P, R/L, 3, Neg, I, Pnw, Kl, Tak, Sub, Pk) --> s(no#), flicz_porz(P, R/L, Neg, I, Pnw, Kl, Tak, na, Pk). % Drugiego [widziałem.]
Rozwiązanie II: realizacje atrybutywne (3) Zaimek przymiotny fno(P, R/L, 3, Neg, I, Pnw, Kl, Tak, Sub, Pk) --> s(no#), fno_zaim_przym(P, R/L, Neg, I, Pnw, Kl, Tak, Sub, Pk). % Każdą [lubiłem.] % [Nie znam] żadnej [.] Jest osobna definicja fno_zaim_przym
Rozwiązanie II: realizacje atrybutywne (4) Pnw = wz fno(P, R/L, 3, Neg, I, wz, Kl, Tak, Sub, Pk) --> s(no#), przyimek(Forma, dop), { rowne(Forma, z.spośród) }, fno(dop, R/mno, O, Neg1, I1, wz, Kl1, Tak1, po, Pk1), { oblnegf(Neg, Neg1, Neg2), oblink(I, I1, I2), obltak(Tak, Tak1, Tak2) }, fno_zaim_przym(P, R/L, Neg2, I2, Pnw2, Kl2, Tak2, na, Pk). % [Książek, ] z których żadnej [nie znam, nie czytano.]
Rozwiązanie III: opis przecinka (1) • Problem: % Chłopiec, którego znam, umarł. % * Chłopiec, którego znam umarł. % Umarł chłopiec, którego znam. % * Umarł chłopiec, którego znam,. % Chłopiec, którego znam, który umarł, nie przyjdzie. % Chłopiec, którego znam,, który umarł, nie przyjdzie.
Rozwiązanie III: opis przecinka (2) fno(P, R/L, O, Neg, I, Pnw, Kl, Tak, Sub, Pk) --> s(no#), fno(P, R/L, O, Neg, I, Pnw, Kl, Tak, na, bpk), { rozne(Kl, co) }, fzd(który, nk, A, C, T, Neg2, R/L, po, Pk). Jednostki zawierające przec lub spoj(przec,…) • zdanie (koordynacja!!!) • fw • fl • fno • fpt • fzd
Rozwiązanie III: opis przecinka (3) • W regułach definiujących te jednostki składnik przedprzecinkowy / przedspójnikowo-przecinkowy X dostaje wartość bpk. • W regule definiującej wypowiedzenie jednostka zdanie ma wartość bpk. • Wewnątrz X wartość ta spada na składnik końcowy. • Dla X = fzd są dwie realizacje: • stan – z przec na końcu • bpk – bez przec na końcu • Dla X będącego frazą bez przecinka każda realizacja jest stan.
Rozwiązanie III: opis przecinka (4) % Chłopiec, którego znam [Pk = stan], umarł. % * Chłopiec, którego znam umarł. % Umarł chłopiec, którego znam [Pk = bpk]. % * Umarł chłopiec, którego znam,. % Chłopiec, którego znam [Pk = bpk], który umarł, nie przyjdzie. % Chłopiec, którego znam,, który umarł, nie przyjdzie.
Rozwiązanie III: opis przecinka (5) • Problem przecinka początkowego: rozwiązany przez parametr I (?). % Kto pyta, nie błądzi. % * , Kto pyta, nie błądzi. • Pozostaje problem opisu braku przecinka wewnątrz fzd o pierwszym składniku będącym fzd: % Wiem, że kto pyta, nie błądzi. % * Wiem, że, kto pyta, nie błądzi.
Luźne końce… (1) • Definicja frazy liczebnikowej (banał…). • Porządna definicja fno z koordynacją. • Opis fno egzocentrycznej: % Chłopiec i dziewczyna [przyszli.] egz % My i dziewczyna [przyszliśmy.] egz % [Przyszli] chłopiec i dziewczyna [.] egz % [Przyszliście] chłopiec i wy [.] egz % [Przyszedł] chłopiec i dziewczyna [.] post % [Przyszedł] chłopiec i ktoś jeszcze [.] post % [Przyszedł] chłopiec i dwie dziewczyny [.] post % [Przyszedł] chłopiec i pięć dziewczyn [.] post
Luźne końce… (2) % Chłopiec i ktoś jeszcze [przyszedł.] pre % Chłopiec i dwie dziewczyny [przyszły.] pre % Chłopiec i pięć dziewczyn [przyszło.] pre Ale także: % naszych Jasia i Marysi % kochane Joasiu i dziewczyny % tymi filozofią i matematyką