520 likes | 689 Views
Week 3: Syntax van Natuurlijke Taal. Taaltheorie en Taalverwerking. Vorige weken: Formele Talen & Formele Grammatica's. Taaltheorie en Taalverwerking. Nu: Toepassing op Natuurlijke Taal. Taaltheorie en Taalverwerking. Natuurlijke Taal B.v.: Engels. Natuurlijke Taal B.v.: Engels
E N D
Week 3: Syntax van Natuurlijke Taal Taaltheorie en Taalverwerking
Vorige weken: Formele Talen & Formele Grammatica's Taaltheorie en Taalverwerking
Nu: Toepassing op Natuurlijke Taal Taaltheorie en Taalverwerking
Natuurlijke TaalB.v.: Engels Opmerking: Niet alle talen lijken sprekend op 't Engels. Sommige zijn “makkelijker”: Aboriginal-talen (b.v. Warlpiri) , Papoea-talen, Amazone-gebied. Sommige zijn “moeilijker” (b.v.: Nederlands, Züüritüütsch).
Tamelijk unieke taal: nauwelijks morphologie (verbuigingen, vervoegingen, e.d.) vaste woordvolgorde Engels
Jan gaf vanochtend Marie het geld. Jan gaf Marie vanochtend het geld. Jan gaf Marie het geld vanochtend. Vanochtend gaf Jan Marie het geld. * John gave Mary this morning the money. * John gave this morning Mary the money. John gave Mary the money this morning. This morning, John gave Mary the money. Woordvolgorde: Engels vs. Nederlands
Op het dak zag Jan een kat zitten. Jan zag op het dak een kat zitten. Jan zag een kat op het dak zitten. Jan zag een kat zitten op het dak. *On the roof, John saw a cat sitting. * John saw on the roof a cat sitting. * John saw a cat on the roof sitting. John saw a cat sitting on the roof. Woordvolgorde: Engels vs. Nederlands
Contextvrije grammatica's als verantwoording van intuïtieve ideeën over constituentenstructuur. Grammatica voor Engels
S NP VP NP article noun VP copula adjectiveVP verb verb walks article thearticle a noun wumpusnoun boy copula iscopula was adjective deadadjective happy S NP VP article the noun wumpus copula is adjective dead
S NP VP article the noun wumpus copula is adjective dead Hoe verzin je zoiets?
S Hoe verzin je zoiets? NP VP article the noun wumpus copula is adjective dead (1) Teken de intuïtief correcte hiërarchische structuur.
S Hoe verzin je zoiets? NP VP article the noun wumpus copula is adjective dead (1) Teken de intuïtief correcte hiërarchische structuur.(2) Labelling: Constituenten met dezelfde categorie moeten intersubstitueerbaar zijn.
S Hoe verzin je zoiets? NP VP article the noun wumpus copula is adjective dead (1) Teken de intuïtief correcte hiërarchische structuur.(2) Labelling: Constituenten met dezelfde categorie moeten intersubstitueerbaar zijn. Cognitie: Categorie = klasse van intersubstitueerbare woorden.
S Hoe verzin je zoiets? NP VP article the noun wumpus copula is adjective dead (1) Teken de intuïtief correcte hiërarchische structuur.(2) Labelling: Constituenten met dezelfde categorie moeten intersubstitueerbaar zijn. (3) Linguïstische conventies. [Bestudeer Jurafsky & Martin, Russell & Norvig, ppt-slides van het hoorcollege, uitwerkingen van het werkcollege.]
S NP VP NP article de noun man verb ziet proper-noun Marie Linguïstische conventies: NP: analogie tussen "de man" en "Marie" VP: analogie tussen "ziet Marie" en "loopt"
S NP VP NP article de noun man verb ziet proper-noun Marie adverb niet Fout.
S NP VP NP article de noun man verb ziet proper-noun Marie adverb niet Fout.Constituenten met hetzelfde label moeten intersubstitueerbaar zijn.
S NP VP NP article de noun man verb ziet proper-noun Marie adverb niet Beter.
S VP NP VP NP article de noun man verb ziet proper-noun Marie adverb niet Nog beter.
Martin & Jurafsky 9.4 The Noun Phrase Lexicale NP's: Eigennamen: NP ProperNoun Voornaamwoorden: NP Pronoun Complexe NP's: bestaat typisch uit een Lidwoord (Determiner) gevolgd door een zelfstandig naamwoord (Noun). Daartussen en daarachter kunnen nog allerlei optionele constituenten staan. NP DetP (Card) (Ord) (AP) Noun DetP the | all | all the | many of the | Card 1 | 2 | 3 Ord first | second | last AP Adj | Adv Adj Voorbeeld: "The 3 first very early flights"
M&J 9.4 The Noun Phrase Lexicale NP's: Eigennamen: NP ProperNoun Voornaamwoorden: NP Pronoun Complexe NP's: bestaat typisch uit een Lidwoord (Determiner) gevolgd door een zelfstandig naamwoord (Noun). Daartussen en daarachter kunnen nog allerlei optionele constituenten staan. NP DetP (Card) (Ord) (AP) Nominal Nominal Noun | Noun Nominal Voorbeeld: "The 3 first morning flights"
M&J 9.4 The Noun Phrase Lexicale NP's: Eigennamen: NP ProperNoun Voornaamwoorden: NP Pronoun Complexe NP's: bestaat typisch uit een Lidwoord (Determiner) gevolgd door een zelfstandig naamwoord (Noun). Daartussen en daarachter kunnen nog allerlei optionele constituenten staan. NP DetP (Card) (Ord) (AP) Nominal Nominal Noun | Noun Nominal | Nominal PP PP Prep NP Prep on | in | at | to | from Voorbeeld: "The 3 first morning flights to Dallas"
M&J 9.2 Context-Free Rules and Trees VP-regels: zie voorbeeldgrammatica L0:Lexicon:Structurele regels:
M&J 9.3 Sentence-Level Constructions declarative sentences S NP VP B.v.: "I prefer a morning flight" "They list all flights from Burbank to Denver" imperative sentences (bevelen, opdrachten, suggesties) S VP B.v.: "Show me the lowest fare" "List all flights from Burbank to Denver"
M&J 9.3 Sentence-Level Constructions • yes-no questions S Aux NP VP ? Voorbeelden: • "Do these flights go to Denver?" • "Can you give me the same information for KLM?" • wh-questions S WhNP VP ? Voorbeelden: • "What airlines fly from Burbank to Denver?" • "Which flights serve breakfast?" S WhNP Aux NP VP ? Voorbeeld: • "What flights to Denver doyou have tomorrow?"
M&J 9.3 Sentence-Level Constructions • yes-no questions S Aux NP VP ? Voorbeelden: • "Do these flights go to Denver?" • "Can you give me the same information for KLM?" • wh-questions S WhNP VP ? Voorbeelden: • "What airlines fly from Burbank to Denver?" • "Which flights serve breakfast?" S WhNP Aux NP VP ? [Nog niet helemaal goed: incomplete VP!] Voorbeeld: • "What flights to Denver doyou have tomorrow?"
S NP VP NP proper-noun NP article noun VP verb verb loopt | lopen noun hond | honden article alle | elke | vier Jan loopt de honden lopen
S NP VP NP proper-noun NP article noun VP verb verb loopt | lopen noun hond | honden article alle | elke | vier Jan loopt de honden lopen Jan lopen de honden loopt
S NP VP NP proper-noun NP article noun VP verb verb loopt | lopen noun hond | honden article alle | elke | vier Jan loopt de honden lopen Jan lopen de honden loopt NP's: elke honden alle hond vier hond
S NPsing VPsing S NPplur VPplur NPsing proper-noun NPsing articlesing nounsingNPplur articleplur nounplur VPsing verbsing VPplur verbplur verbsing loopt verbplur lopen nounsing hond nounplur honden articlesing elke articleplur alle | vier Jan loopt de honden lopen Jan lopen de honden loopt NP's: elke honden alle hond vier hond elke hond loopt alle honden lopen
S NPsing VPsing S NPplur VPplur NPsing proper-noun NPsing articlesing nounsingNPplur articleplur nounplur VPsing verbsing VPplur verbplur Jan loopt de honden lopen Jan lopen de honden loopt NP's: elke honden alle hond vier hond elke hond loopt alle honden lopen Nadeel: Duplicatie van regels.
Nadeel: Duplicatie van regels. Nog meer zulke syntactische attributen: 1e, 2e, 3e persoon: "ik loop" vs. "Jan loopt" onzijdig vs. mannelijk/vrouwelijk: "elk kind" vs. "elke hond" telbaar vs. niet-telbaar: "veel wijn" vs. "veel hond" S NPsing VPsing S NPplur VPplur NPsing proper-noun NPsing articlesing nounsingNPplur articleplur nounplur VPsing verbsing VPplur verbplur
Nadeel: Duplicatie van regels. Nog meer zulke syntactische attributen: 1e, 2e, 3e persoon: "ik loop" vs. "Jan loopt" onzijdig vs. mannelijk/vrouwelijk: "elk kind" vs. "elke hond" telbaar vs. niet-telbaar: "veel wijn" vs. "veel hond" Naarmate we meer zulke onderscheidenintroduceren, neemt het aantal regels exponentieel toe. S NPsing VPsing S NPplur VPplur NPsing proper-noun NPsing articlesing nounsingNPplur articleplur nounplur VPsing verbsing VPplur verbplur
Daarom: feature-grammatica's (unification grammars, augmented CFG's, Definite Clause Grammars (DCG's)) S NPsing VPsing S NPplur VPplur NPsing proper-noun NPsing articlesing nounsingNPplur articleplur nounplur VPsing verbsing VPplur verbplur S NP (x) VP (x) NP (sing) proper-noun NP (x) article (x) noun (x) VP (x) verb (x) Cf. Prolog-unificatie: Feature-agreement ("congruentie") & feature-percolation (inheritance)
S NP [nr:x, person:y] VP [nr: x, person: y] NP [nr: sing] proper-noun NP [nr: x] article [nr: x, count:y] noun [nr: x, count:y] VP [nr: x, person: y] V1 [nr: x, person: y] article [nr: sing, count: +] a | one | some article [nr: plural, count: +] 3 | many article [nr: x, count: +] some article [nr: sing, count: x] some article [nr: sing, count: -] much article [nr: plural, count: -] 3 liters of N [nr: sing, count: +] boy N [nr: plural, count: +] boys N [nr: x, count: -] wine
The Verb Phrase and Subcategorization Subcategorization frame: list of complements that the verb selects for. Voorbeelden: vp --> verb. disappear * want vp --> verb, np. prefer a morning flight * disappear a morning flight vp --> verb, np, pp. put a book on the table * disappear a book on the table vp --> verb, vp. want to fly to Orlando * find to fly to Orlando
Implementing subcategorization: just like the agreement feature • encode subcategorization form in non-terminal name (larger grammar) • encode subcategorization in extra argument (smaller grammar)
Slechts één "regel" voor VP: VP V[subcat: (X1, ..., Xn)] X1 ... Xn N.B.: Regelschema!
B.v.: S NP VP VP V1 V2 NP V3 NP PP NP DET N PP PREP N DET every | a N man | table PREP on | under V1 walks | talks V2 loves | sees V3 puts
wordt: S NP VP VP V1 V2 NP V3 NP PP NP DET N PP PREP N DET every | a N man | table PREP on | under V1 walks | talks V2 loves | sees V3 puts S NP VP VP V[subcat: (X1, ..., Xn)] X1 ... Xn NP DET N PP PREP N DET every | a N man | table PREP on | under V [subcat: ()] walks | talks V [subcat: (NP)] loves | sees V [subcat: (NP PP)] puts
Wh-Questions Revisited • Transformationele Grammatica
Wh-Questions • "Which boys does Mary see?"
M&J 9.3 Sentence-Level Constructions yes-no questions S Aux NP VP ? Voorbeelden: "Do these flights go to Denver?" "Can you give me the same information for KLM?" wh-questions S WhNP VP ? Voorbeelden: "What airlines fly from Burbank to Denver?" "Which flights serve breakfast?" S WhNP Aux NP VP ? [Nog niet goed: VP moet incompleet zijn!] Voorbeeld: ”What flights do these flights go to Denver?" "What flights to Denver doyou have some flights tomorrow?"
Which boys does Mary see? Which boys does Mary see [ ]? Does Mary see John?
Which boys does Mary see? Which boys does Mary see [ ]? Which boys does Peter think Mary sees [ ]? Does Peter think Mary sees John? Does Peter think Mary sees which boys?
Noam Chomsky: Transformationele Grammatica. • CFG genereert “diepte-structuur”: “Does Mary see which boys?” • Transformatie-regel sleept “which boys” naar voren. Which boys does Mary see [ ]? Which boys does Peter think Mary sees [ ]?