340 likes | 514 Views
Linguistische Grundlagen. Repräsentationsformen Dependenz Konstituenz Merkmalstrukturen Modelle Dependenzgrammatik Kategorialgrammatik Phrasenstrukturgrammatik – Transformationen Unifikationsgrammatiken. Dependenz.
E N D
Linguistische Grundlagen Repräsentationsformen Dependenz Konstituenz Merkmalstrukturen Modelle Dependenzgrammatik Kategorialgrammatik Phrasenstrukturgrammatik – Transformationen Unifikationsgrammatiken
Dependenz • Eine Dependenzgrammatik (DG) ist eine Grammatik, in der die syntaktische Struktur primär in Form von Dependenzrelationen (Abhängigkeitsbeziehungen) zwischen den Basiselementen (den Wörtern) ausgedrückt wird. • Eine Dependenzrelation ist eine zweistellige gerichtete Relation zwischen zwei Elementen der gleichen Strukturebene in einem Satz. Eines der Elemente (das Dependens) hängt morphologisch, syntaktisch oder semantisch von dem anderen (dem Regens) ab.
Dependenzgrammatik • Der Begriff der Abhängigkeit findet sich bereits in den Arbeiten der frühesten bekannten Grammatiker, z.B. der griechischen Gelehrten Thrax und Apollonius und danach Römischer Gelehrter wie Priscian. • Der Dependenzbegriff findet sich auch in den Schriften Europäischer Gelehrter des Mittelalters, insbesondere bei den Modisten und Vertretern der spekulativen Grammatik, so z.B. bei Thomas von Erfurt. • Die wichtigste Rolle in der Entwicklung der DG spielte jedoch Lucien Tesnière, der als erster Sprachwissenschaftler einen Formalismus zur Darstellung von Dependenzstrukturen herausgearbeitet hat. Seine Ideen wurden in dem 1959 posthum erschienenen Werk Eléments de syntaxe structurale dargelegt. • Viele Arbeiten zur Dependenzgrammatik in den USA in den sechziger Jahren zielten darauf ab, Probleme der maschinellen Übersetzung zu lösen. • Nach einer Pause von 20 Jahren, in der nur in wenigen MÜ-Projekten DG verwendet wurde, lebte das Interesse in den 1980 Jahren wieder auf. Es entstanden mehrere größere Projekte, die DG verwendeten, darunter EUROTRA und DLT.
a with book tall very hair this boring grey Dependenz A very tall professor with grey hair wrote this boring book professor wrote book professor wrote
Dependenz A very tall professor with grey hair wrote this boring book N(professor) V(wrote) D(a) P(with) N(book) A(tall) Adv(very) N(hair) D(this) A(boring) A(grey)
Dependenz N V D P N A Adv N D A A A very tall professor with grey hair wrote this boring book
Dependenz Fin N V D P N A Adv N D A A A very tall professor with grey hair wrote this boring book
Dependenzregeln • Fin N * V • N D (A) * (P) • V * (N) (N) (P) • P * N • A Adv * • D {a, this} • N {professor, hair, book …} • V {wrote, … } • A {tall, boring, …} • P {with, … }
Satz NP VP NP PP AP AP NP Eine regierende Kategorie X zusammen mit allen abhängigen konstituiert eine X-Phrase (XP), wobei X = N, V, A, P Dependenz Fin N V D P N A Adv N D A A A very tall professor with grey hair wrote this boring book
Konstituentenregeln (Phrasenstrukturregeln) • S NP VP • NP D (AP) N (PP) • VP V (NP)(PP) • PP P NP • AP Adv A • D {a, this} • N {professor, hair, book …} • V {wrote, … } • A {tall, boring, …} • P {with, … }
Phrasenstruktur- und Transformationsgrammatik • PSG und TG sind beides Grammatikformalismen, die im wesentlichen aus dem Forschungsrahmen der generativen Grammatik (im engeren Sinne) entstammen (Chomsky). • Entwicklung: • Die bis in die 50er Jahre zurückreichende generative Grammatik hat über die Zeit verschiedene Entwicklungsstufen durchlaufen. • Die mit diesem Ansatz assoziierten Grammatikmodelle haben entsprechend unterschiedliche Bezeichnungen: • Standardtheorie (60er Jahre) • Rektions- und Bindungstheorie (80er Jahre) • Minimalist Program (90er Jahre bis heute). • Obwohl steter und z.T. drastischer Modifikation unterzogen, haben sich doch bestimmte grammatiktheoretische Annahmen konstant gehalten.
Generative Transformationsgrammatik • Die Konstrukte 'Oberflächen-' und 'Tiefenstruktur', die bereits in den Anfängen der generativen Grammatik Verwendung fanden, finden sich - in modifizierter Form, z.B. mit leicht unterschiedlicher Funktion - auch in modernen Theorievarianten wieder. • Das verbindende Element zwischen der Oberflächen- und der Tiefenstruktur sind die Transformationen, die eine gegebene TS in eine OS überführen.
GTG – Standardtheorie • In der Standardtheorie ist man davon ausgegangen, daß jeder Satz über zwei Strukturebenen verfügt: die Ebene der Tiefenstruktur und die Ebene der Oberflächenstruktur. Grund für diese Annahme waren ua. sprachliche Phänomene wie die Beziehung Aktiv/Passiv: hier wird derselbe außer-sprachliche Sachverhalt in zwei verschiedenen Formen wiedergegeben. • John kicked the dog / The dog was kicked by John • Solche Sätze wurden zueinander in Beziehung gesetzt, indem die unter-schiedlichen Oberflächenstrukturen aus einer gemeinsamen Tiefenstruktur abgeleitet wurden. Diese TS wurde in Form eines Phrasemarkers repräsentiert, der selber das Ergebnis der Anwendung von Phrasenstrukturregeln war. • In anderen Fällen verhielt es sich umgekehrt: zwei gleiche Oberflächenstrukturen entsprangen unterschiedlichen Tiefenstrukturen. Dieses ist beispielsweise bei struktureller Mehrdeutigkeit der Fall: • The boy tied the man with a tie
Basiskomponente PS–Regeln Lexikon Lexikonregel Strikte Subkategorisierung semantische Repräsentation semantische Komponente Tiefenstruktur Transformations-komponente Transformations-regeln phonologische Repräsentation Oberflächen-struktur phonologischeKomponente Architektur der GTG
Kategorialgrammatik Der Terminus 'Kategorialgrammatik' umfaßt eine ganze Reihe von Theorien über algorithmische Verfahren zur syntaktischen und semantischen Analyse von Sätzen. Entwicklung: • Anfänge in den 20er Jahren (Lesniewski, Ajdukiewicz) • erste Anwendung auf natürliche Sprachen in den 50er Jahren (Bar-Hillel) • verlor in den 60er Jahren stark an Bedeutung • neues Interesse an kategorialgrammatischen Ansätzen in den 70er Jahren (Stichwort: Montague-Grammatik, ROSETTA) • stete Erweiterung und Modifikation seit Mitte der 80er Jahre(Steedman)
Kategorialgrammatik • Grundelemente der KG sind die KATEGORIEN, die sich jedoch bezüglich ihrer Form und ihres Informationsgehaltes fundamental von 'herkömmlichen' Kategorien (N, V, PP, AP usw.) unterscheiden. • Kerngedanke hinter der Struktur der Kategorien ist die Annahme, bestimmte syntaktische und semantische Information, die mit einem Lexem verbunden ist, direkt in der Kategorie zu kodieren. Beispiel: • einem intransitiven Verb, wie z.B. died, würde in der Kategorialgrammatik eine Kategorie zugewiesen, aus der klar ablesbar ist, daß sich dieser Ausdruck zusammen mit einem NP-artigen Ausdruck zu einem Satz verbindet.
Kategorialgrammatik • Die klassische Kategorialgrammatik kennt zwei Basiskategorien: S und N. • Diese Basiskategorien können über die folgende Regel zu einer komplexen Kategorie kombiniert werden: • wenn A eine Kategorie ist und B eine Kategorie ist, dann ist auch A/B eine Kategorie. • Damit wären als Kategorien etabliert: S/N und N/S. • Da eine komplexe Kategorie aber selber wieder Input für eine komplexe Kategeorie sein kann, ist das kategoriebildende Potential einer KG praktisch unbegrenzt:
Regel der KG • Auf der Basis dieser Kategorien reicht eine einzige Syntax-Regel, um Phrasen bzw. Konstituenten abzuleiten. • Diese Regel wird Funktionsanwendung genannt und hat die folgende Form: • Ist a von der Kategorie A/B und b von der Kategorie B, dann ist ab von der Kategorie A • Ist a von der Kategorie A und b von der Kategorie A\B, dann ist ba von der Kategorie A. • (Tip: die Multiplikation eines Bruches mit dem Wert des Nenners ergibt den Zähler: 1/2 x 2 = 1; 3/8 x 8 = 3 usw.) • Beispiel: John (ein Eigenname) ist von der Kategorie N, jumped (ein intransitives Verb) ist von der Kategorie S\N. Nach der zweiten Regel gilt dann: John jumped ist von der Kategorie S (ein Satz).
Kategorie - Funktionsanwendung Definition 'Kategorie: • Es gibt eine endliche Menge von Basiskategorien, z.B. N (= Name) und S (= Satz) • Es gibt einen Operator in den beiden Ausprägungen '/' und '\'. • Jede Basiskategorie ist eine Kategorie • Wenn A und B Kategorien sind, sind auch A/B und A\B Kategorien Regel: Funktionsanwendung • Wenn x von der Kategorie A/B ist und y von der Kategorie B dann ist xy von der Kategorie A • Wenn x von der Kategorie A\B ist und y von der Kategorie B dann it yx von der Kategorie A.
Basiskategorien Det (a, this) Appelativa (professor, hair, book) Adjektive (tall, grey, boring) Gradadverb (very) Transitives Verb (wrote) Präposition (with) S und N N/(N/N) N/N (N/N)/(N/N) ((N/N)/(N/N))/((N/N)/(N/N)) (S\N)/N ((N/N)\(N/N))/N Lexikon Zur Beschreibung unseres Satzes a very tall professor with grey hair wrote this boring book benötigen wir folgende Kategorien:
N/(N/N) ? N/(N/N) (N/N)/(N/N) N/N ((N/N)\(N/N))/N (N/N)/(N/N) N/N (S\N)/N N/(N/N) (N/N)/(N/N) N/N ((N/N)/(N/N))/((N/N)/(N/N)) (N/N)/(N/N) N/N N/N (N/N)\(N/N) N/N N N/N S\N N S Parsing mit KG a very tall professor with grey hair wrote this boring book
Kategorialgrammatik • Wesentliche Merkmale einer KG: • synchroner Aufbau von syntaktischer und semantischer Strukturbeschreibung • Kodierung syntaktischer/semantischer Information in den Kategorien. • Die Art der Kategorisierung lexikalischer und syntaktischer Kategorien hat Auswirkungen auf das Verhältnis zwischen den einzelnen Komponenten der Grammatik. • Die traditionelle KG kommt mit einer einzigen Syntax Regel aus. Durch diesen radikalen Lexikalismus, hier also die Angabe der syntaktischen Merkmale eines Lexems bereits im Lexikon, wäre es redundant, diese Art der Restriktion nochmals durch Syntax Regeln zu erfassen. • Der Nachteil aber ist, daß die Kategorienkomponente, wie gesehen, extrem aufgebläht werden muß, um den möglichen syntaktischen Kombinationen, die ein lexikalisches Element eingehen kann, Rechnung zu tragen.
Unifikationsgrammatiken • Unifikationsgrammatik steht für eine Reihe moderner Grammatikformalismen, bei denen Merkmalstrukturen und deren Unifikation für die Ableitung grammatisch korrekter Formen eine zentrale Rolle spielt. • Dazu gehören u.a. • die LFG (= Lexical-Functional Grammar) • die GPSG (= Generalized Phrase Structure Grammar) • die HPSG (=Head-Driven-Phrase-Structure Grammar)
Merkmalstrukturen Eigenschaften linguistischer Objekte (Linguistische Elemente wie z.B. Wörter oder Phrasen) werden in einer Unifikationsgrammatik als Bündel von Merkmalen verstanden. Diese Merkmalstrukturen haben die Form von Attribut-Wert Paaren, wobei die Werte entweder atomare Symbole oder aber selber wieder Merkmalstrukturen sein können.
Unifikation Unifikation ist eine formale Operation, bei der zwei kompatible Merkmalsstrukuren zu einer neuen Merkmalsstruktur vereinigt werden können:
Unifikation Stimmen allerdings die Werte jeweils gleicher Attribute nicht überein, können die Merkmalstrukturen nicht unifiziert werden:
LFG • Erste Anfänge der LFG finden wir Ende der siebziger Jahre (Bresnan, Kaplan), z.T. motiviert aus der Kritik an der damaligen Modellvariante der generativen Transformationsgrammatik. • Im Unterschied zu selbiger haben in der LFG z.B. die grammatischen Funktionen den Status von Grundbegriffen, sind also nicht aus bestimmten Strukturen abgeleitet. • Phänomene, die in der TG über Transformationen erklärt wurden, werden hier als primär lexikalisch behandelt und also durch entsprechende Lexikoneinträge bzw. lexikalische Regeln beschrieben. • In einer LFG werden zwei Ebenen der syntaktischen Repräsentation unterschieden: • die C- (=Constituent)-Structure und die • F(=Functional)-Structure • Diese werden parallel über die Phrasenstrukturregeln der Grammatik erzeugt werden.
Prädikaten-Logik Präsuppositions-Logik Sprechakt-Theorie Funktionale Satz-Perspektive InterpretativeSemantik GenerativeSemantik KasusGrammatik Lexikalisch-FunktionaleGrammatik RelationaleGrammatik Erweiterte Standard-Theorie Standard Theorie
Grammatik Erweiterte PSG Grammatik Lexikon Lexikonregeln K-Strukturen F-Strukturen semantische Interpretation phonologischeInterpretation semantische Repräsentation phonologische Repräsentation Architektur der LFG
F-Strukturen in LFG • Die F-Struktur ist eine Merkmalsstruktur, deren Attribute sowohl die grammatischen Funktionen (SUBJ, PRED) wie auch morphosyntaktische Merkmale wie z.B. CASE, NUM oder TENSE umfassen.
Transfer mit F-Strukturen John likes the dog Der Hund gefällt John (PRED) = 'like <(SUBJ:$1) (OBJ:$2)>' ß Transfer Ý (PRED) = 'gefallen <(SUBJ:$2) (OBJ:$1)>'
Transfer mit F-Strukturen TRANSFER
Spec [Det Indef] Mod Spec [PRED 'very'] PRED 'tall' PRED 'professor' Qual PRED 'with' Obj Mod [PRED 'grey'] PRED 'hair' F-Struktur Subj PRED 'write <(Subj)(Obj)>' Tense Past Obj Spec [ ] Mod [PRED 'boring'] PRED 'book'