110 likes | 232 Views
Grundelemente der Dependenzsyntax. Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen Übersetzungssystem ETAP-3 WiSe 2007/2008 16.05.2008 Dozenten: R.Zangenfeind, PD Dr. Franz Guenthner Referentin: Mariya Donska. Einführende Hinweise.
E N D
Grundelemente der Dependenzsyntax Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen Übersetzungssystem ETAP-3 WiSe 2007/2008 16.05.2008 Dozenten: R.Zangenfeind, PD Dr. Franz Guenthner Referentin: Mariya Donska
Einführende Hinweise • Dependenztheorie (dependency theorie) vs. Pharsenstrukturtheorie (phrase-structure theorie) • Ziel: eine künstliche formale Sprache (formalism) für Beschreibung der naturalen Sätzen auf der syntaktischen Ebene vorzuschlagen. • These: Dependenzen sind besser dafür geeignet, um die syntaktischen Strukturen zu beschreiben, als Komponentmethoden.
D-Bäume vs. PS-Bäume 5 Unterschiede (PS vs. D als Methoden der Beschreibung der syntaktischen Struktur): • Bestandteile vs. Dependenzen (hierarchische Bindungen zwischen Elementen, Binärbeziehungen) • Kategorisierung ung Ihre Funktion (syntaktische Klassen als Knoten vs. specielle Namen für syntaktische Funktionen) • Nicht endständige vs. endständige Knoten (D-Bäume: Wortformen&Knoten – one-to-one relations) • Lineare Reihenfolge der Knoten (Linearität vs. 2-Dimensionalität) • Markierung der syntaktischen Rolle (D-Bäume: Schwerpunkt liegt auf detallierter Beschreibung syntaktischer Relationen)
PS-Struktur She lov’d me for the dangers I had pass’d, And I lov’d her that she did pity them (Shakespeare) 61 Knoten für 18 Wörter
D-Struktur She lov’d me for the dangers I had pass’d, And I lov’d her that she did pity them (Shakespeare) 18 Knoten für 18 Wörter
Darstellung der syntaktischen Struktur Non-lexikalische Mitteln syntaktische Relationen auszudrücken: • Lineare Reihenfolge der Wortformen • Prosodie • Morphologie Syntaktische Mitteln der naturalen Sprache müssen aus der Darstellung der SyntS ausgeschlossen werden + die sind doppeldeutig => Darstellung SyntS als: • Menge aller Wortformen, die im Satz vorkommen (genauer D(eep)-Morph(ological) R(epresentations) = DMorphRs der Wortformen) • Menge der n-ary Relationen zwischen Wortformen => Binäre Relationen.
Darstellung der syntaktischen Struktur Vorschlag: Binäre SyntRel zwischen Wortformen als einziges Mittel für Darstellung der syntaktischen Struktur naturaler Sätze zu verwenden. • Antisymmetrisch • Antireflexiv • Antitransitiv • Unterscheidbar (жена-врач vs. жена врача) = syntaktische Dependenzen, graphisch representiert als X regiert Y;Y hängt von X ab; auf Englisch: X – (syntactic) governor of Y, Y – (syntactic) dependant of X
Aufbau der SyntS Connected directed labeled graph – zusammenhängender gerichteter gekennzeichneter Graph: Knoten – DMorphRs der Wortformen Pfeilen – Namen der syntaktischen Relationen Prinzipien des D-Baumes: • Oberer Knoten (root) • Kein Knoten kann gleichzeitig von 2 Knoten abhängen
Täuschungen in Bezug auf syntaktische Dependenzen • „Double Dependency“ Мы нашли зал пустымMASC.SG.INST. Morphologisch, aber nicht syntaktisch abhängig vom Substantiv. Журнал, которыйMASC. SG. ACC. мы читаем 2. „Mutual Dependency“ Hauptverb (Prädikat) vs. Grammatisches Subjekt 3. „No dependency“ Koordinierte Satzglieder (John and Mary = Mary and John) Aber keine Umkehrbarkeit (Я споткнулся и упал vs. Я упал и споткнулся) Rechtes Glied ist weglassbar (John, but not Mary, come)
Mängel der Dependenztheorie Modifikation-Strukturen Bob and Dick’s novels vs. Bob’s and Dick’s novels Eingruppierung – ein ganzer Subbaum als Gesamtheit genommen. Ähnlich zu PS-Struktur, aber • keine lineare Reihenfolge • Dependenzen sind explizit • kein oberer Knoten für die Eingruppierung
Vorteile der syntaktischen Dependenzen • Syntaktische Typologie der Sprachen • Kategorie des Genus • Wortfolge. Die Mehrheit der Sätze sind projectiv. Non-projective Sätze sind emphatisch, stylistisch, komunnikativ oder sonst markiert • Möglichkeit lexikalische Funktionen zu integrieren