1 / 8

Übung zu Einführung in die LDV I

Übung zu Einführung in die LDV I. Lexik. Tom Schaeffer scha4204@uni-trier.de. Definitionen. Lexik Disziplin, die sich mit der Wortebene beschäftigt Lexikon Wortbestand der gesamten Sprache Vokabular Wortbestand eines Texts oder den Wortschatz eines Sprechers/Hörers Lexikographie

olaf
Download Presentation

Übung zu Einführung in die LDV I

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Übung zu Einführung in die LDV I Lexik Tom Schaeffer scha4204@uni-trier.de

  2. Definitionen • Lexik • Disziplin, die sich mit der Wortebene beschäftigt • Lexikon • Wortbestand der gesamten Sprache • Vokabular • Wortbestand eines Texts oder den Wortschatz eines Sprechers/Hörers • Lexikographie • Die Lexikographie hat die Aufgabe, den Wortbestand einer Sprache zu beschreiben. Dies geschieht in der Regel mittels Wörterbüchern. • Lexikologie • untersucht Strukturen und Zusammenhänge im Wortbestand

  3. Wortbegriff • Nach phonetischen Kriterien • Wort als durch eindeutigen Akzent und künstlich gesprochene Pausen identifizierbare Einheit • Nach orthographischen Kriterien • Wort als Buchstabenfolge zwischen Leerzeichen und anderen Trennsymbolen • Nach morphologischen Kriterien • Einheit, die der Flexion unterliegt und durch Wortbildungsregeln gekennzeichnet ist • Nach syntaktischen Kriterien • kleinste auf Satzebene austauschbare und einschiebbare Einheit • Nach semantischen Kriterien • kleinster selbstständiger Träger einer Bedeutung

  4. Lexem / Lemma • Lexem • Abstrakte Basiseinheit des Lexikons auf langue-Ebene, die in verschiedenen grammatischen Wortformen realisiert werden kann • Lemma • Eintrag bzw. einzelnes Stichwort in einem Lexikon oder Wörterbuch; das Lemma ist der Stellvertreter des Lexems, sozusagen sein „Name“

  5. Lemmatisierung • zu einer gegebenen Wortform das zugehörige Lemma herauszufinden • Zwei mögliche Methoden: • Nachschlagen der zu lemmatisierenden Wortform in einem Vollformenwörterbuch, in dem jede einzelne flektierte Form jedes Wort einen Eintrag besitzt und auf das jeweils korrekte Lemma (bzw. die in Frage kommenden Lemmata, s.u.) verweist. Diese Methode ist sehr speicheraufwändig, aber schnell und unkompliziert. • beruht auf möglichst vollständigen Listen aller (Allo)Morphe und einem Regelwerk. Die zu analysierende Wortform wird zunächst in potenzielle Allomorphe segmentiert.

  6. Lemmatisierung • Dann müssen die Flexionsmorphe separiert werden. Entweder wird der Rest dann in einem Stamm-Lexikon nachgeschlagen oder es werden die Flexionsmorphe hinzugefügt, die für die Lemmata in Frage kommen, und in einem üblichen Wortverzeichnis gesucht. • Anhand der bei der Wortform gefundenen Flexionsmorphe lässt sich die Wortform anschließend mit einer vollständigen morphologischen Information versehen. • Meist gibt es mehrere, oft sehr viele prinzipiell mögliche Segmentierungen. Das Verfahren muss dafür sorgen, dass nur solche Segmentierungen in Betracht gezogen werden, die den Regeln der Morphologie (Morphotaktik) der betreffenden Sprache genügen und bei Zusammensetzung der Wortform ein gültiges, restloses Ergebnis erbringen. • Die morphologische Methode ist weniger speicheraufwändig als die auf einem Vollformenwörterbuch basierende, aber sehr komplex und schwer zu warten.

  7. Probleme bei der Lemmatisierung • Eigennamenerkennung • (1) Man benötigt zur Erkennung von Eigennamen ein entsprechendes Verzeichnis, das meist nicht zur Verfügung steht und immer unvollständig sein muss • (2) Viele Eigennamen sind formgleich mit anderen Wörtern • im Wörterbuch nicht gefundene Wörter • Abkürzungen • Komposita • Ambiguitäten • Homonymie

  8. Lexikalische Relationen • Synonymie • Antonymie • Homonymie • Homophonie • Homographie • Polysemie • Polylexie • Hyponymie / Hyperonymie • Meronymie / Holonymie

More Related