70 likes | 182 Views
Ein Computermodell zur Bestimmung von Begriffstypen. Christof Rumpf Heinrich-Heine-Universität Tag der Forschung 05.11.2006. FOR 600, Projekt A5. DFG-Forschergruppe FOR 600: Funktionalbegriffe und Frames Projekt A5: Automatische Klassifikation von Nomen nach Begriffstyp
E N D
Ein Computermodell zur Bestimmung von Begriffstypen Christof Rumpf Heinrich-Heine-Universität Tag der Forschung 05.11.2006
FOR 600, Projekt A5 • DFG-Forschergruppe FOR 600: • Funktionalbegriffe und Frames • Projekt A5: • Automatische Klassifikation von Nomen nach Begriffstyp • Projektleiter: • Prof. Dr. James Kilbury (Computerlinguistik) • Prof. Dr. Sebastian Löbner (Linguistik)
Gegenstand des Projekts A5 • Problem • Automatische Klassifikation von Nomen nach Begriffstyp aufgrund morphosyntaktischer Kontextmerkmale. • Methode • Erlernen eines statistischen Modells für die Klassifikation mit annotierten Texten, in denen Begriffstyp und Kontextmerkmale vermerkt sind.
Kontextuelle Merkmale • Morphologische Eigenschaften • Deadjektivische Nomen sind häufig funktional: Grösse, Intelligenz, … • ebenso deverbale Nomen: Krümmung, Dauer, … • und Komposita mit: -wert, -grad, -grösse, … • Grammatische Besonderheiten • Possessivkonstruktionen: seine Mutter (2-stellig) • Definitheit: der, die, das (FB) vs. ein, eine (RB) • Subkategorisierung: bestimmte Verben verlangen FB als Komplement, z.B. die Temperatur messen
Annotierung von Korpora Dieses PDAT Lehr- und Lernbuch NN_SBist VAFIN der ARTDEF Versuch NN_RB1, $, eine ARTUNDEF EinführungNN_RB1in APPR die ARTDEF SemantikNN_FB1zu PTKZU bieten VVINF , $, die PRELS einerseits ADV die ARTDEF wichtigsten ADJA Themen NN_RB1 • Software zur auto-matischen Annotierung kontextueller Merkmale durch morphologische und syntaktische Analyse • Manuelle Annotierung von Begriffstypen