1 / 19

Richtlinien für die Annotation von Koreferenzen

Richtlinien für die Annotation von Koreferenzen. Kerstin Kunz. I) Koreferenz als kognitives Kohärenzmittel. Kognition. Informationsverarbeitung Vernetzungen von Wissenssystemen Interdependenz und Interaktion von kognitiven Prozessen

cortez
Download Presentation

Richtlinien für die Annotation von Koreferenzen

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Richtlinien für die Annotation von Koreferenzen Kerstin Kunz

  2. I) Koreferenz als kognitives Kohärenzmittel

  3. Kognition • Informationsverarbeitung • Vernetzungen von Wissenssystemen • Interdependenz und Interaktion von kognitiven Prozessen • Konzeptualisierung: Repräsentation von Realitätsbereichen • Sprache als kognitives Subsystem • Textrezeption: Repräsentation des Textes im Textweltmodell

  4. Kohärenz • Verbindung von Sätzen zu einem inhaltlich-logischen Zusammenhang • Explizite Verknüpfungsstrategien • Textoberfläche: z.B. temporal, lokal, pronominal • Kohäsion • Implizite Verknüpfungsstrategien • Schlussfolgerung des Rezipienten • Aktivierung des Kontextwissen • Aktivierung des Weltwissen => Inferenzen • => Koreferenz: explizite und implizite Relationen

  5. Koreferenz • Textinterner und textexterner Referenzbezug • Textextern: Antezedent, Anapher(n) – Referent • Textintern: Antezedent - Anapher(n) • Referenzidentität • Begriffserweiterung: direkte und indirekte anaphorische Relationen

  6. Antezedent Anaphern Ein Mann .... Er .... Der Mann .... Der Mensch ... Ein anderer Mann Koreferenz Referent

  7. Direkte Anaphern • Referenzidentität: • Antezedent, direkte Anaphern => außerprachlicher Referent • Fortführung des Themas • Relationstypen • Rekurrenz • Synonymie • Hyponymie – Hyperonymie • Pronominale Wiederaufnahme

  8. Indirekte Anaphern • Keine Referenzidentität zwischen Anker und indirekter Anapher • Beibehaltung der Referenzdomäne durch semantische und konzeptuelle Relationen • Thematische Rhematisierung • Relationstypen • Semantische Relationen • Aktivierung von Wissen aus dem mentalen Lexikon • Meronymie-basiert: Teil-von Beziehungen • Konzeptuelle Relationen • Aktivierung von Wissen aus dem Weltwissensspeicher • Schema-basiert: Aktivierung eines expliziten Schemas • Inferenz-basiert: implizite Weltwissensaktivierung

  9. II) Annotationsschema für die manuelle Annotation von Koreferenzen im MMAX

  10. Annotieren mit dem MMAX • DTD • Attribut-Fenster • Markables • Pointer • Set membership • Search-Fenster • Kappa-Statistik

  11. Das Attributfenster

  12. Das Search-Fenster

  13. Das Textkorpus • Wirtschaftsmeldungen der Frankfurter Rundschau • Insgesamt: 326 Meldungen; 125646 Token • Tigerkorpus

  14. Das Annotationsschema • Antezedent • Bezugsausdruck für direkte und indirekte Anaphern • 2) Typen direkter Anaphern • Rekurrenz: total, partiell • IS-A-Relationen: Synonymie, Hyperonymie, Hyponymie • Pronominaler Bezug: PPER, PDS, PPOS

  15. Das Annotationsschema • 3) Typen indirekter Anaphern • Meronymie: • Part-whole, entity-attribute, entity-member, place-area • Schema-basiert: • Conceptual, inferral

  16. Probleme bei der Annotation • Restriktionen durch das Tool • Repräsentation mentaler Textrezeption durch maschinelles Annotationstool • Eindimensionalität • Pointing relation • Unterscheidung zwischen Anker und Antezedent • Zuordnung anaphorische Relation - Antezedent • Membership Relation

  17. Probleme bei der Annotation 2) Restriktionen durch Klassifizierung • Eindeutige Festlegung der einzelnen Relationstypen • Mischtypenproblematik • Subjektivität des Annotierers

  18. Ausblick • Textsortenvergleich • Multilingualer Vergleich • Annotation durch mindestens zwei Annotierer

More Related