180 likes | 343 Views
Von einer Datensammlung zum Korpus die Datenlage der Schreibwerkstatt Mehrsprachigkeit. Melanie Andresen und Dagmar Knorr. Überblick. Woher stammen die Daten? Welche Daten werden gesammelt? Wie möchten wir die Daten nutzen – Beispiel einer Suchanfrage Auf dem Weg zu einem Korpus.
E N D
Von einer Datensammlung zum Korpus die Datenlage derSchreibwerkstatt Mehrsprachigkeit Melanie Andresen und Dagmar Knorr
Überblick Woher stammen die Daten? Welche Daten werden gesammelt? Wie möchten wir die Daten nutzen – Beispiel einer Suchanfrage Auf dem Weg zu einem Korpus
Peer Tutoren Schreibberatung Aufgabe der Peer Tutoren Schreibberatung = durch Textkommentierungen und Gespräche ratsuchende Studierende unterstützen, Schreib- und Textkompetenz aufzubauen
Suchanfrage stellen Suche Texte von Studierenden – mit Migrationshintergrund – angestrebter Abschluss: LA
Suchanfrage stellen Suche Texte von Studierenden – mit Migrationshintergrund – angestrebter Abschluss: LA – Leserführung
Frage Welche Software-Lösungen existieren, um solche Suchabfragen zu ermöglichen? Wie können die Metadaten sinnvoll mit den Dokumenten verbunden werden?
+ allgemeine Kommentare direkt im Text Aufbereiten der Texte
Mögliche Fragestellungen qualitative Fragen An welchen Stellen werden Textkommentare angebracht? Wie entwickeln sich Texte durch Kommentierungen? quantitative Fragen Vorkommen von Sprechhandlungsverben Vorkommen von Funktionsverbgefügen
Annotation • (halb)automatische Annotation (Tokenisierung, Lemmatisierung, Part-of-Speech Tagging, Syntax?) • manuelle Annotation • Mikroebene (z. B. Kontaminationen/Verschränkungen) • Mesoebene (z. B. Portmanns (i. Dr.) Unterscheidung von Referat, Elaboration, Deklaration) • Makroebene (z. B. Textstruktur)
Veröffentlichung des Korpus • Was muss bei der Korpuserstellung mit Blick auf eine Veröffentlichung beachtet werden? • Welche der Daten sollen veröffentlicht werden? • Wo kann das Korpus veröffentlicht werden?