190 likes | 270 Views
Parameter und Prinzipien bei der Erstellung computergestützter Corpora. Projekt Zb Leitung: Jochen Rehbein Mitarbeit: Kai Wörner Thomas Schmidt. syncWriter. HIAT-DOS. LAPSUS. Import-Filter. Eingabe- Schnittstelle. Datenbank. XML-Datenformat. HTML. RTF. Transkriptionseditor.
E N D
Parameter und Prinzipien bei der Erstellung computergestützter Corpora Projekt Zb Leitung: Jochen Rehbein Mitarbeit: Kai Wörner Thomas Schmidt
syncWriter HIAT-DOS LAPSUS Import-Filter Eingabe- Schnittstelle Datenbank XML-Datenformat HTML RTF Transkriptionseditor
Zusätzliche Annotation EXMARaLDA - Segmentierte Transkription SyncWriter EXMARaLDA- Basis- Transkription Datenbank HIAT-DOS EXMARaLDA- Listen- Transkription Verbmobil ACCESS / dBase
X-Waves ESF syncWriter SHOEBOX TASX EUDICO Verbmobil CHILDES Animal Communication TALKBANK MATE Classroom Discourse DIDA EXMARaLDA syncWriter HIAT-DOS dBASE Verbmobil
X-Waves ESF syncWriter SHOEBOX TASX- Annotator ELAN Verbmobil CHILDES Animal Communication TableTrans MATE Classroom Discourse PRAAT DIDA Partitur- Editor CLAN syncWriter HIAT-DOS dBASE Verbmobil
1. Vorhandene Datenbestände 5. Meta-Daten 4. Darstellung 3. Transkriptions- konventionen 2. Eingabe Parameter
Vorhandene Datenbestände: HIAT-DOS 2. Eingabe: Praat / EXMARaLDA Partitur-Editor 4. Ausgabe: Partitur K5 - Semikommunikation und rezeptive Mehrsprachigkeit im heutigen Skandinavien 3. Transkriptionskonvention: HIAT‘
E3 - Prosodische Beschränkungen zur phonologischen und morphologischen Entwicklung im bilingualen Erstspracherwerb • Vorhandene Datenbestände: 4th Dimension 2. Eingabe: Praat / EXMARaLDA Partitur-Editor + IPA-Tastatur 4. Ausgabe: Spaltendarstellung (?) 3. Transkriptionskonvention: IPA+
[CV.CV] Konsonant/ Vokal [ma.ma] [BC.BC] Artikula- tionsort [NV.NV] Artikula- tionsart
Vorhandene Datenbestände: syncWriter 2. Eingabe: EXMARaLDA Partitur-Editor 4. Ausgabe: Partitur E5 / K1 / K2 3. Transkriptionskonvention: HIAT‘
2. Eingabe: CLAN Editor 4. Ausgabe: CHAT-Zeilennotation CHILDES-Parameter 3. Transkriptionskonvention: Min-CHAT
CHAT XCHAT EXMARaLDA XML
Korpus enthält Subkorpora oder Korpusdaten XML-Container für Metadaten Korpusdaten
Prinzipien Bird/Simons (2003): Seven Dimensions of Portability for Language Documentation and Description • Content: Coverage, Accountability, Terminology • Format: Openness, Encoding, Markup, Rendering • Discovery: Existence, Relevance • Access: Scope of access, Process for access, Ease of access • Citation: Bibliography, Persistence, Immutability, Granularity • Preservation: Longevity, Safety, Media • Rights: Terms of use, Benefit, Sensitivity, Balance
Prinzipien Edwards (1992): Four principles for the use of archived data MacWhinney/Snow (1992): Four confusions regarding CHILDES • Maximum Readability / Minimum Bias • Consistent Encoding for Exhaustive Retrieval • Systematic Contrastiveness • Data Comparability
Prinzipien Computergestützte Transkription • Transkription als Verschrift(lich)ung • “Transcription as theory” (Ochs 1979) • “Entity-Relationship Modelling” (Chen 1976) • “Texttechnologische Informationsmodellierung” (Lobin 2000) Computergestützte Transkription als Modellierung und Visualisierung gesprochener Sprache
Prinzipien „Single Source, Multiple Target“ • Kein Allzweck-Werkzeug Mehrere Werkzeuge für spezielle Zwecke, Datenaustausch zwischen Werkzeugen • Keine Allzweck-Darstellung Mehrere Darstellungen für spezielle Zwecke, Berechnen von Darstellungen