320 likes | 433 Views
Entwicklung eines Systems zur Diskurstranskription auf dem Computer. Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg. Grafik (umg. Partitur). syncWriter. syncWriter-Daten (binär). Segmentliste. Datentypen: Transkript.
E N D
Entwicklung eines Systems zur Diskurstranskription auf dem Computer Thomas Schmidt, SFB ‚Mehrsprachigkeit‘, Hamburg
Grafik (umg. Partitur) syncWriter syncWriter-Daten (binär) Segmentliste
Datentypen: Transkript MAX (v) : Du fällst mir immer ins Wort. ((1 sec)) Siehst Du, Du hast es schon wieder getan. (nv):------- gestikuliert ------------------ schlägt die Hände vors Gesicht --------- TOM (v) : Stimmt ja wohl gar nicht. (nv):-------- grinst -------- MIA (v) : Er hat schon recht, Tom. NN (nv):---------------------------------- Telefon klingelt ------------------------------------
Datentypen: Transkript Äußerungsdatenbank MAX (v) : Du fällst mir immer ins Wort. ((1 sec)) Siehst Du, Du hast es schon wieder getan. (nv):------- gestikuliert ------------------ schlägt die Hände vors Gesicht --------- TOM (v) : Stimmt ja wohl gar nicht. (nv):-------- grinst -------- MIA (v) : Er hat schon recht, Tom. NN (nv):---------------------------------- Telefon klingelt ------------------------------------ ?
Darstellungstypen: vertikale Darstellung MAX:[gestikuliert] Du fällst mir immer <ins Wort>1. TOM:[grinst] <Stimmt ja>1 wohl gar nicht. MAX:[schlägt die Hände vors Gesicht] ((1 sec)) Siehst Du, Du hast es schon <wieder getan>2. MIA: <Er hat schon>2 recht, Tom.
Darstellungstypen: vertikale Darstellung Spaltendarstellung MAX:[gestikuliert] Du fällst mir immer <ins Wort>1. TOM:[grinst] <Stimmt ja>1 wohl gar nicht. MAX:[schlägt die Hände vors Gesicht] ((1 sec)) Siehst Du, Du hast es schon <wieder getan>2. MIA: <Er hat schon>2 recht, Tom. ?
Darstellungstypen: Spaltendarstellung Partiturdarstellung MAX (v) : Du fällst mir immer ins Wort. ((1 sec)) Siehst Du, Du hast es schon wieder getan. (nv):------- gestikuliert ------------------ schlägt die Hände vors Gesicht --------- TOM (v) : Stimmt ja wohl gar nicht. (nv):-------- grinst -------- MIA (v) : Er hat schon recht, Tom. NN (nv):---------------------------------- Telefon klingelt ------------------------------------ ?
Grafik (umg. Partitur) syncWriter syncWriter-Daten (binär) Segmentliste
Grafik (umg. Partitur) syncWriter syncWriter-Daten (binär) Segmentliste andere Werkzeuge
Grafik (umg. Partitur) syncWriter syncWriter-Daten (binär) Segmentliste andere Werkzeuge andere Datenformate
Grafik (umg. Partitur) syncWriter syncWriter-Daten (binär) Segmentliste andere Werkzeuge andere Datenformate andere Betriebssysteme
Grafik (umg. Partitur) syncWriter syncWriter-Daten (binär) Segmentliste ? andere Werkzeuge andere Datenformate andere Betriebssysteme
„Single Source, Multiple Targets“ vertikale Darstellung: RTF vertikale Eingabe (XML)- Datenformat Spalten-Darstellung: HTML Spalten-Eingabe Partitur-Darstellung: PDF Partitur-Eingabe ... ... Datenbank andere Transkriptionsformate andere Werkzeuge
Bird / Liberman: ANNOTATION GRAPHS MAX / v / „Du fällst mir immer“ MAX / v / „ins Wort“ t1 t2 t3 t0 TOM / v / „Stimmt ja“ TOM / v / „wohl gar nicht.“ TOM / nv / „grinst.“ MAX / nv / „gestikuliert“
Struktur einer Diskurstranskription: Zeitachse und Ereignisse t0 < t1 < t2 < t3 < t4 < t5 < t6
MAX (v) : Du fällst mir immer ins Wort. ((1 sec)) Siehst Du, Du hast es schon wieder getan. (nv):------- gestikuliert ------------------ schlägt die Hände vors Gesicht --------- TOM (v) : Stimmt ja wohl gar nicht. (nv):-------- grinst -------- MIA (v) : Er hat schon recht, Tom. NN (nv):---------------------------------- Telefon klingelt ------------------------------------
Technologien zur Implementierung • Problem: „Sprachabhängigkeit“ • sprachspezifische lateinische Zeichen: • deutsch: Ä Ö Ü ß • französisch: ç è é ê ë • schwedisch: å æ ø [...] • nicht-lateinische Alphabete • kyrillisch: Љ Ћ ю • griechisch: α β γ θ • IPA [...] • CJK-Schriftsysteme • ...
Technologien zur Implementierung • Problem: „Sprachabhängigkeit“ UNICODE
Technologien zur Implementierung • Problem: „Sprachabhängigkeit“ UNICODE • Problem: „Softwareabhängigkeit“
Technologien zur Implementierung • Problem: „Sprachabhängigkeit“ UNICODE • Problem: „Softwareabhängigkeit“ XML
Technologien zur Implementierung • Problem: „Sprachabhängigkeit“ UNICODE • Problem: „Softwareabhängigkeit“ XML • Problem: „Plattformabhängigkeit“
Technologien zur Implementierung • Problem: „Sprachabhängigkeit“ UNICODE • Problem: „Softwareabhängigkeit“ XML • Problem: „Plattformabhängigkeit“ JAVA
Eingabe- Schnittstelle XML-Datenformat
Eingabe- Schnittstelle XML-Datenformat HTML RTF
Eingabe- Schnittstelle XML-Datenformat HTML RTF
Eingabe- Schnittstelle andere Anwendungen XML-Datenformat HTML RTF
Eingabe- Schnittstelle andere Anwendungen XML-Datenformat HTML RTF (Partitur-) Transkriptionseditor