380 likes | 537 Views
Terminologiearbeit : Vom guten Vorsatz zur Umsetzung. Maryline Hernandez IAI, Saarbrücken tekom RG Baden 22. Januar 2008. Vorstellung. Institut für Angewandte Informationsforschung seit über 20 Jahren sprachtechnologische Anwendungen Dienstleistungen und Softwarelösungen Indexierung
E N D
Terminologiearbeit:Vom guten Vorsatz zur Umsetzung Maryline Hernandez IAI, Saarbrücken tekom RG Baden 22. Januar 2008
Vorstellung • Institut für Angewandte Informationsforschung • seit über 20 Jahren • sprachtechnologische Anwendungen • Dienstleistungen und Softwarelösungen • Indexierung • Terminologieextraktion und –evaluierung • Informatiker, Computerlinguisten, Übersetzer Maryline Hernandez tekom RG Baden 22.01.2008
Überblick • Einführung • Erste Schritte • Tipps • Aufwand • Weiterführende Schritte • Referenzen Maryline Hernandez tekom RG Baden 22.01.2008
Einführungein bisschen Terminologielehre • Das Semiotische Dreieck • Begriffsorientiertheit Maryline Hernandez tekom RG Baden 22.01.2008
Benennung Begriff Gegenstand EinführungDas Semiotische Dreieck Maryline Hernandez tekom RG Baden 22.01.2008
EinführungBegriffsorientiertheit Maryline Hernandez tekom RG Baden 22.01.2008
Terminologiearbeit: Wichtigste Argumente & Ziele • erhöhte Qualität der Daten und Dokumente • Reduktion der Übersetzungskosten • einheitliches Image (Corporate Identity) • bessere interne Kommunikation • Rechtssicherheit Maryline Hernandez tekom RG Baden 22.01.2008
Terminologiearbeit:als "spontaner Prozess"? Maryline Hernandez tekom RG Baden 22.01.2008
Terminologiearbeit:als definierter Prozess Maryline Hernandez tekom RG Baden 22.01.2008
Am Anfang war die Vision • Datenbank, Web-basiert, bunt und multilingual aber: • es gibt nicht "die Lösung" Oberstes Gebot: Bedürfnisse der Anwender analysieren Maryline Hernandez tekom RG Baden 22.01.2008
Erste Schritte • Datenmodell definieren • System auswählen • Inhalte erschließen Maryline Hernandez tekom RG Baden 22.01.2008
Schritt 1: Datenmodell /1 • Beispiel: den Bestand des heimischen Weinkellers erfassen • wichtige Informationen zu einem Wein: • Rebsorte • Jahrgang • Herkunft • Anzahl v. Flaschen • Wozu passt der Wein? • Name Maryline Hernandez tekom RG Baden 22.01.2008
Schritt 1: Datenmodell /2 • Welche Informationen sind für die Erfassung eines Worts unabdingbar? • Datenkategorien für eine TDB festlegen • Datenkategorien gruppieren • verwaltungsrelevant • begriffsrelevant • benennungsrelevant • Datenmodell definiert! Maryline Hernandez tekom RG Baden 22.01.2008
Schritt 2: Systemauswahl /1 • Kommerzielle Terminologieverwaltungssysteme mit vorgegebener oder frei definierbarer Datenstruktur • Zeitersparnis • erhöhte Konsistenz und Qualität • fehlende Kompatibilität zwischen Tools • hohe Anfangsinvestition Maryline Hernandez tekom RG Baden 22.01.2008
Schritt 2: Systemauswahl /2 • Eigenentwicklungen • flexibel (in Konzeption und Wartung) • Abhängigkeiten zwischen Feldern prüfbar z.B. Angabe im Feld "Genus" nur wenn "Wortart" "Substantiv" ist • konzeptioneller bzw. programmatischer Aufwand notwendig Maryline Hernandez tekom RG Baden 22.01.2008
Schritt 2: Systemauswahl /3 • Strategische Überlegung und Bedarfsanalyse notwendig • eine spätere Umstellung ist kostspielig • Alternative: mit Listen anfangen • Excel, Access • Korrekturen im Datenmodell möglich • später Umstieg auf ein "echtes System" Maryline Hernandez tekom RG Baden 22.01.2008
Schritt 3: Inhalte erschließen /1 • Unterschiedliche Ausgangssituationen • nur Dokumente vorhanden • bereits Listen vorhanden Maryline Hernandez tekom RG Baden 22.01.2008
Schritt 3: Inhalte erschließen /2- aus einem Dokument Übung Ein Dokument durchforsten Maryline Hernandez tekom RG Baden 22.01.2008
Schritt 3: Inhalte erschließen /3Ansätze der Termextraktion • manuell • pragmatisch • auch auf Basis von Papierdokumenten • zeitaufwändig, fehleranfällig • automatisch statistisch • schnell erzeugte Liste • Software-Kauf oder Dienstleistung • automatisch linguistisch • kann vorhandene Termliste berücksichtigen • Lauf über Dokumentbestand • Software-Kauf oder Dienstleistung Maryline Hernandez tekom RG Baden 22.01.2008
Schritt 3: Inhalte erschließen /4- aus einer Liste Übung Termliste begutachten Maryline Hernandez tekom RG Baden 22.01.2008
Schritt 3: Inhalte erschließen /5- aus einer Liste Maryline Hernandez tekom RG Baden 22.01.2008
Tipps und Aufwand • Benennungsautonomie • Was gehört in die TDB? • Wie viel Terminologie ist genug? • Was gilt es zu vermeiden? • Einmalige Investitionen • Regelmäßige Aufwände Maryline Hernandez tekom RG Baden 22.01.2008
TippsBenennungsautonomie* *vgl. Schmitz • ein vollständiger Datenblock pro Benennung • Feld "Verwendungsstatus" unterscheidet zwischen • Vorzugsbenennung • erlaubtes Synonym • nicht erlaubtes Synonym Maryline Hernandez tekom RG Baden 22.01.2008
TippsBenennungsautonomie Maryline Hernandez tekom RG Baden 22.01.2008
TippsWas gehört in die TDB? • Faustregel: • alle Benennungen, deren Gebrauch festgelegt werden muss • auch Produktbezeichnungen • nicht nur Vorzugsbenennungen • nicht jede nicht erlaubte Benennung Maryline Hernandez tekom RG Baden 22.01.2008
TippsWie viel Terminologie ist genug? /1 • wenn das festegelegte Fachgebiet (zunächst) abgedeckt ist • weitere Fachgebiete hinzufügen • Umfang für ein industrielles Produkt: • ca. 5.000 bis 8.000 Benennungen • davon ca. 10 % nicht erlaubte Benennungen Maryline Hernandez tekom RG Baden 22.01.2008
TippsWie viel Terminologie ist genug? /2 • Terminologiedichte in Texten • anfangs 10 % • wenn TDB gut ausgebaut, bis zu 50 % aber: • Terminologiearbeit ist nie abgeschlossen! Maryline Hernandez tekom RG Baden 22.01.2008
TippsWas gilt es zu vermeiden? • zu wenig Zeit einplanen • zuviel auf einmal machen wollen, ein zu komplexes System erstellen • ein starres Datenmodell definieren, von dem man nicht wegkommt • alleine anfangen Maryline Hernandez tekom RG Baden 22.01.2008
Aufwand:Einmalige Investitionen • Planung: intern, ggf. mit Dienstleister • Kauf • 1.000 bis 30.000 EUR* *vgl. Oehmig • bzw. Entwicklung • intern oder extern • je nach Komplexität des Systems • Aufbau: Erfassungskosten* • Term + Definition: ca. 3 pro Stunde -> 20 EUR pro Term • Term + Kontextbeispiel: ca. 20 pro Stunde -> 3 EUR pro Term Maryline Hernandez tekom RG Baden 22.01.2008
Aufwand:Regelmäßige Aufwände • Wartung* *vgl. Warburton • pro Benennung, pro Jahr: < 1 bis > 5 US$ • Aktualisierung • neue Benennungen • Ergänzung • zusätzliche Informationen (Definitionen…) • zusätzliche Fachgebiete • Halbe bis ganze Stelle für Terminologiearbeit Maryline Hernandez tekom RG Baden 22.01.2008
Weiterführende Schritte /1 • Terminologieleitfaden • was gehört in die Datenbank? • Termbildungsregeln • wie entsteht eine neue Benennung? • Antragswesen • ganze Firma in die Terminologiearbeit miteinbeziehen Maryline Hernandez tekom RG Baden 22.01.2008
Weiterführende Schritte /2 • Ausbau der fremdsprachlichen Seite • Verwendung der entstandenen autoritativen Terminologie gewährleisten: • Werkzeuge für sprachliche Qualitätssicherung von Texten: CLAT • Aufbau einer Ontologie Maryline Hernandez tekom RG Baden 22.01.2008
Referenzen • Pavel,Silvia/Nolet, Diane: Handbook of Terminology (www.termiumplus.gc.ca) • Hennig, Jörg/Tjarks-Sobhani, Marita (Hrsg.): Terminologiearbeit für Technische Dokumentation (tekom Schriften zur Technischen Kommunikation Nr. 12) • Soukup-Unterweger, Irmgard: Von Z bis A – Basiswissen Terminologie • tekom Frühjahrstagung 2006: Terminologie von Anfang an • Drewer, Petra: Sauberes Terminologiemanagement – saubere Terminologie: Wie bringe ich Ordnung ins terminologische Chaos? • Oehmig, Peter: Effizienter im Unternehmen - Wirtschaftlichkeit der Terminologiearbeit • Schmitz, Klaus-Dirk: Systeme zur Terminologieverwaltung • Warburton, Kara: Terminology Management in the Localization Industry – Results of the LISA Terminology Survey • Wright, Sue Ellen/Budin, Gerhard: Handbook of terminology management Maryline Hernandez tekom RG Baden 22.01.2008
Normen • DIN 2330: Begriffe und Benennungen - Allgemeine Grundsätze • ISO 10241: International terminology standards – Preparation and layout • ISO 12620: Computeranwendungen in der Terminologiearbeit - Datenkategorien • ISO 12200: Computeranwendungen in der Terminologiearbeit - Maschinenlesbares Terminologieaustauschformat (MARTIF) Maryline Hernandez tekom RG Baden 22.01.2008
Vielen Dank! Für weitere Fragen: Maryline Hernandez IAI – Institut für Angewandte Informationforschung Martin-Luther-Str. 14 66111 Saarbrücken maryline.hernandez@iai-sb.de
Bildernachweis • Zettelkasten http://www.literaturmanagement.net/zettelkasten.html • Rotweinflasche www.wg-eschenau.de/pages/weinshop/index.php • Champagner www.marions-kochbuch.de/index/1256.htm • Luppe alt.makos.at/suche/ • Kisten www.fioregmbh.ch/sperrholzkisten.htm • Gefahr http://www.geschichteinchronologie.ch/v/verkehrszeichen-CH/gefahrsignale.html • Münzen www.uni-tuebingen.de/uni/qvo/38dinge/dinge04.html • Kreuzung www.kirche-wohltorf.de/gemeindebf2004.html Maryline Hernandez tekom RG Baden 22.01.2008