660 likes | 953 Views
Terminologieverwaltung für die Softwarelokalisierung. 2. Kölner Tagung LION2005 11. Und 12. März 2005 Prof. Dr. Klaus-Dirk Schmitz Fachhochschule Köln Fakultät 03 - ITMK - IIM klaus.schmitz@fh-koeln.de. Übersicht. Motivation: Terminologie für die Lokalisierung Theoretische Grundlagen
E N D
Terminologieverwaltungfür die Softwarelokalisierung 2. Kölner Tagung LION200511. Und 12. März 2005 Prof. Dr. Klaus-Dirk Schmitz Fachhochschule Köln Fakultät 03 - ITMK - IIMklaus.schmitz@fh-koeln.de
Übersicht • Motivation: Terminologie für die Lokalisierung • Theoretische Grundlagen • Konzeption von Terminologielösungen • Werkzeuge für die Terminologiearbeit
Motivation: Beispieltext Note: If you omit the password, MultiTerm prompts you for a password when loading, assuming the database is password-protected. If you log on as the system administrator, you are normally asked whether you want exclusive access to the database. This is not the case when opening a database using parameters; in this case, it is assumed that you do want exclusive access. Only when exclusive access is not available, MultiTerm does assume that you still want to take part in normal multi-user operation.
Terminologie Terminologie =Fachwortschatz=Gesamtheit der Begriffe und Benennungen in einem Fachgebiet(ISO 2342) databaseexclusive accessloadinglog onMultiTerm *multi-user operationopen adatabaseparameterpasswordpassword-protectedpromptsystem administrator
Terminologie für die SW-Lokalisierung • Die Auswahl und Festlegung sowie die kon-sistente und korrekte Verwendung von Fach-wörtern (Terminologie) sind Grundvoraus-setzungen für eine erfolgreiche Lokalisierung: • meist innovative Fachgebiete und Themen • große Projekte mit mehreren Mitarbeitern • durchgängige Terminologie in allen Produkten • Vorgeschriebene Terminologie (Umgebung, Gesetze und Richtlinien, Corporate Language)
Terminologie: Nutzen und Kosten • Gute Terminologiearbeit ist zeitaufwendig (teuer). • Je mehr Personen/Anwendungen die Ergebnisse der Terminologiearbeit nutzen, desto eher rechnet sich der Aufwand. • Je „früher“ Terminologiearbeit betrieben wird, desto effizienter wird der Software-/Informations-entwicklungs-/Lokalisierungsprozess.Produkthaftung, Kundenzufriedenheit, time to market, etc.
Softwareentwicklung Lokalisierung Softwareentwicklung und Lokalisierungsworkflow „unkomplizierter“ Workflow, kein Δ, aber späte LION
Softwareentwicklung Lokalisierung Softwareentwicklung und Lokalisierungsworkflow „komplexer“ Workflow, großes Δ, LION als „simship“ Terminologie schon sehr früh notwendig !
*Kick-off Analysis Source Mat. Localization QA Scheduling & Budgeting Prepare Source Mat. Setup Terminology = QA Procedure Establish Equivalents Screen Captures Software Translation Software Engineering Software Testing Translate Online Help Test Online Help Product QA & Delivery * Pre-Sales Activity Translate Documentation DTP Project Closure Esselink
Kommunikationssituation “Maus”
Dreiecksmodell “Maus”
Terminologisches Dreieck Begriff Benennung Gegenstand
Gegenstand (Objekt) Beliebiger Ausschnitt aus der wahrnehmbaren oder vorstellbaren Welt. Gegenstände können • materiell / konkret (z.B. Stuhl, Maschine) oder • nicht-materiell / abstrakt (Höhe, Magnetismus) sein. Auch • Geschehnisse • Sachverhalte • Begriffe können Gegenstände sein.
Benennung (Terminus, Term) “Maus” Eine Benennung ist die mindestens ein Wort umfassende Bezeichnung eines Begriffes in der Fachsprache. (DIN 2330) Sprachliche Bezeichnung eines Allgemeinbegriffes aus einem Fachgebiet. (DIN 2342)auch: Fachausdruck oder Terminus (!) Bezeichnung: Repräsentation eines Begriffes mit sprachlichen oder anderen Mitteln.
Begriff (Konzept) Ein Begriff ist eine Denkeinheit, die aus einer Menge von Gegenständen unter Ermittlung der diesen Gegenständen gemeinsamen Eigenschaften mittels Abstraktion gebildet wird.(DIN 2342) Begriffe sind nicht an einzelne Sprachen gebunden, sie sind jedoch von dem jeweiligen gesellschaftlichen und/oder kulturellen Hintergrund einer Sprachgemeinschaft beeinflußt. Diskussionen über: Begriff = Denkeinheit - Wissenseinheit - Erkenntniseinheit
Kommunikation kann gestört sein • Synonymie “return key?” “enter key”
Synonymie Beziehung zwischen verschiedenen Bezeichnungenin der selben Sprache, die denselben Begriff repräsentieren. (DIN 2342) Synonyme erschweren die fachsprachliche Kommunikation, sind aber in innovativen Fachgebieten, wegen abgrenzender Corporate Language und bei Sprachen mit starker regionaler Verbreitung unvermeidbar.
Synonymie “Eingabe-taste” “Return-taste” “Enter-taste” “Zeilen-schaltung”
Kommunikation kann scheitern • Homonymie / Polysemie “mouse”
Homonymie Beziehung zwischen identischen Bezeichnungen in der selben Sprache für unterschiedliche Begriffe. (DIN 2342) Polysemie: erkennbarer etymologischer Ursprung Homographie: (nur) gleiche Schreibweise Homophonie: (nur) gleiche Aussprache Polysemie / Homonymie innerhalb eines Fachgebiets macht effiziente fachsprachliche Kommunikation unmöglich, ist aber über Fachgebietsgrenzen hinweg eine übliche Art der Bildung neuer Benennungen.
Homonymie “Maus”
Normung der Terminologie • Terminologie muss innerhalb eines Dokuments, eines Produktes oder eines Unternehmens einheitlich definiert und verwendet werden: • Nur eine Benennung für einen Begriff(keine Synonyme !) • Nur einen Begriff für eine Benennung(keine Homonyme !)
Terminologie: Benennungen • Auswahl und Neubildung von Benennungen: • treffend, motiviert, transparent • konsistent • angemessen • linguistisch ökonomisch(Ultrakurzwellenüberreichweitenfernsehrichtfunkverbindung) • ableitbar(medicinal plant vs. herb --> herbal, herbalist, ...) • sprachlich korrekt (aktualisieren vs. updaten, upgedated, ...) • „deutsch“ (Startseite vs. Homepage)
Transparenz, Motivation • Den Begriff hinter der Benennung kann man ohne Definition erschließen. • Die Bedeutung der Benennung ist sichtbar durch: • morphologische Motivationpage setup, error messagedata network identification code*network printing device setup* • semantische Motivationworm, virus, infected file, vulnerabilityfirewall*
Konsistenz • Die Benennung wird konsistent und einheitlich in allen Teilen des Produktes verwendet.Z.B. bei Softwareprodukten: • Menü, Dialogboxen, Fehlermeldungen • Online-Hilfe, Tutorial • Dokumentation, Webseiten, Verpackung etc. • return key, input key, enter key, line feed, carriage return, acknowledge key etc. • update, hotfix, update rollup, security pack, security update, private fix etc.
Konsistenz Können Sie sich vorstellen, dass beide Personen(gruppen) die gleiche Benennung für einen bestimmten Begriff verstehen und aktiv benutzen?
Angemessenheit • Angemessenheit bedeutet, dass Benennungen: • dem Leser vertraut und geläufig sein müssen • keine Verwirrung und Unsicherheit erzeugen dürfen • keine negative Nebenbedeutungen haben sollen (neutral, politisch korrekt) • express installation (nur benötigte Komponenten)network installation (alle Komponenten) • system error, severe error, fatal error, user error etc. • master/slave, web designers’ bible, knowledge nugget etc.
Angemessenheit “Avez-vous des Staubsauger-filterbeutel?”
Terminologie: Benennungen in TVS • Eingabe von Benennungen: • in der GrundformVerben in Infinitiv, Substantive im Nominativ Singular • in natürlicher Wortfolgez.B. „elektrische Lampe“ statt „Lampe, elektrische“ • in normaler Schreibweisez.B. englische Substantive am Anfang mit Kleinbuchstaben • nur die Benennungz.B. nicht„to save“,„der Drucker“oder „Drucker, m.“ • nur eine Benennungz.B. nicht„computer aided design (CAD)“
Konzeption einer Terminologielösung • Geplante Nutzergruppen, ZweckÜbersetzung, Lokalisierung, Terminologiearbeit, Technische Redaktion, Sprachplanung, Normung, WB-Erstellung, Unterstützung von Experten etc. • Sprachen • Datenkategorien und Eintragsstruktur • Generelle Konzeption und Arbeitsweise • „Kooperation“ mit anderen AnwendungenEditoren, TM, MÜ, Term-Extraktion, CMS, etc. • Werkzeuge
Datenkategorien • ISO 12620 (1999): Verzeichnis von mehr als 200 Datenkategorien für terminologische Datenbestände: • A.1 term • A.2 term-related information • A.3 equivalence • A.4 subject field • A.5 concept-related description • A.6 concept relation • A.7 conceptual structures • A.8 note • A.9 documentary language • A.10 administrative information • Annex B (inform.): Bibliographical data categories Wird überarbeitet und Gliederung wird aufgegeben!
Datenkategorien A.2.2.1 part of speech NONADMITTED TERM1: grammatical category NONADMITTED TERM2: word class DESCRIPTION: A category assigned to a word based on its grammatical and semantic properties. PERMISSIBLE INSTANCES: Examples of parts of speech commonly documented in terminology databases can include: a) noun b) verb c) adjective
Datenkategorien (Vorschlag) • Begriffs- und Eintragsebene (für jeden Begriff) • Eintragsnummer • Fachgebiet • Urheber • Bearbeiter • Ursprungsdatum • Änderungsdatum • Begriffsbeziehung • Verlässlichkeitsangabe • Anmerkung
Datenkategorien (Vorschlag) • Benennungsebene (für jeden Benennung) • Benennung • Benennungstyp • Genus, Wortklasse, Numerus • Geographischer Gebrauch • Sprachebene • Normativer Status • Projekt-Teilbestand, Kunden-Teilbestand • Definition • Kontext • Quelle • Anmerkung
Datenkategorien (Vorschlag) • Benennungsebene (für jeden Lokalisierungseinheit) • Lokalisierungstyp (Menü, Dialogbox, Meldung, ...) • - Menütyp (menu bar, menu item, ...) • - Dialogfenstertyp (check button, push button, radio button,...) • - Meldungstyp (message, status bar, tool tip, ...) • Umgebungsteilbestand (z.B. Windows) • Produkt-Teilbestand (z.B. Notepad) • Lokalisierungsnummer • Lokalisierungsursprung (z.B. en-US) • Lokalisierungsziel (z.B. de-DE)
Eintragsmodellierung + Prinzipien • Elementarität von Datenkategorien Jede Datenkategorie darf nur ein Datenelement (Wert) enthalten, und zwar eines, das dem Typ der Daten-kategorie entspricht.Nicht: Definition und Quelle ins gleiche Feld!Nicht: Benennung und Genus ins gleiche Feld!Nicht: Benennung und Abkürzung ins gleiche Feld! • Granularität von Datenkategorien Datenkategorien sollen so fein wie möglich definiert werden.Nicht: Grammatik: m, npl
Eintragsmodellierung + Prinzipien • Begriffsorientierung Alle terminologische Information zu einemBegriff einschließlich aller Benennungen in allen Sprachen sollen in einemEintrag verwaltet werden können. • Benennungsautonomie Alle Benennungen zu einem Begriff sollen als autonome Blöcke von Datenkategorien verwaltet und mit allen notwendigen Datenkategorien dokumentiert werden können (ohne Bevorzugung einer bestimmten Benennung)
Lexikographischer Eintrag Bedeutung Bedeutung Wort Bedeutung Bedeutung Bedeutung Bedeutung
Terminologischer Eintrag Benennung Benennung Begriff Benennung Benennung Benennung Benennung Deskriptive Terminologiearbeit
Eintragsmodellierung + Prinzipien Eintrag Begriff repräsentiert durch ID-Nr. und/oder Klassifikation/Notation o.ä. Sprache 1 Sprache 2 Sprache 3 ... Benennung 1+ Begleitinfo Benennung 1+ Begleitinfo Benennung 1+ Begleitinfo Benennung 2+ Begleitinfo Benennung 2+ Begleitinfo Benennung 3+ Begleitinfo
Eintragsmodellierung + Prinzipien • Problematik der Begriffsorientierung bei Terminologie aus Software-Oberfläche ! • Menüs + Dialogfelder:Datei, Seitenlayout, BundstegTabelle einfügen, Speichern unter ..., Tabelle und Rahmen • Systemmeldungen:PapierstauUnerwarteter Fehler im AnwendungsprogrammNicht genügend Speicher zum Anzeigen der GrafikÜberprüfen Sie die NetzwerkkonfigurationWählen Sie den Ordner %%folder aus