550 likes | 692 Views
Internacionalización (i18n). Pedro Valero Universidad de Valencia. Objetivos. Valorar la importancia de la internacionalización de las interfaces Re conocer los problemas derivados de la traducción a otros lenguajes y los diferentes alfabetos existentes
E N D
Internacionalización (i18n) Pedro Valero Universidad de Valencia
Objetivos • Valorar la importancia de la internacionalización de las interfaces • Reconocer los problemas derivados de la traducción a otros lenguajes y los diferentes alfabetos existentes • Saber cómo evaluar si el software está adecuadamente internacionalizado • Conocer los recursos técnicos sobre como internacionalizar las interfaces Conocer la internacionalización de las interfases • Conocer los alfabetos y esquemas de codificación
Contenidos • Introducción • Internacionalización y localización • Ventajas • Elementos • Escritura • Esquemas de codificación • Modelo de internacionalización y localización • Guia técnica
Software internacionalDefiniciones • Es un producto que esta preparado para ser vendido en un ámbito fuera de la región o país donde fue creado • En un sentido completo es si se puede vender en todo el mundo • Como veremos hay diferentes niveles de internacionalización
InternacionalizaciónVentajas • Los productos se pueden colocar en el mercado mas fácilmente • El mantenimiento del código es más fácil si solo hay una versión
Internacionalización • Internacionalización • Es el proceso de diseñar una aplicación de tal manera que pueda adaptarse a diferentes lenguajes y regiones sin necesidad de cambiar el código • Localización • Es el proceso de adaptar software para una región especifica o lenguaje añadiéndole componentes específicos y traduciendo texto
Localización • Convenciones locales, la cultura y el lenguaje de una región particular • El conjunto de letras que se utilizan para escribir una lengua se dice escritura. • Cada localización solo tiene una escritura
Beneficios • Añadiendo la localización el mismo ejecutable funciona en todo el mundo • Los elementos textuales, como los mensajes o las etiquetas de los componentes no están en el código, están fuera y se cogen dinámicamente • Las dependencias culturales como fechas, monedas, aparecen en formatos que están acorde con la localización
Elementos • Cultura • Lengua hablada • Colores • Números • Unidades de medida • Monedas • Escritura
Iconos Texto Audio clips Ayuda en línea Formato de moneda, fechas y números Calendarios Medidas Colores Gráficos Números de teléfono Direcciones Títulos honoríficos Elementos
Iconos • Mullet y Sano (1995) señalan que la comunicabilidad de cualquier representación depende de que haya un contexto compartido entre el que envía el mensaje y el que lo recibe que permita que los signos sean interpretados dentro de una lógica similar a la que fueron codificados.
ElementosCultura • La cultura de una región o pais puede hacer percibir un mismo objeto de dos maneras diferentes en puntos geográficos diferentes • Ejemplos • Tan pronto como sea posible es inmediatamente en Estados Unidos y puede ser este mes en la cultura latinoamericana • La mano izquierda es ofensiva en algunas culturas
ElementosCultura • Hay que cuidar como de dibujan hombres y mujeres juntos y como van vestidos • Algunos simbolos com la esvastica, martillo y hoz, sol naciente, cruces, estrellas representan ideas politicas y relogiosas • En un pais islámico puede entenderse como ofensivas cosas que en Occidente no tiene ningun significado • Mover la cabeza, hacer adiós con la mano, mujeroes en bikin, bebidas alcoholicas
ElementosColores • Tienen significado a través de la tradición en la mayor parte de las culturas • Occidental • Negro es un color asociado con la muerte y con funerales • Blanco asociado con pureza • Verde y azul frío y tranquilo • Rojo, caliente y símbolo de riesgo, peligro • Oriental • Blanco asociado con la muerte • Rojo casamiento
ElementosColores • Cada cultura tiene sus estándares, por lo que es difícil generalizar • Semáforo • Rojo (parar), ambar (precaución) i verde (adelante), pero no tan solo estos los podemos asmuir de una manera generalizada
Elementos Calendarios, formato y separadores de fecha y hora • Hay otros tipos de calendario aparte Gregoriano • Budista, el chino, hebreo, etc... • Formato calendario gregoriano • aa/mm/dd aa dos ultimos digitos del año • aaddd mm mes • aaaa/nn/dd dd dia • dd/mm/aa aaaa año • mm/dd/aa
Elementos Formatos de números y monedas • Para cada país hace falta tener en cuenta el símbolo de la moneda y el formato numérico • USA $1,234,56 • Noruega kr1.234,56 • Suiza sFr1234,56 • Alemania 1.234,56DM • Euro ?
Ordenación • Las ordenaciones son importantes en el proceso de internacionalización y un tema complejo • En un principio las ordenaciones de caracteres son de la A a la Z, mayúsculas primero y después las minúsculas, los número de ordenan de 0 a 9 • Este tipo de regla no siempre es aceptable, porque hay reglas más complicadas cuando hay que considerar un segundo carácter al mismo tiempo
Mal caracola chacal cura danza llama luna marmota Bien caracola cura chacal danza luna llama marmota Ordenación en castellano
Ordenación en castellano • En castellano por ejemplo, ch es un doble caracter, que se ha tratar como un solo caracter y se ordena despues de la c y antes de la d. La ll es un doble caracter que tambíen hay que considerarlo como uno solo y se ordena despues de la l y antes de la m
Elementos específicosUnidades de medida • La mayor parte del mundo utiliza el sistema métrico excepto Estados Unidos • Utiliza la milla, la pulgada, etc..
Europea Thai Oriente medio Extremo oriente Thai Europa, oeste, central y este, griego, ruso, turco,indonesio Un byte Arabe, Hebreo Chino tradicional,Chino simplificado,Japonés, Koreano Thai Un byte Izquierda a derecha Multibyte Arabe, Hebreo, Latin Kana, hangul, caracteres ideográficos Bidireccional Un byte Latin, griego, Cirílico Horizontal y vertical Izquierda a derecha Zonas
ElementosEscrituras • Las escrituras se pueden clasificar en ideogramas y escrituras fonéticas • Un ideograma tien un significado especial y no tiene relación con su pronuciación • Las letras de una escritura fonética representan determinados sonidos, como por ejemplo M • Los tres sistemas de escritura mas importantes son: • Occidentales • Oriente medio • Oriente lejano
Escrituras Occidentales • Las escrituras occidentales son: Latín, griego y cirílico • Las siguientes características son comunes a las tres escrituras: • Fonéticas • Se leen de izquierda a derecha en una línea horizontal • Utilizan letras mayúsculas y minúsculas diferentes • Utilizan numeración aràbiga 0,1,2,3,4,5,6,7,8,9
EscriturasExtremo Oriente • Las escrituras del oriente lejano estan basados en caracteres ideográficos chinos • Los caracteres chinos son únicos, por su sistema especial de construcción, su larga história y su pronunciación • Su antigüedad se remonta a 4000 años y se utilizan de esta forma desde hace mas de 2000 años • Actualmente se utilizan unos cuantos miles de caracteres
EscriturasEsquemas de codificación • Cada tipo de escritura ha de ser representada en sistemas informáticos • Esta representación se concreta en un esquema de codificación • Estos esquemas se codifican a través de mapas de caracteres
ASCII • El mapa de carácteres ASCII consta de 128 carácteres • Los caracteres en el rango de o a 31 y el carácter 127 son especiales, tipicamente de control • Cada carácter es un indice en el mapa de caracteres, por ejemplo el número 65 es la letra A y el 97 la letra a • El codigo ASCII de 128 caracters solo se utilizaba para el inglés • En principio con 128 caracteres habia bastante • Al necesitar nuevos idiomas se empezó a utilizar el resto de 128 caracteres
Tipos de esquemas de codificación • Mapa de caracteres de un octeto (SBCS) • Mapa de caracteres de doble octeto (DBCS) • Unicode
Mapa de caracteres de un solo octeto (SBCS) • Son mapas de caracteres de hasta 256 caracteres (256 = 2^8). • Es una extensión del código ASCII, al que se han añadido 128 caracteres del 128 al 255 • Se denomina mapa de caracteres extendido • ISO • 8859-2 Latín europa del este • 8859-5 Cirilico Europa del este • 8859-1 Latin Europa Oeste • 8859-7 Griego • 8859-3 Turco • 8859-8 Hebreo • 8859-6 Arabe
Mapa de caràcters de doble octeto (DBCS) • Las escrituras del extremo oriente utilizan caracteres ideográficos • Necesitan un mapa de caracteres mas grande de 256 caracteres • Para resolverlo se hizo el mapa de caracteres de doble octeto • Notación de 16 bits • 65536 (2^16) caràcters • El DBCS de un solo octeto se corresponde con el código ASCII • Algunos caracteres se definen como octetos de comienzo y un segundo de código
Codi KANJI • El codigo Kanji definido por el JIS (Japan Industry Standard JIS.). • El JIS nivel I contiene alrededor de 3000 de los caracteres mas normales • El nivel 2 añade 3500 caracteres mas • El tercer nivel se ha definido recientemente e incrementa el mapa de caracteres en mas de 6000 caracteres • JIS está basado en un formato de 7 bits que requieren secuencias de ESCAPE especiales para entrar o salir del modo DBCS.
Problemas • Duplicidad en la codificación de caracteres • Multiples códigos de caracteres incosistentes debido al conflicto entre estándares nacionales y de la indústria • El código ASCII de 7 bits o el de 8 bits, estan limitados a 128 y 256 posiciones de código y son inadecuados en un entorno global • Internet ha añadido un punto más a la demanda de un conjunto de caracteres único en el mundo
Unicode • Unicode es una codificación de caracteres de 16 bits • Consensuado, participan • Apple, Borland, Digital, Hewlett-Packard, IBM, Lotus, Metaphor, Microsoft, Next, Novell, Research Libraries Group, Sun, WordPerfect, i Xerox • Se puede hacer un acceso aleatorio en los caracteres • Los programas no tienen que guardar estados al analizar cadenas • El codigo Unicode es único para un carácter determinado
Un modelo de localización Recursos localizados Código de la aplicación Producto localizado = +
Guía técnica • En esta parte de discuten problemas generales de conversiones a diferentes versiones del lenguaje y las diferentes necesidades que se preveen para planificar la localización
Desarrollo • Activación en el momento de la ejecución o al menos en el de la compilación
Puntos a revisar • Elementos específicos de la localización • Convenciones en el procesamiento de texto que incluye • ordenació, classificació de caràcters, pronunciación, guionado, funciones de gestión de cadenas e intercambio de ficheros (Importación y exportación de ficheros) • Gestión de las entradas • Gestión de les salidas
Traducción del texto • Todas las lenguas tienen gramática y sintaxis diferentes • El texto traducido cambia de tamaño, hay que prever que pueda crecer • Ejemplo: • Mover se traduce como verschieben en alemán • 5 contra 11
Organización de diálogos (Layout) • La organización de controles y elementos en una ventana ha de considerar la expansión de las etiquetas de texto • En hebreo y árabe la información se escribe de derecha a izquierda (Hace falta invertir la presentación ) • Algunos idiomas incluyen marcas diacríticas que requieren espació adicional • Permite un 30% de expansión
Barra de estado • La versión inglesa solo ha de ocupar el 50% de la barra de estado
Menús • Evitar menús muy densos • Límite 80 caractere • Aceleradores coinciden con el primer carácter de una palabra
Desarrollo de codigo internacional • Documentar todos los recursos que tienen que ser localizados • Es útil hacer dos localizaciones en paralelo para poder evaluar la i18n • Es importante dispones de herramientas y utilidades para hacer la localización