E N D
ANTES DE EMPEZAR… DEFINIMOS • Símbolos o gráficos que se utilizan para componer los diferentes alfabetos y que son necesarios para desarrollar idiomas escritos • CARÁCTER • UNICODE • Es un sistema de codificación
¿QUÉ SON? Seinició a finales de 1987
SABIAS QUE… • Es un método para representar caracteres de texto en un archivo o flujo de información. Permite convertir un carácter en un símbolo de otro sistema de representación, aplicando una serie de normas o reglas de codificación. FORMATO COMÚN QUE REPRESENTA LOS CARACTERES DE LAS TECLAS DE LA COMPUTADORA
OBJETIVOS:: OBJETIVOS:
100 713 caracteres ¿CUÁNTOS CARACTERES TIENE UNICODE? SABIAS QUE… CARACTER VERSIÓN 5.1 al elemento más pequeño de un sistema de escritura con significado. LA LISTA SE INCREMENTA CON CADA NUEVA VERSIÓN Los caracteres se identifican mediante un número o punto de código y su nombre o descripción.
¿QUÉ HACE UNICODE? Suministra un número único a cada uno de los caracteres ( letras , números , símbolos, etc.), ya que las computadoras solo trabajan con números (código binario). TECHNICAL INFORMATION UNICODE NUMBER U+0024 CODE POINT
SABIAS QUE… CODE POINT PUNTOS DE CÓDIGO • Un sistema de 21 bytes 2 bytes ES LO MISMO QUE DECIR 65.536 caracteres Desde 1996 QUE COMPRENDE EL Es el número con el que se identifica un carácter en el estándar Unicode. El punto de código se escribe con el formato U+xxxx donde las xxxx son de cuatro a seis dígitos en sistema de numeración hexadecimal. BMP Basic Multilingual Plane
UNIDAD DE CODIFICACIÓN El punto de código se representa con grupos de 8, 16, o 32 bits Es el mínimo grupo de bits necesario para representar una unidad de texto codificado. 8 bit 16 bit 32 bit UTF-8 UTF-16 UTF-32 TIPOS DE CODIFICACIÓN
UTF-8 utiliza 1 byte para representar caracteres en el set ASCII, dos bytes para caracteres en otros bloques alfabéticos y tres bytes para el resto del BMP. Para los caracteres complementarios se utilizan 4 bytes. UTF-16 utiliza 2 bytes para cualquier carácter en el BMP y 4 bytes para los caracteres complementarios. UTF-32 emplea 4 bytes para todos los caracteres.
En cada plano 65.536 caracteres PLANOS EN UN PLANO ¿CUÁNTOS PLANOS HAY? Es decir (216) = 1,114,112 PLANO 0 BMP
LENGUAS OCCIDENTALES Plano Multilingüe Básico (BMP) Plano Multilingüe Suplementario (BMS) Plano Suplementario Ideográfico (BSI) PLANO 0 No asignado Plano Suplementario de Propósito Especial Plano Suplementario de Propósito Especial Plano Suplementario de Uso Privado
BLOQUES U+XXX1 U+XXX2 U+XXX3 U+XXX4… Un bloque es un rango continuo de puntos de código. Cada bloque tiene un nombre único. Por ejemplo “Basic Latin”, “Hebreo”, y otros. Cada punto de código tiene una propiedad “Block name” que indica el bloque al que pertenece.
El mínimo de caracteres en un bloque es 16 El máximo de caracteres es de 65536 caracteres En Unicode 9.0 existe 273 bloques
FUENTES • http://www.zator.com/Cpp/images/ASCII-PC.gif • https://blogsimages.adobe.com/CCJKType/files/2016/05/unicode25cake-utc147-design.jpg • http://3.bp.blogspot.com/-ZZiPcE7o0bA/VLDgOqcqbOI/AAAAAAAAFas/K_QmdeCTtXA/s1600/1796843.jpg • https://en.wikipedia.org/wiki/Unicode_block • http://www.unicode.org/charts/About.html#PDF • http://www.unicode.org/charts/index.html • https://www.adictosaltrabajo.com/tutoriales/unicode/#Planos • http://univia.info/utc-unicode/ • https://techtastico.com/post/tipos-de-codificacion-de-caracteres/ • https://www.w3.org/International/questions/qa-doc-charset.es • http://punycode.es/tablas • http://3.bp.blogspot.com/-UfDGHF9vKWY/VLDgSf4Za7I/AAAAAAAAFbE/v0cRIrdFLMw/s1600/Technology_Wallpaper_by_Keroyx.jpg