190 likes | 555 Views
SEANCE 3. Représentation numérique de l’information. Représentation binaire: Codage binaire des caractères. Codage d’images. Exercices. Contenu de la séance 3:. Lundi 13 janvier 2014.
E N D
SEANCE 3 Représentation numérique de l’information Lundi 13 janvier 2 014
Représentation binaire: • Codage binaire des caractères. • Codage d’images. • Exercices. Contenu de la séance 3: Lundi13 janvier 2014
Problème : on a vu dans les précédents cours comment coder des entiers, des réels mais comment coder les caractères ? • Plusieurs codages existent. On peut en voir la liste dans un traitement de texte. • ASCII : American Standard Code for Information Interchange). • ASCII étendu sur 8 bits (code ISO Latin-1). • Unicode sur 16 bits. • UTF – 8. Codage binaire des caractères
Codé sur 7 bits = 128 valeurs, le 8ème bit étant utilisé pour vérification (lors des échanges de données). • Représentation de 128 caractères. • Ce n’est pas assez pour toutes les langues (non accentué) Code ASCII
8 bits = 256 caractères différents. C’est assez pour les langues latines et européennes. • Il code les caractères accentués : à, è … • Ce code est compatible avec le code ASCII (partage des 128 premiers caractères). Lien pour voir la conversion en hexadécimal : http://www.table-ascii.com/ ASCII étendu sur 8 bits
Les codes suivants se rajoutent à la table précédente : Table ASCII étendu
16 bits = 65 536 caractères différents, assez pour coder tous les caractères de toutes les langues. • Il est compatible avec le code ASCII. • Problème : il consomme de la mémoire et la gestion des caractères sur 2 octets est un peu plus compliquée. • Actuellement, il y a 50 000 caractères définis Unicode sur 16 bits
Code tous les caractères de la norme Unicode. • Chaque caractère ASCII se code en UTF – 8 sous la forme d’un unique octet. • Pour les caractères non ASCII, ils se codent sur 2 à 4 octets. • Il est d'un usage de plus en plus courant sur l’Internet, et dans les systèmes devant échanger de l'information. • Le codage est donc de taille variable (décodage plus complexe). UTF - 8
Principe : • Les caractères ayant une valeur de 0 à 127 sont codés sur un seul octet dont le bit de poids fort est nul. • Les points de code de valeur supérieure à 127 sont codés sur plusieurs octets. Les bits de poids fort du premier octet forment une suite de 1 de longueur égale au nombre d'octets utilisés pour coder le caractère, les octets suivants ayant 10 comme bits de poids fort. UTF - 8
Qu’est-ce qu’une image numérique ? On souhaite décrire l’image suivante : Pour décrire l’image , une possibilité est de dire : « cette image est formée d’un cercle ». On peut même être plus précis et indiquer les coordonnées du centre du cercle et son rayon. Et, à partir de cette description, n’importe qui pourrait reconstituer le dessin. On peut donc représenter cette image par trois nombres : deux pour les coordonnées du centre et un pour le rayon. Une image formée de plusieurs cercles serait de même décrite par trois nombres pour chacun d’eux. On peut représenter d’une manière similaire un dessin formé de cercles et de rectangles, en représentant chaque figure par une lettre, « c » pour un cercle, « r » pour un rectangle, suivi d’une suite de nombres qui définissent les paramètres de la figure. On parle alors de représentation symbolique, ou parfois de représentation vectorielle, d’une image. Néanmoins, cette méthode est peu pratique pour représenter une image quelconque. Codage des Images.
Une autre méthode, qui a l’avantage de pouvoir être utilisée sur n’importe quelle image, consiste à superposer un quadrillage à l’image . Chacune des cases de ce quadrillage s’appelle un pixel(pictureelement). On noircit ensuite les pixels qui contiennent une portion de trait. Puis, il suffit d’indiquer la couleur de chacun des pixels, en les lisant de gauche à droite et de haut en bas, comme un texte. Ce dessin se décrit donc par une suite de mots « blanc » ou « noir ». Comme seuls les mots « noir » ou « blanc » sont utilisés, on peut être plus économe et remplacer chacun de ces mots par un bit, par exemple 1 pour « noir » et 0 pour « blanc ». Le dessin ci-avant, avec une grille de 10 × 10, se décrit alors par la suite de 100 bits suivante : Donc : 0000000000 0011111100 0110000110 0100000010 0100000010 0100000010 0100000010 0110000110 0011111100 0000000000 Codage des Images.
Cette description est assez approximative, mais on peut la rendre plus précise en utilisant un quadrillage, non plus de 10 × 10 pixels, mais de 100 × 100 pixels. À partir de quelques millions de pixels, notre œil n’est plus capable de faire la différence entre les deux images. Cette manière de représenter une image sous la forme d’une suite de pixels, chacun exprimés sur un bit, s’appelle une bitmap. C’est une méthode approximative, mais universelle : n’importe quelle image en noir et blanc peut se décrire ainsi. On parle de discrétisation: on passe d’une image continue à des nombres entiers discontinus. Codage des Images.
Exemple :Considérons l’image d’un trait simple. En discrétisant, on obtient l’image qui sera affichée, manipulée par l’ordinateur, ou imprimée : Image discrétisation image numérique L’image de droite donne une piètre représentation de l’image originale ! La grille de discrétisation est bien trop grossière. On obtient des meilleurs résultats avec des grilles plus fines. Discrétisation :
Image discrétisation image numérique Discrétisation :
On stocke un texte, une image, un son, etc. par exemple sur un disque, dans un fichier. Pour le moment, nous avons juste besoin de savoir qu’un fichier est un mot, c’est-à-dire une suite de 0 et de 1, auquel on a attribué un nom. Si on trouve un fichier qui contient la suite de bits : 0000000000001111110001100001100100000010010000001001000000100100000010011000011000111111000000000000 il n’est pas a priori évident que cette suite exprime une image de 10 × 10 pixels. Il pourrait aussi s’agir par exemple d’un texte en ASCII, ou de la représentation d’un nombre à virgule. Pour cette raison, au lieu d’appeler le fichier simplement cercle, on l’appelle cercle.pbm. Cette extension pbm du nom indique que ce fichier est exprimé dans le format PBM(Portable BitMap). Ce format est l’un des plus simples pour exprimer des images. Un fichier au format PBM est un fichier en ASCII qui se compose comme suit : • les caractères P1, suivis d’un retour à la ligne ou d’un espace, • la largeur de l’image, en base 10, suivie d’un retour à la ligne ou d’un • espace, • la hauteur de l’image, en base 10, suivie d’un retour à la ligne ou d’un • espace, • la liste des pixels, ligne par ligne, de haut en bas et de gauche à droite Notion de format :
P1 # Mon premier fichier PBM : cercle 10 10 0000000000 0011111100 0110000110 0100000010 0100000010 0100000010 0100000010 0110000110 0011111100 0000000000 C’est le code de notre cercle ! Notion de format :