710 likes | 866 Views
le MBone : les applications. Journées Réseaux JRES 97 La Rochelle 7 octobre 1997. Bernard Rapacchi, CNRS/UREC, CNRS/SHS Bernard.Rapacchi@urec.cnrs.fr. Techniques d'encodage et de compression. Digitalisation. échantillonnage. signal analogique. quantification. signal digitalisé.
E N D
le MBone : les applications Journées Réseaux JRES 97 La Rochelle 7 octobre 1997 Bernard Rapacchi, CNRS/UREC, CNRS/SHS Bernard.Rapacchi@urec.cnrs.fr
Digitalisation échantillonnage signal analogique quantification signal digitalisé
Préfiltrage Echantillonnage Quantification Codage Pulse Code Modulation (PCM) • Chaque échantillon est quantifié indépendamment des autres • codage linéaire ou logarithmique
Exemples de codages • Codage PCM de la voix : G.711 • Utilisation téléphonique • Codage logarithmique : -law • moins perceptible vers haute fréquence • Echantillonnage : 125 s (8kHz) • Amplitude : 8 bits • Codage qualité CD • Utilisation musicale • Codage linéaire : respect de la musique • oreille : de 10 à 20 000 Hz • Echantillonnage : 23 s (44.1 kHz) • Amplitude : 16 bits
Télévision analogique • Red/Green/Blue : RGB • transformation en 3 autres signaux • Luminance : • réponse de l'oeil à l'ensemble des longueurs d'ondes d'une source lumineuse • transporte la "luminosité" (N/B) et la « brillance » • Y = .30R + .59G + .14B • Chrominance : couleur • oeil moins sensible à la couleur qu'à la luminance • NTSC : nuance (hue), saturation, Y/I/Q • I = 0.74 (R-Y) - 0.27 (B-Y) ; Q = 0.48 (R-Y) + 0.41 (B-Y) • PAL : 2 signaux de chrominance, Y/U/V • U = 0.493 (B-Y) ; V = 0.877 (R-Y)
Techniques de compression : RLE, statistiques • Suppression des répétitions : RLE (Run Length Encoding) • n caractères successifs c sont remplacés par c suivi d'un caratère spécial et du nombre d'occurrence • N A M E : x x x x x x x x x x x x x • N A M E : x R 13 • Statistiques : même parties qui reviennent souvent • on utilise un dictionnaire • on recode les ensembles en fonction de leur fréquence d'occurrence : les plus grandes sont recodées par des codes plus petits
Techniques de compression : Huffman, transformations • Huffman : • généralisation pour les images des techniques "statistiques" • On calcule les fréquences d'apparition de chaque octet. • Même système de dictionnaire et de recodage • utilisé pour des ensembles d'images ou des images animées • Transformations : • On passe du domaine temporel ou spatial au domaine fréquentiel • On élimine les coefficients les moins significatifs • Fourier, Cosinus,...
Techniques de compression : différentiel • Différentiel (ou prédictif) : différence entre la valeur vraie et une prédiction • DPCM : différence avec la valeur précédente • modulation Delta : différence sur 1 bit (+/-) • ADPCM : prédiction extrapolée à partir des valeurs précédentes
Compression de l'audio • G.721 : ADPCM, 32 kbps, 4bits, 8kHz • G.722 : ~ADPCM, 48 à 64 kbps, • G.723 : ~ADPCM, 24 kbps, 3 bits, 8kHz • G.728 : 16 Kbps, bande passante 3.4kHz • GSM : téléphone mobile, 13 kbps • Linear Predictive Encoding (Xerox), 5 kbps • Code Excited Linear Prediction • Digital Video Interactive : ~ADPCM, 4 à 8 bits
Compression de l'audio : MPEG • Moving Picture Expert Group • 3 schémas possibles • Transformée de Fourier puis adaptation • MPEG-1 : 192 ou 256 kbps/canal, simple • MPEG-2 : 96 ou 128 kbps/canal, qualité CD • MPEG-3 : 64 kbps/canal, qualité CD
Compression de l'image : JPEG • Joint Photographic Expert Group • Mélange de plusieurs techniques : transformée cosinus discrète, quantification, run-length, Huffman • Compression possible jusqu'à 25:1 • Pertes possibles mais pas visibles • Mais problèmes si reconnaissance informatique
Compression de l'image animée • Corrélation spatiale • Corrélation temporelle • Réduction spatiale uniquement : • Motion-JPEG (M-JPEG), • facile à décompresser • Réduction spatiale et temporelle : • famille MPEG-vidéo
MPEG: principes • Macroblocs de 16x16 pixels/lum., et 8x8/chrom. • Images de référence : Intracoded (I), JPEG • Images prédites : Predicted (P) • Images interpolées : Bidirectionnal (B) • 2 paramètres : intervalles entre deux P (m) et entre deux I (n)
MPEG : principes • F1 : Intracodé, pas construite à partir d'autres • Certains blocs de F3 sont construit à partir de F1 par un vecteur de mouvement F1 F3
MPEG : m=3, n=12 • 1 et 13 (I) sont complètes • 4 est prédite / à 1, 7 / à 4 par différence • 2 est interpolée à partir de 1 et 4 • envoi : 1 4 2 3 7 5 6 10 8 9 13 11 12 16 14 ... I B P 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Famille MPEG • MPEG-1 : 352x240(NTSC) ou 352x288(PAL) • Qualité VCR, compression : ~ 25:1 • Pour stockage, 0.2 Mbps(audio) + 1.2 Mbps(vidéo) • MPEG-2 : • Qualité "broadcast", voire HDTV • Entre 4 et 6 Mbps • MPEG-4 • Vidéo-conférence, moins de 64 kbps
Standard H.320 : famille pour RNIS • Vidéo : H.261 • Audio : G.711, G.722, G.728 • Structure des blocs vidéo et audio : H.221 • Multiplexage information de contrôle : H.230 • Unités de Contrôle Multipoint : H.231 • Prise de connexions : H.242 • Encription : H.233
Standard H.261 • Format d'image : • 352x288/luminance, 176x144/chrominance • CIF mais aussi 1/4 de CIF -> QCIF • Débit d'images : max 30 im/s • Compression : • ressemble à MPEG • avec plus de pertes
Nouveaux standards • H.321 : réseaux B-ISDN • H.322 : réseaux locaux avec qualité de service garantie • H.323 : QoS non garantie ; LAN, Internet • H.324 : RTC (ShareVision de CreativeLabs)
Critères qualitatifs • Ne dépend pas de la source mais de la nature du récepteur • L'oreille est un différentiateur • silence de 40 ms sont reconnus, "bruit habituel" • L'oeil est un intégrateur • L'homme est plus sensible aux altérations du son qu'à celles de l'image
Audio : autres besoins • Délai de transit pour l'interactivité • Très sensible à la variation de délai • Egalisation de la transmission • ajout d'un délai supplémentaire • nécessité de "bufferisation" suffisante • synchronisation avec la vidéo • Taux d'erreur relativement faible
Réparer le signal audio • Signal compressé mais il y a des pertes • il faut remplacer les pertes par : • du silence : mais le silence est interprété par l'oreille • du bruit : plus efficace • répétition : pour les paquets de petite taille • interpolation : le son est très autorégressif
Réparer par redondance • en cas de congestion, l'émetteur est averti par le destinataire (RTCP) et agit. • Signal de base, paquet n, codé en ADPCM (32 kbps) • le même signal est codé en LPC à 4.8 kbps • la compression du paquet n est ajouté au paquet n+1 • on peut ajouter aussi à n+2 40ms de son à 32 kbps = 160 o n 40 ms à 4.8 kbps = 24 o n+1 n' n+2 n'+1 n'
La redondance : les limites • La taille du buffer de synchro doit être augmentée • Si le signal de base est déjà très compressé (8 ou 4.8 kbps), la reconstitution est faible • effet pervers : le réseau est saturé et la réponse est qu'on augmente la taille des paquets
Vidéo : autres critères • Variation du délai : (suivi des lèvres) • HTDV : 50 ms, TV : 100 ms, Conférence : 400 ms • Erreurs de transmission • exemple : taux d'erreur 10-5 • Conférence : 1 sec. entre 2 images erronées • TV : 2 erreurs par image • HDTV (compressé) : 4 erreurs par image ! • Mais une "trame" reste 40 ms sur l'écran en PAL et 17 ms en HDTV • Intégration des erreurs • paquets manquants : extrapolation, interpolation
Applications : vat • Visual Audio Tool • Produit par le Lawrence Berkeley Laboratory • Permet l'audio, • Protocole ancêtre de RTP • Plusieurs contrôles : codage, compression,... • Gestion de la concurrence • numéro de version : v4.0b(1 ou 2) ; mai 1996
Robust Audio Tool • Développé au University College of London dans le projet MICE et MERCI, en cours... • A partir de vat • Redondance • Temporisation adaptée • Collaboration avec vic sur synchronisation des lèvres • numéro de version : 3.0.23, juillet 1997 • A l ’INRIA : FreePhone
Applications: nv • Net Video • Produit du Parc de Rank-Xerox • Permet la vidéo • Codage spécifique simplifié, possible CU-SeeMe • Possibilité de renvoyer son écran • Numéro de version : 3.0, juillet 1994
Applications : vic • Video Conference • produit par Lawrence Berkeley Laboratory • permet la vidéo avec concurrence par vat • codage h.261, nv, jpeg, … • Numéro de version : 2.8, juillet 1996
Applications : ivs • INRIA Videoconference System • Dans le projet MICE • Permet la vidéo et l'audio • Codage h.261 • Nouveau : Rendez-Vous mais en cours de développement
Applications : wb • White Board • Produit par Lawrence Berkeley Laboratory • Permet le partage de tableau blanc • Dessine ou importe des fichiers PostScript • Meilleure interactivité • Numéro de version : 1.60, janvier 1996
Applications : nt • NetText • Produit par Mark Handley (UCL) • Permet le partage de textes • Numéro de version : 1.5a23, octobre 1996.
Session Directory • Ancienne version : sd • Maintenant Sdr (projet MICE, UCL) • Permet le rendez-vous sur un évènement (advertised session) (SAP) • Permet aussi l'invitation (quick call) (SIP) • A la création définit les protocoles de transport et de codage de 4 types de média : audio, vidéo, wb, text (SDP) • ATTENTION : ne pas oublier le script « xm ». • Numéros de versions : • 2.3a1, novembre 1996 • 2.4a6, juillet 1997, incompatible avec 2.2 et 2.3