500 likes | 705 Views
Características del Tráfico de Redes. Prof. Dr. Claudio Enrique Righetti Aplicaciones Escalables en Redes Globales 2 Cuatrimestre 2006 – Segundo Curso Departamento de Computación Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires. Motivación.
E N D
Características del Tráfico de Redes Prof. Dr. Claudio Enrique Righetti Aplicaciones Escalables en Redes Globales 2 Cuatrimestre 2006 – Segundo Curso Departamento de Computación Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires
Motivación Comprender el comportamiento del tráfico de red es esencial para todos los aspectos relacionados con el diseño/operación de una red o sistema: • Provisioning • Administración • Modelización • Simulación • Diseño de Componentes • Diseño de Protocolos
Lecturas recomendadas • [LTW+94] W. Leland, M. Taqqu, W. Willinger, D. Wilson, On the Self-Similar Nature of Ethernet Traffic, IEEE/ACM TON, 1994. • Baker Award winner • [PF95] V. Paxson, S. Floyd, Wide-Area Traffic: The Failure of Poisson Modeling, IEEE/ACM TON, 1995. • [CB97] M. Crovella, A. Bestavros, Self-Similarity in World Wide Web Traffic: Evidence and Possible Causes, IEEE/ACM TON, 1997.
Características del Tráfico Dado un periodo T podemos medir: • Medio • Pico • Varianza • Burstiness • Parámetro de Hurst (H)
Intensidad del Tráfico o Tráfico Medio La llegada media de un flujo de tráfico (m) describe la intensidad del tráfico donde Ai es el número de llegadas en el tiempo i.
Tráfico Pico El tráfico pico p, mide el valor más alto del número de llegadas en una instancia en particular sobre un periodo de tiempo Donde Ai número de llegadas al tiempo i.
Varianza La varianza mide la dispersión de un flujo de tráfico donde Ai número de llegadas en el tiempo i. i = 1,2,…,k. • Desviación Standard =
Burstiness Burstiness describe “how bursty” es un flujo de tráfico donde desviación m valor medio del tráfico Se suele denominar también “coeficiente de dispersión “
log V(A)n log n Parámetro de Hurst n: intervalo temporal de agregación V(A)n: varianza de A en el intervalo n.
LRD SRD log Vn Parámetro de Hurst H = /2 Si 1 (o H0.5), tráficoes LRD ( Long Range Dependent ) Si 1 (o H0.5), tráfico es SRD (Short Range Dependent) log n
Teorema del limite Central Sean X1, X2, …, Xn una secuencia de variables random independientes idénticamente distribuidas con un valor medio y una varianza 2. Entonces la distribución : Tiende a la Standard normal cuando n es grande
Un primer modelo • La modelizacion de tráfico en la telefonía por conmutación de circuitos fue la base en los modelos iniciales de red • Se asume que los procesos de llegada son de Poisson • La duración de una llamada es de Poisson • Basados en esas suposiciones se estableció una bien conocida literatura sobre teoría de colas
Modelo Poisson • Marco de trabajo establecido desde hace décadas • Los eventos de red (llegadas de paquetes, llegadas de conexiones) se modelan como independientes, dichos eventos son producidos por un “gran” # de clientes • Tiempo entre “llamadas” (eventos) están distribuidos exponencialmente ( # de llamadas ~ Poisson ) • con un único parámetro de “” ( velocidad media ) • Esto implica (Si asumimos un modelo de Poisson): • Correlaciones son “fugaces” y los bursts son limitados • La agregación de tráfico tiende a suavizarse rápidamente
El inicio de un trabajo fundacional … • En 1989, Leland et al comenzaron a recolectar trazas de tráfico • Tráfico Ethernet de un gran laboratorio [1] • Time stamps de 100 m sec. • Packet length, status, 60 bytes de data • Principalmente tráfico IP (una suerte de mini backbone NFS) • Periodo de 3 años , 4 conjuntos de datos • Trazas consideradas representativas de un uso normal [1] Bellcore Morristown Research and Engineering Center
Tráfico Ethernet vs. Poisson Taqqu et al., (1997)
Previous Region 10 Vern Paxson (March 5th, 2004)
Tráfico Real - Burstiness • Las correlaciones son fuertes en un gran rango • Espectro de Potencia: • Es plano para procesos de Poisson • Para el medido diverge a cuando 0
Caracterizando Tráfico con Fractales • Leland et al [LTW+94] proponen capturar tales características utilizando auto-similaridad, una forma de modelar basada en fractales: • Parametrizado por parámetro de “ Hurst” • Valor medio y varianza finitos • La serie temporal debe ser muy gran grande para poder testear dicho comportamiento • El Modelo predice burstiness en todas las escalas de tiempo • delays de encolado/probalidad de drop mucho mas alta que las que se predicen con modelos basados en procesos de Poisson
Proceso Auto-Similar vs. Poisson • Poisson • Cuando observamos en una escala pequeña de tiempo el mismo presenta ráfagas • Cuando agregamos “coarse time scale” tiende a suavizarse (smooth) a ruido blanco • Auto-Similar • Cuando agregamos sobre amplias escalas de tiempo se mantienen las características de ráfagas
Procesos Auto-Similares • Propiedades : a) Decaimiento lento de la varianza b) Dependencia a largo plazo Las cuales se hacen presentes al aumentar elnivel de agregación Def.
Agregación • Cada • Se tiene Donde se crea una nueva serie en el tiempo obtenida por el promedio de la serie original con bloques que no se solapan de tamaño m
Auto- Similaridad • Los procesos Auto-Similares (SS Self-similar)es la forma mas simple de modelar procesoscon dependencia de largo plazo (LRDlong-range dependence ) ( correlaciones que persisten a lo largo de largas escalas de tiempo ) • La funcion de autocorrelacion r(k) de un proceso con LRD : • Sr(k)= • r(k) @ k-b as k para 0 < b < 1 • La funcion de autocorrelacion sigue una “power law” • Decaimiento lento • Espectro de potencia es hiperbolico cuando 0 • Si Sr(k) < SRD short-range dependence
Auto-Similar • Si consideramos las serie temporal X = (Xt ; t = 1,2,3,…), definimos la serie de agregación m a X(m)= (Xk(m);k = 1,2,3,…) a la sumatoria de X sobre bloques de tamaño m. Decimos que X es H-Auto-similar (H-self-similar) si para todos los valores positivos de m, X(m) tiene la misma distribución que X “reescalado” por mH. • Si X es H-self-similar tiene la misma función de auto correlación r(k) que la serie X(m) para todo m. • El grado de Auto-Similaridad SS se expresa como la velocidad de decaiminiento de la serie de la función de auto correlación usando como parámetro H ( Hurst) • H = 1 - b /2 • Para series SS con LRD, ½ < H < 1 • El grado de SS y la LRD se incrementan cuando H 1
Estimadores Gráficos • Grafico Varianza-tiempo ( Varianza de los agregados ) • Se basa en el decaimiento lento de la varianza de un serie auto-similar • Se grafico la varianza de X(m) versus m en escala log-log • Pendiente (-b) menor que –1 indica SS (self-similarity) • Grafico R/S • Se basa en el grafico reescalado (R/S) el cual crece estadísticamente en forma similar a una power law con H como una función del numero de puntos n ploteados • Describe la propiedad de LRD mediante un estudio de las autocorrelaciones del trafico agregado • Se grafica R/S versus n en una escala log-log la pendiente estima H • Periodogram plot • Wavelet
Plot R/S Pendiente 1.0 R/S Pendiente 0.5 Tamano bloque n
Plot R/S Pendiente H (0.5 < H < 1.0) (Hurst ) Pendiente 1.0 R/S Pendiente 0.5 Tamano bloque n
Análisis del Tráfico Ethernet [LTW+94] • Del análisis de los logs de trafico desde la perspectiva de la unidad paquetes/tiempo se encontró que el mismo tiene un comportamiento auto-similar con un parámetro entre 0.8 y 0.95. • Agregaciones sobre muchos ordenes de magnitud • Los tráficos WAN tendrían comportamiento similar • Fue el primer uso de un conjunto MUY grande de mediciones en investigación de red • Condujo al modelo de trafico ON-OFF
Modelos • ON-OFF • Poisson • AutoregresivoGaussiano • Markov Modulated • M/Pareto
Velocidad Pon Poff (en %) r t Modelo ON-OFF (1) • El tráfico alterna entre dos periodos: ON - OFF • ON: se genera tráfico a una velocidad r. • La longitud de ON y OFF son independientes y pueden tener distribuciones distintas m = Pon r varianza= r2 (Pon)(1Pon) = m (r m)
Modelo ON-OFF (2) Si consideramos N fuentes independientes : Donde m es el valor medio de cada fuente ON-OFF y r es la velocidad de datos de cada una Valor medio Agregado = Nm Varianza Agregada = N [m (r m)]
Pn(t) = et Poisson Poisson Poisson … Poisson (t)n n! => Poisson … Poisson • Función densidad de probabilidad, PDF (Probability density function ) • Poisson esta categorizado, por un parámetro . • La agregación de tráfico de Poisson es también Poisson
Modelo Autorregresivo Gaussiano • Procesos Gaussianos con tres parametros son suficientes para estimar performance de encolado • Procesos autorregresivos de 1-orden : • donde Un es Gaussiana con valor medio y varianza 2. • a, b son reales con |a| < 1. • Para caracterizar el tráficoreal, necesitamos encontrar la mejor forma de ajuste de los parámetros: a, b, , .
r1 rate 1 rate 2 r2 data rate 1 t 2 Modelo MMPP MMPP = Markov Modulated Poisson Process
Modelo M/Pareto • Tráfico Fractal está caracterizado por “long bursts” • Long bursts son causados por • descarga de archivos grandes • alto nivel de variable bit rate (VBR) producto de video • intensive burst por la actividad de BD • M/Pareto caracteriza el tráfico Fractal.
La duración distribución de Pareto t r data rate arrival Modelo M/Pareto(1) • El proceso de llegada es de Poisson • Cada llegada trasnporta una ráfaga de transmisiones • La duración de la transmisión está distribuida Pareto
La duración distribución de Pareto t Llegadas Poisson con parametro Modelo M/Pareto(2)
Modelo M/Pareto(3) Distribución de Pareto donde y
Modelo M/Pareto(4) Consideremos el tráfico dentro un intervalo de tiempo t en el modelo M/Pareto El tráfico M/Pareto está categorizado por cuatro parámetros: ,, (indice tail), r
Modelo M/Pareto(5) • En un enlace LAN- BACKBONE LOCAL pequeño • En enlace BACKBONE LOCAL- Router a Internet grande • Enlace Router – Router de un AS grande