360 likes | 514 Views
Modelo Analítico de Desempenho de SoCs baseado na Caracterização do Tráfego em Rede de Interconexação Intrachip. Exame de Qualificação de Doutorado em Microeletrônica Doutorando: Gustavo Adolfo Patino Alvarez Orientador: Prof. Dr. Wang Jiang Chau 18 de dezembro de 2009 LME-EPUSP.
E N D
Modelo Analítico de Desempenho de SoCs baseado na Caracterização do Tráfego em Rede de InterconexaçãoIntrachip Exame de Qualificação de Doutorado em Microeletrônica Doutorando: Gustavo Adolfo Patino Alvarez Orientador: Prof. Dr. Wang Jiang Chau 18 de dezembro de 2009 LME-EPUSP
Projeto de Sistemas sobre Silício (SoCs) baseados em Redes Intrachip (NoCs)
Modelos de Avaliação na Exploração do Espaço de Projeto [Gries04]
Objetivos • O principal objetivo deste trabalho é fornecer um modelo desempenho que a partir de um formalismo estocástico de primeira e segunda ordem, inclua também a modelagem do tráfego intrachip tendo em conta as características reais da carga de trabalho colocada por cada um dos núcleos IP que conformam o sistema.
Objetivos Específicos • Construir uma biblioteca de componentes, através da caracterização da funcionalidade dos núcleos IP. • Identificação das métricas de desempenho relevantes na análise e no projeto de sistemas sobre silício baseados em NoC. • Desenvolver uma metodologia que permita reunir os IPs específicos pré-caracterizados em uma utilização real, isto é, na aplicação específica considerada previamente como distribuída pelos IPs. • Desenvolver um conjunto de ferramentas de software que implementem a metodologia de análise de desempenho proposta neste projeto.
Contribuições • Uma solução completamente analítica ao problema de predizer e estimar o desempenho de sistemas sobre silício que estão baseados em uma estrutura de interconexão intrachip. • Uma metodologia de análise de desempenho que integre, através de um conjunto de ferramentas de software, as tarefas de caracterização dos núcleos IP considerados dentro do sistema.
Arquitetura de Comunicação • Evolução das Arquiteturas de Comunicação [Pasricha08]
Redes de Interconexão Intrachip (NoC) • Novo paradigma para comunicação em SoCs, baseado em conceitos das redes macro. • As NoCs usam pacotes para encaminhar dados, do PE fonte até o PE destino.
Exemplos de NoCs • Æthereal (Philips) • Octagon (STMicroelectronics) • Hermes (PUCRS, Brazil) • MANGO (Technical University of Denmark) • Nostrum (KTH in Stockholm) • QNoC (Technion in Israel) • SOCBUS (Linköping University) • Xpipes (Univ. of Bologna and Stanford University) 80 núcleos (2007) 9 núcleos (2005)
Tráfego • Em um sentido amplo, o tráfego em uma rede refere-se a uma seqüência de pacotes{Ai}, que vai de um nó fonte (ou servidor), até um nó destino (o qual pode ser outro servidor).
Características do Tráfego 1: LRD:Long Range Dependence 2: SRD : Short Range Dependence Ai é o número de chegadas no tempo i.
log V(A)n log n Parâmetro de Hurst • Si b1 (ou H0.5), • o tráfego é LRD ( Long Range Dependent ) • Si b1 (ou H0.5), • o tráfego é SRD (Short Range Dependent) H = b/2 n: intervalo temporal de agregação. V(A)n: variância de A no intervalo n.
Tráfego Real : Caracterizando o Tráfego con Fractais • Em [Leland94] foi proposto capturar tais características utilizando auto-similaridade, uma forma de modelar baseada em fractais: • Parametrizado pelo parâmetro de “ Hurst”. • Valor médio e variância finitos. • A série temporal deve ser muito grande para poder testar tal comportamento. • O modelo prediz burstiness em todas as escalas de tempo. • Atrasos de enfileiramento muito maiores que aqueles que são preditos com modelos baseados em processo de Poisson.
O que é auto-similaridade? [Mandelbrot 69] • A auto-similaridade descreve o fenômeno onde certa propriedade de um objeto é preservada com relação a um escalamento no espaço e/ou no tempo. • Se um objeto é auto-similar, suas partes, quando aumentadas, possuem a mesma forma da descrição completa do objeto.
Processo Auto-Similar vs. Poisson Taqqu et al., (1997)
Tempo de análise vs exatidão nos modelos de avaliação [Gries04]
Caracterização dos IPs Descrição em SystemC dos IPs Grafo da Arquitetura da NoC Grafo da Aplicação T.I T.V Estimação parâmetros de cada IP Identificação das Tarefas Modelagem de desempenho Modelo de Eventos Análise de Interferências e agregação de tráfegos T.VI T.IV Profiling Análise de carga de trabalho Função de estimação do tráfego Estimação dos tráfegos de entrada T.VIII Análise de fases T.II T.VII Modelo de Desempenho T.III Avaliação da metodologia T.X T.XI Resultados Tarefas da Metodologia Avaliação das métricas escolhidas T.XII T.IX
Representação da Arquitetura e da Aplicação T(R,Ch) • Grafo de Caracterização da Aplicação (APCG)G=G(C,A) • A Arquitetura NoC c1 c3 a1,3 c2 a1,2 a3,5 a4,1 a3,6 c4 a1,5 c5 a2,5 c6 a6,3 a4,5 a4,6
Particionamento Ferramenta De Alocação Linguagem de Especificação Ferramenta De Síntese A Linguagem de Entrada –SystemC • Pode ser necessário que a descrição de cada IP em SystemC seja traduzida em uma certa representação intermediária (RI) que capture e armazene a informação semântica e sintática do modelo comportamental do IP. • UnIR [Patiño05]. Modelo(s) Abstrato(s) Representação Intermediária Parsing
Pesquisa sobre funções para descrever tráfego • Modelo de Ruído Gaussiano Fracionário (FractionalGaussianNoise –FGN) • Modelo Browniano Fractal (Fractal BrownianModel, FBM) • FractionalAutoregressiveIntegratedMovingAverage (FARIMA) • Modelo ON/OFF • Modelo de Wavelet Multifractal (MWM)
Identificação das variáveis de desempenho a serem avaliadas • Identificar especificamente quais serão as métricas de desempenho que serão o alvo do modelo analítico de desempenho a ser desenvolvido, tendo em conta a seleção de métricas de desempenho encontradas em trabalhos como [Sepulveda06] e [Eslava08].
Identificação dos Benchmarks • Nos trabalhos [Soteriou06], [Tedesco06], [Scherrer09], [Varatkar04], basearam a avaliação dos seus modelos em aplicações do tipo MPEG-2, MP3, M-JPEG, S-JPEG. • Arquiteturas de redes NoC com topologia mesh 2D, sob diferentes condições nas políticas de roteamento e chaveamento, e usando plataformas e ferramentas disponíveis: • Rede Hermes (PUCRS) • HeMPS • Projeto Atlas • Ambientes de simulação • Noxim (University of Catania, Italia) • SoCLib (European partnership)
[Eslava08] EslavaGarzon, Johan Sebastian. “Estimativas de desempenho de Sistemas sobre Silicio a partir de modelos de transações”. PhD Thesis. Laboratory of Microelectronics, University of São Paulo, Brazil, 2008. • [Hansson09] Hansson, A. and Wiggers, M. and Moonen, A. and Goossens, K. and Bekooij, M. (2009) “Enabling application-level performance guarantees in network-based systems on chip by applying dataflow analysis”. IET Computers & Digital Techniques, 3 (5). pp. 398-412. ISSN 1751-8601 • [Gries04] Gries, M. 2004. “Methods for evaluating and covering the design space during early design development”. Integr. VLSI J. 38, 2 (Dec. 2004), 131-183 • [Lazarou09] G. Y. Lazarou, J. Baca, V. S. Frost, and J. B. Evans, “Describing network traffic using the index of variability,” Networking, IEEE/ACM Transactions on, vol. 17, no. 5, pp. 1672-1683, June 2009. • [Leland94] W. E. Leland, W. Willinger, M. S. Taqqu, and D. Wilson, “On the selfsimilar nature of Ethernet traffic”, IEEE/ACM Trans. Networking, vol. 2, no. 1, 1- 15, Feb. 1994. • [Mandelbrot69] B. B. Mandelbrot and J. R. Wallis, “Computer experiments with fractional Gaussian noises” Water Resources Research, vol. 5, pp. 228–267, Feb. 1969. • [Marculescu09] RaduMarculescu, Umit Y. Ogras, Li-ShiuanPeh, Natalie EnrightJerger, YatinHoskote. “Outstanding Research Problems in NoC Design: System, Microarchitecture, and Circuit Perspectives”. IEEE Transactions on Computer-Aided Design of Integrated Circuits and Systems, 28(1):3-21, January 2009. • [Qian09b] YueQian, Zhonghai Lu and Wenhua Dou, “Applying Network Calculus for Performance Analysis of Self-Similar Traffic in On-Chip Networks”, IEEE/ACM/IFIP 2009 International Conference on Hardware-Software Codesign and System Synthesis (CODES+ISSS'09), Grenoble, France, Oct. 11-16, 2009. • [Sepulveda06] SepulvedaFlorez, Martha Johanna. “Estimativa de desempenho de uma NoC a partir de seu modelo em SystemC – TLM”. Master dissertation. Laboratory of Microelectronics, University of São Paulo, Brazil, 2006. • [Scherrer09] Antoine Scherrer, Antoine Fraboulet, Tanguy Risset, “Long-range dependence and on-chip processor traffic”; Microprocessors & Microsystems, v.33 n.1, p.72-80, February, 2009. • [Shuo08] Zhang Shuo, Zhao Rongcai, An Ke, “On Generating Self-Similar Network Traffic Using Multi-core Processors”; Computer Science and Computational Technology, International Symposium on, vol. 1, pp. 667-672, 2008 International Symposium on Computer Science and Computational Technology, 2008. • [Soteriou06] Soteriou, V.; Hangsheng Wang; Peh, L., “A Statistical Traffic Model for On-Chip Interconnection Networks”; Modeling, Analysis, and Simulation of Computer and Telecommunication Systems, 2006. MASCOTS 2006. 14th IEEE International Symposium on; Monterey, California; pp. 104-116, 11-14 Sept. 2006.