420 likes | 561 Views
Armazenamento Secundário. Modelo de Von Neumann. Periféricos de Entrada/Saída. UC. UAL. Registradores. Memória. UCP. Memória Principal/Primária RAM/DRAM/SDRAM. não voláteis normalmente magnéticas muito lentas (em relação à mem. principal – solução: caché) Abordagem nessa aula:
E N D
Armazenamento Secundário Modelo de Von Neumann Periféricos de Entrada/Saída UC UAL Registradores Memória UCP Memória Principal/Primária RAM/DRAM/SDRAM • não voláteis • normalmente magnéticas • muito lentas (em relação à mem. principal – solução: caché) • Abordagem nessa aula: • Discos Magnéticos • Interfaces • R.A.I.D. caché Hierarquia de memória Memória Secundária Discos magnéticos / ópticos Memória Terciária Fitas/cartuchos magnéticos
memory bus (barramento de memória) cache L1 cache L2 UCP Memória Adaptador de barramento I/O bus (barramento de E/S) Controlador de barramento universal Controlador de disco Controlador de vídeo Controlador de teclado Interface Paralela Interface Serial
Discos Magnéticos e Interfaces Pratos Trilhas Setores Prato Trilha
Discos Magnéticos e Interfaces Parâmetros de desempenho: - tempo médio de busca - atraso rotacional ou latência de rotação - tempo de transferência - sobretaxa de transferência - atraso em fila Parâmetros de confiabilidade: - MTBF = MTTF - taxa de erros de leitura de bit recuperáveis - taxa de erros de leitura de bit irrecuperáveis
Discos Magnéticos e Interfaces Especificações técnicas de confiabilidade de discos magnéticos. (Seagate, 2002)
Discos Magnéticos e Interfaces Mecanismos de Detecção e Predicção de Erros: - CRC (Cyclic Redundancy Check) - S.M.A.R.T. (Self-Monitoring, Analysis and Reporting Technologies) Interfaces: - IDE/ATA vs SCSI - Alternativas: - USB - Firewire IEEE-1394 - Canais de fibra (fiber channel) - Serial ATA
Topologia das Interfaces (SCSI) Controladora de E/S barramento PCI canal 0 Controladora SCSI ID0 ID1 ID2 ID16 canal 1 ID1 ID2 ID16 ID0
Padrão SCSI Qtde de discos suportados Tamanho máximo de cabo Velocidade do barramento Largura de barramento Taxa de transf. SCSI-1 8 6 m 5 MHz 8 5MB/s Fast SCSI 8 3 m 10 MHz 8 10 MB/s SCSI-2 8 3 m 5 MHz 8 5 MB/s Fast/Wide Scsi-2 16 3 m 10 MHz 16 20 MB/s Ultra SCSI 8 1,5 m 20 MHz 8 20 MB/s Ultra/Wide SCSI 16 1,5 m 20 MHz 16 40 MB/s Ultra2 SCSI (LVD) 16 12 m 40 MHz 16 80 MB/s Ultra3/160 SCSI 16 12 m 40 MHz 16 160 MB/s Tabela de versões da interface SCSI (DOMINGUEZ; COLLIGAN, 1999)
Canal ATA Primário Controlador ATA Mestre Escravo Canal ATA Secundário Mestre Escravo Topologia das Interfaces (ATA / SATA) • 16 linhas de dados (paralela) • até 133MB/s (DMA modo 6) • 2 devices por canal/cabo • 40 pinos cabo de dados • 4 pinos cabo de alimentação SATA Port • 4 linhas de dados (serial Tx e Rx) • 1,5Gb/s diferential NRZ serial stream • 1 device por SATA port • 7 pinos conector de dados • 15 pinos conector de alimentação • Especificação em : http://www.serialata.org Controlador Serial ATA SATA Drive SATA Port SATA Drive
Tabela de versões da interface ATA (DOMINGUEZ; COLLIGAN, 1999) Modo de Transferência de Dados Taxa máxima de Transferência de Dados Pinos por Conector Quantidade de Condutores Versão ATA PIO Modo 0 3,33 MB/s 40 40 ATA-1 PIO Modo 1 5,22 MB/s 40 40 ATA-1 PIO Modo 2 8,33 MB/s 40 40 ATA-1 PIO Modo 3 11,1 MB/s 40 40 Fast ATA PIO Modo 4 16,7 MB/s 40 40 ATA-3 DMA Modo 1 11,1 MB/s 40 40 Fast ATA DMA Modo 1 (Multiword) 13,3 MB/s 40 40 ATA-2 DMA Modo 2 (Multiword) 16,6MB/s 40 40 ATA-3 Ultra ATA DMA Modo 2 33,3 MB/s 40 40 ATA-4 Ultra ATA DMA Modo 3 44,4 MB/s 40 80 ATA-5 Ultra ATA DMA Modo 4 66,6 MB/s 40 80 ATA-5 Ultra ATA 100 DMA Modo 5 99,9 MB/s 40 80 ATA-5 Ultra ATA 133 DMA Modo 6 133 MB/s 40 80 ATA-5
Servidor Servidor Discos Rx Tx Tx Rx Tx Rx Rx Tx Ponto a Ponto Loop Arbitrário Comutador Comutação de Malha Servidores Matrizes de Disco Topologia das Interfaces (Fiber Channel)
processor-centric data-centric A Importância do Armazenamento Secundário (COURTRIGHT, 1997)
64KBytes 16KBytes 16KBytes 16KBytes 16KBytes Fragmentação de Dados
9GB 9GB 9GB 9GB 9GB 9GB 9GB 1 Disco lógico de 63 GB Matriz de 7x9GB de discos físicos Fragmentação de Dados
Fragmentação de Dados - Kim e Salem, 1984 - alto desempenho - paralelismo de instruções de E/S independentes - instruções de E/S abrangendo dados fragmentados em múltiplos discos - baixa confiabilidade
R. A. I. D. - David Patterson, 1988 - Universidade Berkeley - Califórnia - acrônimo de “Redundant Array of Inexpensive Disks” Matrizes Redundantes de Discos de Baixo Custo
RAIDs Originais - RAID nível 1 - Espelhamento - RAID nível 2 - Código de Hamming - RAID nível 3 - Paridade N+1 - Entrelaçamento nível de byte - RAID nível 4 - Paridade N+1 - Entrelaçamento nível de bloco - RAID nível 5 - Paridade N+1 Distribuída - Entrelaçamento nível de bloco
Bit Verificação 1 Bit Verificação 2 Bit Verificação 3 Bit Verificação 4 DISCO 1 Bit Dados 1 Bit Dados 2 Bit Dados 3 Bit Dados 4 DISCO 0 DADOS ESPELHADOS RAID nível 1 - Espelhamento
RAID nível 1 - Espelhamento - Palavra código: 2 bits – 1 dado e 1 verificação - alto custo - Sobretaxa = 100% - alto desempenho leitura - acesso simultâneo em ambos discos • política de escolha do disco a ser acessado pela • estimativa do tempo de busca para cada instrução de leitura - alta confiabilidade – simplicidade na implementação
RAID nível 2 – Código de Hamming A-D0-3 = Bits de dados ECC A-Dx, ECC A-Dy, ECC A-Dz = paridades dos subconjuntos de A-D0-3
1 b3 1 b1 b1 0 b2 b2 1 b7 1 1 1 1 b6 0 0 b5 b4 0 b4 Código de Hamming b1 b2 b3 b4 b5 b6 b7 b1, b2 e b4 = verificação b3, b5, b6 e b7 = dados (1011) Palavra Código 0 1 1 0 0 1 1
1 0 1 1 1 1 0 Código de Hamming Detecção e Correção de Erro Leitura errada do bit 5 0 1 1 0 1 1 1 b1 e b4 não conferem. Soma-se os índices para detectar o bit errado b5
Tamanho msg em bits (m) Núm. de bits de redundância (r) Tam. da palavra código em bits (n) Percentual de sobretaxa 4 3 7 75 8 4 12 50 16 5 21 31 32 6 38 19 64 7 71 11 128 8 136 6 256 9 265 4 512 10 522 2 1024 11 1035 1 RAID nível 2 – Código de Hamming
B1 B4 B7 B10 ... DISCO 0 B2 B5 B8 B11 ... DISCO 1 B3 B6 B9 B12 ... DISCO 2 P(B1,B2,B3) P(B4,B5,B6) P(B7,B8,B9) P(B10,B11,B12) ... DISCO 3 RAID nível 3 - Paridade N+1 Entrelaçamento nível de byte bn = bits de dados P(bx,by,bz) = paridade de bx, by e bz
RAID nível 3 - Paridade N+1 Entrelaçamento nível de byte - Palavra Código: N+1 bits – paridade par ou XOR dos N bits - mínimo de 3 discos - Confiabilidade: detecção simples de erro por paridade - baixo custo – Sobretaxa = 1/N-1 - Stripe = 1 byte - alto desempenho em pequenas leituras - baixo desempenho em grandes leituras/escritas
K0 K1 K2 P(K0,K1,K2) B0 B1 B2 ... B511 B512 B513 B514 ... B1023 B1024 B1025 B1026 ... B1535 P(B0,B512,B1024) P(B1,B513,B1025) P(B2,B514,B1026) ... P(B511,B1023,B1535 K3 K4 K5 P(K3,K4,K5) K6 K7 K8 P(K6,K7,K8) DISCO 0 DISCO 1 DISCO 2 DISCO 3 RAID nível 4 - Paridade N+1 Entrelaçamento nível de bloco Bn = byte de dados P(Bx,By,Bz) = paridade de Bx, By e Bz Kn = Blocos de dados de 512 Bytes P(Kx,Ky,Kz) = bloco de paridade de Kx, Ky e Kz
RAID nível 4 - Paridade N+1 Entrelaçamento nível de bloco - custo e confiabilidade idem RAID 3 - bom desempenho em grandes leituras - baixo desempenho em escrita - gargalo: disco de paridade - operações RMW
K0 K1 K2 P(K0,K1,K2) P(K3,K4,K5) K3 K4 K5 K6 P(K6,K7,K8) K7 K8 K9 K10 P(K9,K10,K11) K11 DISCO 0 DISCO 1 DISCO 2 DISCO 3 RAID nível 5 - Paridade N+1 distribuída Entrelaçamento nível de bloco Bn = byte de dados P(Bx,By,Bz) = paridade de Bx, By e Bz Kn = Blocos de dados de 512 Bytes P(Kx,Ky,Kz) = bloco de paridade de Kx, Ky e Kz
RAID nível 5 - Paridade N+1 distribuída Entrelaçamento nível de bloco - custo e confiabilidade idem RAIDs 3 e 4 - baixo desempenho em pequenas escritas - desempenho aceitável para grandes escritas - paridade distribuída
K0 K1 K2 K3 K4 K5 K6 K7 K8 K9 K10 K11 K12 K13 K14 K15 DISCO 0 DISCO 1 DISCO 2 DISCO 3 RAIDs Derivados - RAID 0 (Sem Redundância)
INFORMAÇÃO F 2 4 1 5 3 0 E D A B 6 7 8 C VERIFICAÇÃO RAIDs Derivados - Matriz Bi-dimensional de Disco
Discos de Dados (D) Discos de Paridade (P) Total de discos (N) Sobretaxa Sobretaxa Hamming / N 4 4 8 50% 75% / 7 6 5 11 45% 50% / 12 8 6 14 43% 9 6 15 40% 10 7 17 41% 12 7 19 37% 31% / 21 25 10 35 29% 19% / 32 100 20 120 17% 6% / 128 1000 110 1110 10% 1% / 1024 RAIDs Derivados - Matriz Bi-dimensional de Disco
Controladora SCSI MTTF=120.000 horas Alimentação AC - MTTF=4.900 horas ~ Cabo Scsi MTTF=21.000.000 horas MTTF= 123.000 horas Fonte Ventilação MTTF= 195.000 horas Cabo alimentação MTTF=10.000.000 horas Discos MTTFs CARACTERÍSTICOS DE ALGUNS COMPONENTES DE SISTEMA Falhas de Sistemas
Solução: Redundância nos Pontos Críticos de Falha Solução para Tolerância a Falhas de Sistema
Opção 2 Opção 1 Controladores de Barramento ou Cadeia RAIDs Derivados - Ortogonal
D0 D1 D2 D3 P12 P23 P30 P01 RAIDs Derivados - RM-2 (Redundant Matrix) - possibilita dupla falha simultânea de disco sem perda de dados - utiliza dupla paridade - sobretaxa com redundância = 1/M e N = 2M+1
A0 A1 A2 B0 B1 B2 C0 C1 C2 A512 A513 A514 B512 B513 B514 C512 C513 C514 P(B0,C0) P(B1,C1) P(B2,C2) P(A0,C512) P(A1,C513) P(A2,C514) P(A512,B512) P(A513,B513) P(A514,B514) DISCO 0 DISCO 1 DISCO 2 RAIDs Derivados - Dados e Paridade não entrelaçados • idealizado para sistemas • de Banco de Dados • (Gray et al. apud Gibson, 1991) • melhor desempenho • em pequenas leituras • mesmo custo de N+1, • alternativa para mirror • não fragmenta os dados: • cada disco corresponde • a 1 sistema de arquivos
+ + *1 *1 *1 *1 C2 A A B C2 B C1 C1 Modulo 2 Modulo 4 *1 *2 *1 *1 + + Binário Não-Binário RAIDs Derivados - Código Não-Binário
RAID 1 D3 D5 D4 D2 D0 D2 D5 D3 D0 D1 D4 D1 RAID 0 RAID 0 D0’ D1’ RAID 1 D0’ RAID 1 D1’ RAID 0 RAID 1 D2’ RAIDs Derivados - RAID em Camadas RAID 0+1
RAID 0 D8 D6 D5 D4 D7 D2 D1 D0 D3 D0’ RAID 0 D1’ RAID 3 RAID 0 D2’ RAIDs Derivados - RAID em Camadas RAID 0+3
Referências ASHAR, Kanu G. Magnetic Disk Drive Technology: Heads, Media, Channel, Interfaces and Integration. New York, USA: IEEE Press, 1996. CARDENAS, D. Glen; CATENA, Jose-Maria. SCSI vs. IDE. A Complete Assessment. Site ProRec.com, 2000. Disponível em <http://www.prorec.com/prorec/articles.nsf/articles/1A37C1C69674D6D786256950005D2C39>. Acesso em 13 dez. 2002. COURTRIGHT, William V. A Transactional Approach to Redundant Disk Array Implementation. A Dissertation submitted to the Department of Electrical and Computer Engineering in Partial Fulfillment of the Requirements for the Degree of Doctor of Philosophy. Pittsburgh: Carnegie Mellon University, 1997. DOMINGUEZ, Ricardo; COLLIGAN, Tom. SCSI vs. ATA: Interface Comparison. Site da Dell Computer Corporation: Vectors Technology Information Center, 1999. Disponível em <http://www.dell.com/us/en/gen/topics/vectors_1999-atascsi.htm>. Acesso em 8 ago. 2002. FERREIRA, Enderson; ALMEIDA JR, Jorge Rady de. Análise de Confiabilidade de Sistemas Redundantes de Armazenamento em Discos Magnéticos. São Paulo,2003. 145 p. (Mestrado) – EPUSP / PCS GIBSON, Garth A. Redundant Disk Arrays - Reliable, Parallel Secondary Storage. The MIT Press, 1991. GILBERT, H. IDE and SCSI Disks. Das Boot, PC Lube and Tune, 1995. Disponível em <http://www.yale.edu/pclt/BOOT/DISKDEV.HTM>. Acesso em 16 jan. 2003. HWANG, Kai; JIN, Hai; HO, Roy S. C. Orthogonal Striping and Mirroring in Distributed RAID for I/O-Centric Cluster Computing. IEEE Transactions on Parallel and Distributed Systems, 2002. IBM. Self-Monitoring, Analysis and Reporting Technology. How S.M.A.R.T are your hard disk drives? Site da IBM: IBM Personal Systems Group, 1998. Disponível em <http://www.pc.ibm.com/us/infobrf/ibsmart.html>. Acesso em 12 dez. 2002. PATTERSON, David A., CHEN, Peter, GIBSON, Garth, KATZ, Randy H. Introduction to Redundant Arrays of Inexpensive Disks. Berkeley: University of California, 1989. SEAGATE. Especificações Técnicas HDs. Site da Seagate Technology LLC, 2002. Disponível em <http://www.seagate.com/cda/products/discsales/index>. Acesso em 18 nov. 2002.