1 / 30

Diagnostika počítačů DGP_06

Diagnostika počítačů DGP_06. Prof. Ing. Karel Vlček, CSc. karel.vlcek@vsb.cz Katedra Informatiky, FEI, VŠB - TUO. Zabezpečení proti poruchám. Bezpečnost provozu systému je pravděpodobnost, že se na výstupu neobjeví nedetekovaná chyba Zvyšování bezpečnosti se děje dvěma způsoby:

elita
Download Presentation

Diagnostika počítačů DGP_06

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Diagnostika počítačů DGP_06 Prof. Ing. Karel Vlček, CSc. karel.vlcek@vsb.cz Katedra Informatiky, FEI, VŠB - TUO

  2. Zabezpečení proti poruchám • Bezpečnost provozu systému je pravděpodobnost, že se na výstupu neobjeví nedetekovaná chyba • Zvyšování bezpečnosti se děje dvěma způsoby: • 1. snižováním pravděpodobnosti výskytu chyb • 2. zvyšováním pravděpodobnosti detekce chyby Diagnostika počítačů

  3. Zabezpečení hlídačem • Hlídač je tvořen technickými i programovými prostředky Funkční jednotka Výstup dat Vstup dat Chyba Hlídač Diagnostika počítačů

  4. Realizace hlídače v čase • Hlídač může být realizován ze součástek, u nichž je výskyt poruchy vyjádřen v čase • Z toho důvodu je počítat s možností výskytu poruchy, která se může projevit jako chyba jeho funkce • Aby hlídač byl schopen kontrolovat správnost funkce, musí mít k dispozici určitou redundanci Diagnostika počítačů

  5. Obvody bezpečné proti poruchám • Nechť obvod realizuje logickou funkci Z = Z(X), kde X je vstupní a Z výstupní vektor • Množina vstupních vektorů je X a množina výstupníchvektorů je Z • Při použití kódového zabezpečení platí, že Z patří do prostoru Bn, n je počet bitů vektoru z a Bn je množina všech vektorů délky n Diagnostika počítačů

  6. Zdvojení (poprvé použito firmou Hitachi pro zabezpečení železnice) • Nejjednodušší realizace je zdvojení Funkční jednotka Vstupy Výstupy =1 Chyba Funkční jednotka 1 =1 Diagnostika počítačů

  7. =1 Chyba 1 =1 Kontrola inverzní funkcí • Funkční jednotka realizuje zobrazení prosté a druhá realizuje zobrazení inverzní Funkční jednotka F Vstupy Výstupy Funkční jednotka F-1 Diagnostika počítačů

  8. a a AND b & non a b 1 non (a AND b) non b Dvojdrátová logika • Logický součin Diagnostika počítačů

  9. a a OR b non a b & non (a OR b) non b Dvojdrátová logika • Logický součet 1 Diagnostika počítačů

  10. Dvojdrátová logika • Negace a non a non a a Diagnostika počítačů

  11. Použití detekčních kódů • Lze použít například při kontrole aritmetických funkcí tím, že je generován zbytek po operaci sčítání • Často je kontrolována platnost kódu výstupu například u dekodéru pomocí bloku součtu modulo2 • Nejčastější aplikací je hlídač parity, který provádí detekci chyb Diagnostika počítačů

  12. Hlídače kódu k z 2k • Přes svoji nadbytečnost, která je i 100% jsou poměrně často užívané • Výhodou je snadná realizace samočinně kontrolovaného hlídače • Principem úplné samočinné kontroly je to, že každá porucha, která změní chování obvodu je na výstupu detekována hlídačem kódu Diagnostika počítačů

  13. Úplně samočinně kontrolované obvody • Přes svoji nadbytečnost, která je i 100% jsou poměrně často užívané • Výhodou je snadná realizace samočinně kontrolovaného hlídače • Principem úplné samočinné kontroly je to, že každá porucha, která změní chování obvodu je na výstupu detekována hlídačem kódu Diagnostika počítačů

  14. Hlídací časovač - princip • Pro kontrolu složitějších obvodů je možné použít tzv. hlídacího časovače (watchdog timer) • Hlídací časovač bývá aplikován u mikroprocesorů, kde využívá komplexní funkce přerušení • Tento obvod kontroluje, zda je procesor schopen periodicky reagovat na přerušení Diagnostika počítačů

  15. Hlídací časovač – způsob aplikace • Realizace hlídacího časovače Nastavení Žádost o přerušení C1 Procesor Start Inicializace Hodiny C2 Výstražný obvod Signalizace Hodiny Diagnostika počítačů

  16. Hlídací časovač – popis bloků • Funkce dvou čítačů C1 a C2 v zapojení hlídacího časovače je k tomu, aby bylo kontrolováno, zda je procesor schopen periodicky reagovat na přerušení • C1 začne odměřovat čas a vyšle procesoru žádost o přerušení • Současně s tím se spustí C2, který odměřuje, kdy má být žádost spuštěna znovu • Pokud nenastane přerušení, je aktivován výstražný obvod Diagnostika počítačů

  17. Architektura systémů odolných proti poruchám • Požadavky na vysokou spolehlivost číslicových systémů dokumentují systémy zaměřené na zvýšení odolnosti proti poruchám • Bylo nalezeno mnoho dílčích řešení subsystémů, ale dosud chybí ucelená teorie odolnosti proti poruchám, která by byla obecně použitelná pro konstrukci systémů počítačů Diagnostika počítačů

  18. Architektura systému SAPO • K prvním počítačům, který byl k této úloze vybaven, byl počítač SAPO československé výroby z VÚMS Praha (doc. A. Svoboda) • Počítač SAPO měl tři aritmetické jednotky pracující systémem TMR (Triple ModularRedundant) • Poruchy mohly být maskovány na základě majoritního vyhodnocení bezporuchové činnosti Diagnostika počítačů

  19. X f1 F1 M ≥2 f F2 f2 f3 F3 TMR (Triple ModularRedundant) • Struktura systému TMR Diagnostika počítačů

  20. Zobecnění: TMR → NMR • Zobecněním systému TMR na systém NMR spočívá ve zvětšení počtu modulů • Všechny jednotky opět zpracovávají stejná vstupní data podle stejného programu • Výstupy všech N jednotek jsou přivedeny do majoritního členu, jehož práh je M = (N+1)/2 • Majorita je definovaná jako funkce pro lichý počet argumentů, proto je N liché číslo Diagnostika počítačů

  21. X f1 F1 ≥M f F2 f2 ׃׃ fN F3 NMR (N-ModularRedundant) • Struktura systému NMR Diagnostika počítačů

  22. FTMP (Fault Tolerant Multiprocessor) • Základní typ zálohy využitý při práci systému FTMP je konfigurace GMR (General Modular Redundant) • GMR systém pracuje s tzv. dynamickou zálohou, při které jsou zálohovací moduly v činnosti, aby byly ihned připraveny k činnosti • FTMP sestával z ze 14 procesorů, 7 modulů pamětí a dvou modulů vstupů a výstupů, byl použit pro simulaci řízení letounu Boeing 707 Diagnostika počítačů

  23. Počítač raketoplánu NASA • Základním modulem je počítač GPC (General Purpose Computer) doplněný o procesorem vstupů a výstupů • Počítačů GPC bylo zapojeno pět • Každý počítač je vybaven čtyřmi zobrazovacími jednotkami z nichž tři jsou v pilotní kabině a jedna na zádi • Kromě 24 sběrnicových spojení bylo použito i přímé spojení mezi vstupními / výstupními procesory a pamětí Diagnostika počítačů

  24. GPC 1 IOP 1 GPC 2 IOP 2 GPC 3 IOP 3 GPC 4 IOP 4 GPC 5 IOP 5 24 sběrnic Vnější paměť Zobrazovací jednotky a klávesnice Telemetrické přístroje Ovládací panely Navigace a styk s pohonnou jednotkou Řízení manipulace s nákladem Příprava a řízení startu Počítač raketoplánu NASA Přímé spojení mezi vstupními / výstupními moduly a pamětí Diagnostika počítačů

  25. Systémy pro řízení kolejové dopravy • Systémy s vysokými požadavky na spolehlivost jsou systémy kolejové dopravy • Nejstarší počítačový systém COMTRAC (Computer-Aided Traffic Control) byl nasazen v Japonsku v roce 1975 • Sloužil na trati dlouhé 160 km, na které se pohybovalo současně až 200 vlaků • Systém je rozdělen do sekce plánování provozu a sekce řízení trati Diagnostika počítačů

  26. Systémy pro řízení kolejové dopravy • Systém pro plánování provozu měl dva počítače H-8450, které se dělily o výpočetní úlohy a v případě poruchy zastal práci i jeden, ale se sníženým výkonem • Systém pro řízení trati byl osazen třemi počítači H-700, z nichž řešily úlohu dva a porovnáním výsledků se zjišťovalo, zda pracují bez poruchy • V případě neshody je využit třetí počítač pro rozhodnutí o správnosti jednoho nebo druhého výsledku výpočtu Diagnostika počítačů

  27. Systémy pro řízení telefonních ústředen • Při návrhu architektury počítačových systémů ESS (Electronic Switching System) byl důraz kladen na vysokou hodnotu součinitele pohotovosti za celou dobu provozu • Řešení si vyžádalo použití metody zálohování založené na zdvojení všech důležitých bloků (ESS 2 a ESS 3) • U následujících typů počítačů pro telefonní ústředny (ESS 4) bylo použito substituční zálohování „M z N“ Diagnostika počítačů

  28. Systémy pro řízení telefonních ústředen • Počítače 3B20D pro ústředny ESS 5 důsledně využívají pro ukládání dat kódu celkové parity • Hlavní paměťje vybavena rozšířeným Hammingovým kódem pro opravu jedné a detekci dvou chyb v jednom slově • Schopnosti rozšířeného Hammingova kódu nejsou tedy využity úplně Diagnostika počítačů

  29. Další aplikace vysoce spolehlivých systémů počítačů • Těsně vázaná duplexní architektura počítače IBM AN/UYK-43 je určena pro řízení lodí • Počítač pro řízení příjmu z družice ARMURE (ARchitecteur MUltiprocesseur REdondante) byl vyvinut ve francouzském městě Toulouse • V bankovnictví jsou používány systémy pro zpracování transakcí do osmdesátých let tyto systémy využívaly zdvojení a od začátku devadesátých let zavedly systém TMR • Častější je také využití kódového zabezpečení Diagnostika počítačů

  30. Literatura • Hlavička J.: Diagnostika a spolehlivost, Vydavatelství ČVUT, Praha (1990), ISBN 80-01-01846-6 • Hlavička J., Racek S., Golan S., Blažek T.: Číslicové systémy odolné proti poruchám, Vydavatelství ČVUT Praha (1992), ISBN 80-01-00852-5 • Musil, V., Vlček, K.: Diagnostika elektronických obvodů, TEMPUS Equator S_JEP-09468-95, ÚMEL, FEI VUT v Brně (1998) • Hlavička, J., Kottek, E., Zelený, J.: Diagnostika Elektronických číslicových obvodů, Praha SNTL (1982) • Drábek, V.: Spolehlivost a diagnostika, VUT Brno, (1983) • Hławiczka, A.: P1149, Warszawa (1993), ISBN 83-204-1518-7 Diagnostika počítačů

More Related