300 likes | 433 Views
Diagnostika počítačů DGP_06. Prof. Ing. Karel Vlček, CSc. karel.vlcek@vsb.cz Katedra Informatiky, FEI, VŠB - TUO. Zabezpečení proti poruchám. Bezpečnost provozu systému je pravděpodobnost, že se na výstupu neobjeví nedetekovaná chyba Zvyšování bezpečnosti se děje dvěma způsoby:
E N D
Diagnostika počítačů DGP_06 Prof. Ing. Karel Vlček, CSc. karel.vlcek@vsb.cz Katedra Informatiky, FEI, VŠB - TUO
Zabezpečení proti poruchám • Bezpečnost provozu systému je pravděpodobnost, že se na výstupu neobjeví nedetekovaná chyba • Zvyšování bezpečnosti se děje dvěma způsoby: • 1. snižováním pravděpodobnosti výskytu chyb • 2. zvyšováním pravděpodobnosti detekce chyby Diagnostika počítačů
Zabezpečení hlídačem • Hlídač je tvořen technickými i programovými prostředky Funkční jednotka Výstup dat Vstup dat Chyba Hlídač Diagnostika počítačů
Realizace hlídače v čase • Hlídač může být realizován ze součástek, u nichž je výskyt poruchy vyjádřen v čase • Z toho důvodu je počítat s možností výskytu poruchy, která se může projevit jako chyba jeho funkce • Aby hlídač byl schopen kontrolovat správnost funkce, musí mít k dispozici určitou redundanci Diagnostika počítačů
Obvody bezpečné proti poruchám • Nechť obvod realizuje logickou funkci Z = Z(X), kde X je vstupní a Z výstupní vektor • Množina vstupních vektorů je X a množina výstupníchvektorů je Z • Při použití kódového zabezpečení platí, že Z patří do prostoru Bn, n je počet bitů vektoru z a Bn je množina všech vektorů délky n Diagnostika počítačů
Zdvojení (poprvé použito firmou Hitachi pro zabezpečení železnice) • Nejjednodušší realizace je zdvojení Funkční jednotka Vstupy Výstupy =1 Chyba Funkční jednotka 1 =1 Diagnostika počítačů
=1 Chyba 1 =1 Kontrola inverzní funkcí • Funkční jednotka realizuje zobrazení prosté a druhá realizuje zobrazení inverzní Funkční jednotka F Vstupy Výstupy Funkční jednotka F-1 Diagnostika počítačů
a a AND b & non a b 1 non (a AND b) non b Dvojdrátová logika • Logický součin Diagnostika počítačů
a a OR b non a b & non (a OR b) non b Dvojdrátová logika • Logický součet 1 Diagnostika počítačů
Dvojdrátová logika • Negace a non a non a a Diagnostika počítačů
Použití detekčních kódů • Lze použít například při kontrole aritmetických funkcí tím, že je generován zbytek po operaci sčítání • Často je kontrolována platnost kódu výstupu například u dekodéru pomocí bloku součtu modulo2 • Nejčastější aplikací je hlídač parity, který provádí detekci chyb Diagnostika počítačů
Hlídače kódu k z 2k • Přes svoji nadbytečnost, která je i 100% jsou poměrně často užívané • Výhodou je snadná realizace samočinně kontrolovaného hlídače • Principem úplné samočinné kontroly je to, že každá porucha, která změní chování obvodu je na výstupu detekována hlídačem kódu Diagnostika počítačů
Úplně samočinně kontrolované obvody • Přes svoji nadbytečnost, která je i 100% jsou poměrně často užívané • Výhodou je snadná realizace samočinně kontrolovaného hlídače • Principem úplné samočinné kontroly je to, že každá porucha, která změní chování obvodu je na výstupu detekována hlídačem kódu Diagnostika počítačů
Hlídací časovač - princip • Pro kontrolu složitějších obvodů je možné použít tzv. hlídacího časovače (watchdog timer) • Hlídací časovač bývá aplikován u mikroprocesorů, kde využívá komplexní funkce přerušení • Tento obvod kontroluje, zda je procesor schopen periodicky reagovat na přerušení Diagnostika počítačů
Hlídací časovač – způsob aplikace • Realizace hlídacího časovače Nastavení Žádost o přerušení C1 Procesor Start Inicializace Hodiny C2 Výstražný obvod Signalizace Hodiny Diagnostika počítačů
Hlídací časovač – popis bloků • Funkce dvou čítačů C1 a C2 v zapojení hlídacího časovače je k tomu, aby bylo kontrolováno, zda je procesor schopen periodicky reagovat na přerušení • C1 začne odměřovat čas a vyšle procesoru žádost o přerušení • Současně s tím se spustí C2, který odměřuje, kdy má být žádost spuštěna znovu • Pokud nenastane přerušení, je aktivován výstražný obvod Diagnostika počítačů
Architektura systémů odolných proti poruchám • Požadavky na vysokou spolehlivost číslicových systémů dokumentují systémy zaměřené na zvýšení odolnosti proti poruchám • Bylo nalezeno mnoho dílčích řešení subsystémů, ale dosud chybí ucelená teorie odolnosti proti poruchám, která by byla obecně použitelná pro konstrukci systémů počítačů Diagnostika počítačů
Architektura systému SAPO • K prvním počítačům, který byl k této úloze vybaven, byl počítač SAPO československé výroby z VÚMS Praha (doc. A. Svoboda) • Počítač SAPO měl tři aritmetické jednotky pracující systémem TMR (Triple ModularRedundant) • Poruchy mohly být maskovány na základě majoritního vyhodnocení bezporuchové činnosti Diagnostika počítačů
X f1 F1 M ≥2 f F2 f2 f3 F3 TMR (Triple ModularRedundant) • Struktura systému TMR Diagnostika počítačů
Zobecnění: TMR → NMR • Zobecněním systému TMR na systém NMR spočívá ve zvětšení počtu modulů • Všechny jednotky opět zpracovávají stejná vstupní data podle stejného programu • Výstupy všech N jednotek jsou přivedeny do majoritního členu, jehož práh je M = (N+1)/2 • Majorita je definovaná jako funkce pro lichý počet argumentů, proto je N liché číslo Diagnostika počítačů
X f1 F1 ≥M f F2 f2 ׃׃ fN F3 NMR (N-ModularRedundant) • Struktura systému NMR Diagnostika počítačů
FTMP (Fault Tolerant Multiprocessor) • Základní typ zálohy využitý při práci systému FTMP je konfigurace GMR (General Modular Redundant) • GMR systém pracuje s tzv. dynamickou zálohou, při které jsou zálohovací moduly v činnosti, aby byly ihned připraveny k činnosti • FTMP sestával z ze 14 procesorů, 7 modulů pamětí a dvou modulů vstupů a výstupů, byl použit pro simulaci řízení letounu Boeing 707 Diagnostika počítačů
Počítač raketoplánu NASA • Základním modulem je počítač GPC (General Purpose Computer) doplněný o procesorem vstupů a výstupů • Počítačů GPC bylo zapojeno pět • Každý počítač je vybaven čtyřmi zobrazovacími jednotkami z nichž tři jsou v pilotní kabině a jedna na zádi • Kromě 24 sběrnicových spojení bylo použito i přímé spojení mezi vstupními / výstupními procesory a pamětí Diagnostika počítačů
GPC 1 IOP 1 GPC 2 IOP 2 GPC 3 IOP 3 GPC 4 IOP 4 GPC 5 IOP 5 24 sběrnic Vnější paměť Zobrazovací jednotky a klávesnice Telemetrické přístroje Ovládací panely Navigace a styk s pohonnou jednotkou Řízení manipulace s nákladem Příprava a řízení startu Počítač raketoplánu NASA Přímé spojení mezi vstupními / výstupními moduly a pamětí Diagnostika počítačů
Systémy pro řízení kolejové dopravy • Systémy s vysokými požadavky na spolehlivost jsou systémy kolejové dopravy • Nejstarší počítačový systém COMTRAC (Computer-Aided Traffic Control) byl nasazen v Japonsku v roce 1975 • Sloužil na trati dlouhé 160 km, na které se pohybovalo současně až 200 vlaků • Systém je rozdělen do sekce plánování provozu a sekce řízení trati Diagnostika počítačů
Systémy pro řízení kolejové dopravy • Systém pro plánování provozu měl dva počítače H-8450, které se dělily o výpočetní úlohy a v případě poruchy zastal práci i jeden, ale se sníženým výkonem • Systém pro řízení trati byl osazen třemi počítači H-700, z nichž řešily úlohu dva a porovnáním výsledků se zjišťovalo, zda pracují bez poruchy • V případě neshody je využit třetí počítač pro rozhodnutí o správnosti jednoho nebo druhého výsledku výpočtu Diagnostika počítačů
Systémy pro řízení telefonních ústředen • Při návrhu architektury počítačových systémů ESS (Electronic Switching System) byl důraz kladen na vysokou hodnotu součinitele pohotovosti za celou dobu provozu • Řešení si vyžádalo použití metody zálohování založené na zdvojení všech důležitých bloků (ESS 2 a ESS 3) • U následujících typů počítačů pro telefonní ústředny (ESS 4) bylo použito substituční zálohování „M z N“ Diagnostika počítačů
Systémy pro řízení telefonních ústředen • Počítače 3B20D pro ústředny ESS 5 důsledně využívají pro ukládání dat kódu celkové parity • Hlavní paměťje vybavena rozšířeným Hammingovým kódem pro opravu jedné a detekci dvou chyb v jednom slově • Schopnosti rozšířeného Hammingova kódu nejsou tedy využity úplně Diagnostika počítačů
Další aplikace vysoce spolehlivých systémů počítačů • Těsně vázaná duplexní architektura počítače IBM AN/UYK-43 je určena pro řízení lodí • Počítač pro řízení příjmu z družice ARMURE (ARchitecteur MUltiprocesseur REdondante) byl vyvinut ve francouzském městě Toulouse • V bankovnictví jsou používány systémy pro zpracování transakcí do osmdesátých let tyto systémy využívaly zdvojení a od začátku devadesátých let zavedly systém TMR • Častější je také využití kódového zabezpečení Diagnostika počítačů
Literatura • Hlavička J.: Diagnostika a spolehlivost, Vydavatelství ČVUT, Praha (1990), ISBN 80-01-01846-6 • Hlavička J., Racek S., Golan S., Blažek T.: Číslicové systémy odolné proti poruchám, Vydavatelství ČVUT Praha (1992), ISBN 80-01-00852-5 • Musil, V., Vlček, K.: Diagnostika elektronických obvodů, TEMPUS Equator S_JEP-09468-95, ÚMEL, FEI VUT v Brně (1998) • Hlavička, J., Kottek, E., Zelený, J.: Diagnostika Elektronických číslicových obvodů, Praha SNTL (1982) • Drábek, V.: Spolehlivost a diagnostika, VUT Brno, (1983) • Hławiczka, A.: P1149, Warszawa (1993), ISBN 83-204-1518-7 Diagnostika počítačů