310 likes | 453 Views
Autonóm és hibatűrő informatikai rendszerek. 2013.09.09. A félévről. Előadók dr. Pataricza András Kocsis Imre (op. felelős) + meghívott előadók ikocsis @ mit.bme.hu , IB418, (+36 1 463) 2006 1 ZH (~félév közepén), szóbeli vizsga http://www.inf.mit.bme.hu/edu/courses/autonom.
E N D
Autonóm és hibatűrő informatikai rendszerek 2013.09.09.
A félévről • Előadók • dr. Pataricza András • Kocsis Imre (op. felelős) • + meghívott előadók • ikocsis@mit.bme.hu, IB418, (+36 1 463) 2006 • 1 ZH (~félév közepén), szóbeli vizsga • http://www.inf.mit.bme.hu/edu/courses/autonom
Motiváció • Ezredforduló: „rendszermenedzsment-válság” • Beüzemelés és karbantartás költségei! • És egyéb minőségi jellemzői, pl. rendelkezésreállás • N.B.: „enterprise software” nézőpont ‚Computingsystems’ complexityappearsto be approachingthelimits of human capability, yetthemarchtowardincreasedinterconnectivity and integrationrushesaheadunabated.’ (Kephart et al. 2003)
Motiváció • Történelmi perspektíva: belső adatközpontok, Tivoli et al., utilitycomputing’, dinamikus WS-ek, stoneknives and bearskins • Ami nem látszott: cloudcomputing Assystemsbecome more interconnected and diverse, architectsare less abletoanticipate and design interactionsamongcomponents, leavingsuchissuesto be dealtwithatruntime. (Kephart et al. 2003)
„Autonóm számítástechnika” Azautonomic computing (AC, autonóm informatika)az autonóm idegrendszert modellező rendszertervezési paradigma. A rendszer alapvető állapotváltozóiban bekövetkező változás a teljes rendszert viselkedését megváltoztató beavatkozást vált ki, amely biztosítja, hogy a rendszer egyensúlyi állapotba kerül a környezetével.
„Autonóm számítástechnika” • 2001: IBM „manifesto” az önmenedzsment jegyében • Fő inspiráció: az (emberi) idegrendszer • Tágabb értelemben a biológiai rendszerek • Három alapvető elv • Szabályozási körök (controlloop) • „dinamikus tervkésztés” • Öntudattal rendelkező (self-aware), reflektív rendszerek • Rendszerszintű megközelítés • Automatizálás + felügyelet minden rétegben • Federált, heterogén komponenensekkohezívan együttműködnek
Self-* tulajdonságok Forrás: [1], p 43
Self-* tulajdonságok • A self-* (ön*) tulajdonságok AC rendszerek makroszkopikus tulajdonságai
Önkonfiguráció - Self-configuration • Automatikus adaptáció a dinamikusan változó környezethez • Belső adaptáció • Komponensek hozzáadása vagy elvétele (software) • Futás közbeni újrakonfiguráció • Külső adaptáció • A globális infrastruktúra szerintsaját magát állítja be a rendszer Belső állapot Környezet
Öngyógyítás - Self-healing • Külső zavarás felismerése, diagnosztizálása és szolgáltásmegszakítás nélküli kezelése • Autonóm problémafelismerés és megoldás • A hibás komponenseket • detektálni, • izolálni, • javítani, • újraintegrálni. Hibás komponens
Önoptimalizáció - Self-optimization • Erőforrásokautomatikus monitorozása, hangolása, felügyelete • Működés nem előre jelezhető körülmények között • Erőforrás kihasználás maximalizálásaemberi beavatkozás nélkül • Dinamikus erőforrás allokáció ésterhelés-menedzsment • Erőforrás: tárhely, adatbázis, hálózat • Példa: dinamikus szerver fürtök Resourcemanagement
Önvédelem - Self-protection • Támadásokra való felkészülés, detektálás, azonosítás és védelem • Felhasználói hozzáférés definiálása és felügyeleteminden erőforrásra • Jogosulatlan hozzáférés ellenivédelem Belső erőforrás Külső erőforrás
Megvalósítási minta: MAPE-K Forrás: [1], p 44
Autonomic Element - AE Autonomic Manager Analyze Plan Monitor Execute Knowledge Managed Element S E • Az architektúra alapeleme a • Felügyelt egységből • Adatbázis, alkalmazásszerver , stb • És autonóm menedzserből álló • Autonóm egység • Feladatai: • A funkcionalitás nyújtása • Saját viselkedésének felügyelete a self-* tulajdonságok alapján • Együttműködés más autonóm egységekkel Az autonóm egység
AE: Kölcsönhatások • Kapcsolatok AE-k között: • Dinamikus, ideiglenes, célorientált • Szabályok és kényszerek definiálják • Egyezség által jön létre • Ez lehet tárgyalás eredménye • Teljes spektrum • Peer-to-peer • Hierarchikus • Házirendek (policy) szabályozhatják
Önszervezés • Az önszervezés • alacsony szintű egységekben végrehajtott • dinamikus folyamatok összessége, amely során • struktúra vagy rend jelenik meg • globális szinten. • Az önszervező viselkedést eredményező szabályokat (amelyek a kölcsönhatásokat meghatározzák) az AE-k csupán lokális információ alapján alkalmazzák
AC referencia architektúra Részben vagy teljesen automatizált folyamatok(pl. ITIL folyamatok) Építőelemek kombinálása tipikusforgatókönyvekké IT építőelemek, és összekapcsolásukleírása Az AC rendszer által felügyelt erőforrások
Kitekintés: AC és MI [3] • Policy (~szabály, házirend, eljárásrend) alapú tervezés • Állapot alapú • Action • ECA (~üzleti szabály) • Goal • „Célállapot”; a rendszer dönt (pl. heurisztika) • Utilityfunction (hasznosság) • Minden állapotnak „érték”; nem bináris hasznosság • Rugalmasabb működés, nehezebb specifikáció
Példa: Action policy • „Gold” és „Silver” tranzakciók egy adatközpontban • Policy ütközés, „vergődés” Mi lesz az osztott erőforrásokkal? Megoldás: pl. a priori tudás bevitele (pl. Gold fontosabb, mint Silver, bizonyos szint fölött nem kérünk plusz CPU-t, másik szerverre allokáljuk a terhelést, … )
Példa: Goal policy • Ugyanaz az adatközpont, cél: • „Vágyott”+elérhető tartományok Adott terhelés és erőforráskészlet mellett T: adott tranzakcióosztály válaszideje C: erőforrás α: kapcsolat a CPU és a válaszidő közt λ: érkezési ráta (egyszerű sorbanállási modell alapján)
Példa: hasznosság alapú policy • Pl. SLA alapján • Vezérelhet cél alapú policyt, pl. erőforrás menedzser szintjén • Egyszerű specifikáció, komplex döntési logika
Kihívások, feltételezések • A hasznosság előre ismert • Rossz specifikáció: Silver osztály „éhezik” • Nincsenek kiugróan fontos/hosszú tranzakciók • Taszkváltás hatása elhanyagolható • Válaszidő egyértelműen mérhető • Átlag? Max? • Az erőforrásmenedzsment hatékony • Nem ront a helyzeten az átkonfigurálás
Példa: tanulságok • Eredmény: • Hihetően működő • automatikus • (valamennyire … erősen) deklaratív • újrakonfigurációs logika • ami SLA-k sértése ellen véd • (persze nem tökéletes) • Figyeljük meg: matematikai apparátus…
Autonóm rendszerek összehasonlítása • QoS • Költség • Rugalmasság/Granularitás • Autonómia foka • Adaptivitás • Reakcióidő • Érzékenység • Stabilitás
Motivation for Autonomic Computing Research directions • System Uncertainty • Very large scales • Ad hoc structures/behaviours • p2p, hierarchical, … • Dynamic • entities join, leave, change behaviour • Heterogeneous • capability, connectivity, reliability, • Lack of guarantees • components, communication • Lack of common/complete knowledge • number, type, location, availability, connectivity, protocols, semantics • Information Uncertainty • Availability, resolution, quality of information • Devices capability, operation, calibration • Trust in data, data models • Semantics • Application Uncertainty • Dynamic behaviours • space-time adaptivity • Dynamic and complex couplings • multi-physics, multi-model, multi-resolution, …. • Dynamic and complex (ad hoc, opportunistic) interactions • Software/systems engineering issues • Emergent rather than by design
AC aktualitása • A mérnöki és matematikai aspektusok időtállóak • „Keret”: • Nemfunkcionális rendszeraspektusok adatvezérelt (rendszer)modellezése • Diagnosztika • Felügyelet- és reakció-tervezés • Deklaratív automatizálás • „self-*” kommunikáció • Tervezési minták • Aktuális domain: cloud rendszerek
Források • [1] Kephart, J. O., & Chess, D. M. (2003). The vision of autonomiccomputing. Computer, 36(1), 41-50. IEEE Computer Society. doi:10.1109/MC.2003.1160055 • [2] McCann, J., & Huebscher, M. C. (2004). Evaluationissuesinautonomiccomputing. Grid and CooperativeComputing – GCC 2004 Workshops (pp. 597–608). Springer. doi:10.1007/978-3-540-30207-0_74 • [3] Kephart, J. O., & Walsh, W. E. (2004). An artificialintelligenceperspectiveonautonomiccomputingpolicies. Proceedings. Fifth IEEE International WorkshoponPoliciesforDistributed Systems and Networks, 2004. POLICY 2004. (pp. 3-12). IEEE. doi:10.1109/POLICY.2004.1309145