350 likes | 523 Views
Prev ádzka služieb (Service Operation). Martin Sarnovský Katedra kybernetiky a umelej inteligencie Fakulta elektrotechniky a informatiky Technická univerzita v Košiciach. Obsah. Úvod / ITIL v.3 Základné koncepty a procesy prevádzky služieb Event management Incident management
E N D
Prevádzka služieb (Service Operation) Martin Sarnovský Katedra kybernetiky a umelej inteligencie Fakulta elektrotechniky a informatiky Technická univerzita v Košiciach
Obsah • Úvod / ITIL v.3 • Základné koncepty a procesy prevádzky služieb • Event management • Incident management • Problem management • Request fullfillment • Change management
Prevádzka služieb (Service operation) • Dodávka dohodnutých úrovní služieb – užívateľom/zákazníkom • Správa aplikácií • Správa technológií • Správa infraštruktúry • V tejto fáze životného cyklu – služby produkujú „hodnotu“ pre používateľa
Prevádzka služieb (Service operation) II. • Cieľ – zabezpečiť rovnováhu medzi • Vnútorný pohľad IT vs. Biznis pohľad • Stabilita vs. Odozva (Vnímavosť/Responsiveness) • Kvalita služby vs. Náklady na službu • Reaktívnosť vs. Proaktívnosť • Identifikácia podstatných príznakov pre „zdravie prevádzky“
Manažment udalostí (Event management)
Základné pojmy • Udalosť (Event) – zmena stavu, ktorá nejakým spôsobom ovplyvňuje konfiguračné položky, alebo priamo IT služby • Môže indikovať, že niečo nepracuje korektne => zaznamenanie incidentu (výpadok pripojenia k internetu) • Môže indikovať normálnu aktivitu, či potrebu vykonania rutinnej činnosti (normálna aktivita – log o prihlásení sa užívateľa do systému, rutinná činnosť – výmena náplne v tlačiarni) • Proces manažmentu udalostí – úzko prepojený s monitorovaním • Na rozdiel od monitorovania nekontroluje stav komponentov, aj keď k ničomu nedochádza
Udalosť nastane • Nie všetky detekované a registrované • Notifikácia udalosti • CI vygeneruje notifikáciu (schopnosť ich generovania musí byť v návrhu) • Štandardná množina udalostí • Detekovanie udalosti • Akonáhle je vygenerovaná notifikácia, detekuje sa udalosť • Filtrovanie udalostí • Cieľ – rozhodnúť či udalosť zaradiť na spracovanie management toolom, alebo ignorovať • Dôležitosť udalosti • Informatívna (user sa prihlásil) • Varovanie (zaťaženie pamäte 65%, ak bude 75%, kritický stav) • Výnimka (Server spadol)
Porovnanie udalosti • Ak je udalosť významná, treba rozhodnúť ako veľmi a aké akcie treba uplatniť • Correlation engine • Porovnávanie s existujúcimi udalosťami • Trigger - rozhoduje, aký typ odpovede bude vykonaný • Zalogovať udalosť (logy) • Autoresponse (reštart zariadenia) • Zásah osoby – ak je vyžadovaný – možnosť eskalácie (vymeň náplň) • Incident/Problém/Zmena • Review • Uzavretie udalosti
Manažment Incidentov (Incident Management)
Základné pojmy • Incident – akákoľvek udalosť, ktorá nie je súčasťou štandardnej činnosti služby a ktorá spôsobí alebo môže spôsobiť prerušenie alebo zníženie kvality služby • Manažment incidentov - zaistiť čo najrýchlejšie obnovenie dodávky služby a minimalizovať dôsledky výpadku služby na obchodnú činnosť • Často ide len o implementáciu dočasného náhradného riešenia (workaround), ktoré ma za úlohu čo najrýchlejšie aspoň čiastočne sprístupniť dotknutú službu • Analýza dôvodov vzniku incidentu/prevencia nie je úlohou IM, ale PM
Manažment Incidentov • Jedna z najdoležitejších častí ITSM – „highlyvisible“ pre business – veľmi ľahko je možné demonštrovať jej hodnotu • Častokrát práve IM sa implementuje ako prvý pri zavádzaní ITSM • Dôsledky implementácie pre organizáciu: • Schopnosť detekovať a riešiť incidenty vedie k zvýšeniu dostupnosti služieb (nižší čas potrebný na reakciu, keď k incidentu dôjde) • Možnosť nachádzať spôsoby vylepšenia služieb (pochopením príčin, prečo incidenty vznikajú)
Modely Incidentov • Mnohé z incidentov – • Pramenia z niečoho, čo sa už udialo • Pravdepodobne sa budú opakovať aj v budúcnosti • Dôležitosť modelovania incidentov – definícia štandardných krokov, ako sa správať ak sa vyskytnú • Model by mal obsahovať • Kroky nutné k spracovaniu incidentu • Chronologické poradie vykonávania týchto krokov • Určenie zodpovedností • Časové rámce • Procedúry eskalácie
Identifikácia incidentu • Neakceptovateľné čakať na kontakt zákazníka • Zalogovanie incidentu • Všetky musia byť zalogované • id, kategóriu, čas, dátum, CI, príbuzný problém, používateľa, riešiteľa, zaznamenané, notifikáciu... • Kategorizácia incidentu
Stanovenie priority • urgencia incidentu/dopad, ktorý spôsobuje • Počiatočná diagnostika • či je schopný byť vyriešený na súčasnej úrovni (napr. Service Desk) • Eskalácia • Funkčná (SD presunie na IT) • Hierarchická (potreba notifikovať manažéra) • Vyšetrovanie príčin/diagnóza • identifikácia udalostí, ktoré spôsobili incident • pochopenie následností
Vyriešenie a obnova funkcie • po nájdení riešenia obnovy dodávky služby, je tento prístup nasadený • Uzavretie incidentu • Dotazník pre používateľa • Dokumentácia incidentu • Typ uzavretia (correct/incorrect) • Opakujúci sa incident? • Formálne uzavretie
Roly • Eskalácia - • Prvá línia podpory („First-line support“) - agenti zákazníckeho centra • zodpovedný za záznam, klasifikáciu, porovnávanie, vedenie, vyriešenie (okrem prípadu eskalácie incidentu inej skupine podpory) a uzatvorenie incidentu • Druhá línia podpory („Second-line support“) – špecialisti členený podľa oblastí ich znalostí • Tretia línia podpory („Third-line support“) – externí špecialisti tretích strán • Incident manažér („Incident Manager“) – Service Desk Manager
Problémy • Používatelia a aj zamestnanci obchádzajú procedúry – riešia problémy sami, sami kontaktujú špecialistov • Následok – stráca sa informácia o incidente, ktorá môže byť vhodná pre PM, CM a pod. • Priveľa incidentov, preťaženie a oneskorovanie – nedostatok času na ich zaznamenanie, nepresná evidencia => nejasný popis => nevhodné riešenie • Eskalácia – ak sa incidenty nevyriešia na prvej línii sú posúvané ďalej smerom na špecialistov, príliš veľa takýchto presunov => problémy • Nejasné definície a zmluvy – problémy s riešením incidentov, ak sú v katalógu služieb nejasne definované SLA, OLA • Nedostatok nadšenia
Manažment Problémov (Problem Management)
Základné pojmy • Problém – neznáma základná príčina jedného alebo viacerých incidentov • Známachyba (Known Error) – incident alebo problém, pre ktorý je známa hlavná príčina a pre ktorý existuje dočasné náhradné riešenie, alebo bola zaistená trvalá náhrada • Rozdiel medzi manažmentom incidentov a problémov • IM - najrýchlejšie obnoviť poskytovanie služby a minimalizovať dopady incidentu na obchodnú činnosť • Nie vždy je incident vyriešený a môže sa v budúcnosti zopakovať • PM – analýza a odhaľovanie príčin incidentov
Roly • Problem manažér – zodpovednosť za všetky činnosti procesu riadenia problémov • Riešiteľské skupiny („Problem Support“) • Reaktívne činnosti: • identifikovanie a zaznamenanie problémov analýzou detailov incidentov • skúmanie a riešenie problémov podľa ich priority • monitorovanie pokroku na vyriešení známych chýb • poskytovanie odporúčaní a poradenstva IM s náhradnými dočasnými • riešeniami incidentov a známych chýb • tvorba výkazov o problémoch • Preventívne činnosti: • identifikovanie trendov a potenciálnych zdrojov problémov • iniciovanie žiadostí o zmenu • návrh preventívnych opatrení, rozšírenie alebo aktualizácia systémov a podobne
Detekcia problému • Príčina incidentu (neznáma) • Analýza incidentu • Detekcia chyby v infraštruktúre • Notifikácia od zákazníka • Zalogovanie problému (User, služba, čas, incidenty, priority) • Kategorizácia problému • Prioritizácia problému – ako incidenty • koľko to bude stáť • recovery vs. Replacement • personál potrebný na vyriešenie problému • čas, ktorý to zaberie • Vyšetrenie a diagnóza • Množstvo všeobecných techník • Brainstorming • Chronologické analýzy • Pareto analýza • Workarounds • dočasné riešenia
Záznam o chybe – DB • známe chyby musia byť uložené v DB • Riešenie problému • Uzatvorenie problému • Review • čo sa urobilo správne • čo nesprávne • ako by mohol byť problém vyriešený lepšie • prevencia zopakovania
Problémy • Slabé prepojenie medzi PM a IM • Chýbajúca väzba medzi záznamami o incidentoch a informáciami o problémoch • Slabá informovanosť o známych chybách medzi vývojárskym a produkčným prostredím • softvér a technickú infraštruktúru prechádzajúcu do produkčného prostredia by mala sprevádzať informácia o známych chybách – táto informácia v budúcnosti ušetrí čas strávený nad hľadaním príčin chyby, ktorá je už vlastne známa • Nedostatok nadšenia – nechuť púšťať sa do formalizácie postupov
Vykonávanie požiadaviek (Request Fulfilment)
Základné koncepty • Servisná požiadavka (Service Request) – požiadavka používateľa na informáciu, radu, štandardnú zmenu, alebo prístup k IT službe • Účelom tohto procesu je • Umožniť používateľom vyžiadať si použitie služby • Príjmať štandardné služby • Poskytovať informácie pre užívateľov o službách a postupoch na ich získanie • Požiadavky sú archivované a sledované • Proces efektívne redukuje byrokraciu v organizácii, čo sa týka poskytovania služieb • Request Models – definícia často sa vyskytujúcich požiadaviek a spôsob ich jednotného konzistentného spracovávania
Proces • Užívateľ generuje požiadavku – v management tooloch, častokrát interface umožňujúci voliť typ požiadavku z menu poskytovaných typov požiadavok • Vstupom je rovnako zoznam splnených očakávaní • Pred samotným vykonaním procesu vykonania požiadavok – nutné ich schváliť • Finančné schvaľovanie • Typ schvaľovania potrebný pri každom type schvaľovaní • Požiadavky majú finančný dopad na organizáciu • Iné typy schvaľovania • Musia byť zadefinované v procese • Vykonanie • Závisí na povahe požiadavky – jednoduché je možné vyriešit priamo na Service Desku (1st line support), iné vyžadujú aktivitu/personál
Správa Prístupov (Access Management)
Základné pojmy • Účel – poskytnúť práva užívateľom, aby boli schopní pristupovať k službe, alebo skupine služieb , ale zároveň aby prístup nebol umožnený neautorizovaným používateľom • Trust/security • Celý proces definuje • Identita indivíduí • Práva prístupu • Overovanie identity a práv prístupu • Cieľ – zefektívniť využívanie služieb zabezpečením prístupu a autorizácie, minimalizovať s tým spojené chyby a schopnosť jednoducho odhaliť nekorektné použitie služby
Proces • Vyžiadanie prístupu • Generovaný používateľom • Požiadavok na zmenu • Požiadavok na službu • Verifikácia • Či je používateľ ten, za ktorého sa vydáva (username/password) • Či vlastní legitímne oprávnenie na používanie služby • Niekoľko rôznych typov verifikácie podľa typu požiadavky • Autorizácia určitého stupňa • Existencia politík (policies), ktoré oprávňujú užívateľa k ... • Poskytovanie práv • Nerozhoduje o udeľovaní práv, vykonáva policies • Monitoring stavu identity • Zmena stavu služieb, povýšenia/degradácie, odchod do dôchodku, disciplinárne akcie ... • Logovanie a sledovanie prístupov • Odstránenie/obmedzenie prístupov
Ostatné činnosti • Činnosti, ktoré nie sú súčasťou procesu: • Monitorovanie a kontrola • Detekcia stavov služieb a konfiguračných položiek • Správa infraštruktúry • Pamäte, databáz, middleware, dátové centrá ... • Aspekty služieb z iných fáz životného cyklu služby, ktoré sa týkajú prevádzky • Manažment zmien • Manažment konfigurácií • Manažment vydaní • Manažment dostupnosti • Manažment kapacity...
Kľúčové funkcie • Service Desk • Poskytuje primárny centrálny bod kontaktu pre všetkých používateľov IT • Zaznamenáva a spravuje všetky incidenty, servisné požiadavky, požiadavky na prístupy • Je rozhraním pre všetky ostatné procesy a aktivity Prevádzky služieb • Špecifické zodpovednosti • Záznam všetkých incidentov a požiadaviek, kategorizácia a prioritizácia • Vyšetrenie a diagnóza na prvej línii supportu • Správa životného cyklu incidentov a požiadaviek, zodpovedajúca eskalácia na ďalšie stupne, uzatváranie • Priebežné informovanie o stave služieb, incidentov a požiadaviek
Typy Service Desk-u • Lokálny SD • Fyzicky v blízkosti používateľov • Centralizovaný SD • Výhoda – menší team zvládne viac volaní • Virtuálny SD • Team SD rozmiestnený fyzicky na viacerých stanovištiach, pre používateľa sa javí ako jednotný celok • Nepretržitá prevádzka (Follow the sun) • SD v rôznych časových zónach, nepretržitý čas behu, presmerovávanie na stanovisko, ktoré je aktívne
Ostatné funkcie • Technická správa (Technical Management) • Zodpovednosť za správu infraštruktúry IT • Správa aplikácií (Applications Management) • Zameranie podobné ako technická správa, ale nie HW, ale SW • Správa prevádzky IT (IT Operations Management)