Przejdź do treści

Zarządzanie incydentami (ITIL)

  • przez

Zarządzanie incydentami – proces w fazie Eksploatacji Usług (ang. Service Operation) odpowiedzialny za zarządzanie cyklem życia wszystkich incydentów. Zarządzanie incydentami zapewnia, że przywrócenie usługi informatycznej odbiorcom nastąpi tak szybko, jak to tylko możliwe. Zapewnia również minimalizowanie wpływu incydentów na biznes.

CELE

Celami procesu zarządzania incydentami są:

  • zapewnienie, że znormalizowane metody oraz procedury, są wykorzystywane do wydajnego i natychmiastowego odpowiadania, analizowania, dokumentowania, ciągłego zarządzania oraz raportowania incydentów
  • zwiększenie dostrzegalności oraz komunikowania incydentów personelowi wsparcia w działach IT oraz organizacjach biznesowych
  • wzmacnianie obrazu IT w organizacji poprzez wykorzystanie profesjonalnych metod rozwiązywania oraz komunikowania incydentów, jak tylko wystąpią
  • powiązanie działań oraz priorytetów z zakresu zarządzania incydentami z działaniami organizacji
  • utrzymanie satysfakcji klienta z jakości usługi

ZAKRES

Proces zarządzania incydentami obejmuje reagowanie na wszelkiego rodzaju wydarzenia, które zakłócają albo mogą dopiero zakłócić działanie usługi. Możemy wyróżnić chociażby takie wydarzenia, które zostały zasygnalizowane bezpośrednio przez użytkowników, zarówno przez centrum obsługi użytkowników, jak i przez interfejs zarządzania wydarzeniami oraz narzędzia zarządzania incydentami czy incydenty, które zarejestrował personel techniczny.

Nie oznacza to oczywiście, że każde wydarzenie jest incydentem. Wiele rodzajów wydarzeń nie jest klasyfikowanych jako zakłócenia, a jest po prostu wskaźnikiem poprawnego działania usługi. Zarówno incydenty, jak i wnioski o usługę są zapisywane w centrum obsługi klienta, co nie oznacza, że są tym samym. Wnioski o usługę nie doprowadzają do zakłóceń w działaniu usług, ale są za to sposobem na realizację potrzeb klientów oraz spełnienia ustaleń z SLA.

ZNACZENIE DLA BIZNESU

Znaczenie zarządzania incydentami dla biznesu przejawia się w możliwościach firmy do:

  • redukowania niezaplanowanej pracy i kosztów zarówno dla firmy, jak i personalu IT
  • wykrywania oraz rozwiązywanie incydentów, co skutkuje skróceniem przestojów i większą dostępnością usług
  • identyfikowania priorytetów biznesowych i dynamicznego rozmieszczania zasobów do zwalczenia awarii, wywołanych rożnego rodzaju codziennymi działaniami firmy
  • identyfikowania potencjalnych możliwości rozwoju usług przez zrozumienie co tak naprawdę determinuje dany incydent oraz powiązanie ich z działaniami personalu operacyjnego firmy
  • określenia dodatkowych usług lub potrzeb treningowych

Zarządzanie incydentami jest procesem bardzo widocznym w organizacji i dzięki temu łatwiej jest przedstawić jego wartość dla organizacji niż innych procesów i funkcji w toku eksploatacji usług. Dlatego, zarządzanie incydentami jest często jednym z pierwszych procesów implementowanych w projektach zarządzania usługami. Dodatkowymi zyskami dla firmy z działania tego procesu jest, iż może on być wykorzystany także do przybliżenia pracy innych obszarów, które wymagają uwagi.

OPIS PROCESU

METODY I TECHNIKI

Kluczowymi działaniami podejmowanymi w ramach procesu zarządzania incydentami są:

  • Identyfikacja incydentów – każdy incydent musi zostać wykryty w procesie zarządzania wydarzeniami lub przez kontakt z centrum obsługi użytkowników.
  • Rejestrowanie incydentów – incydenty musza zostać zarejestrowane i określone w czasie, bez względu skąd pochodzi informacja o ich zaistnieniu. Zapis w rejestrze musi zawierać odpowiednie dane potrzebne w procesie zarządzania incydentami.
  • Kategoryzacja incydentów – poszczególne kategorie pomagają w identyfikowaniu rożnych rodzajów incydentów oraz wniosków o usługę, w celu odpowiedniego zakończenia procesów.
  • Nadawanie priorytetów – priorytety incydentów nadaje się w oparciu o ich wpływ i pilność. Nadanie ich jest jednakże procesem dynamicznym i mogą ulegać zmianie.
  • Wstępna diagnoza – dokonana na etapie rozmowy konsultanta z użytkownikiem przez telefon.
  • Eskalacja incydentu – na tym etapie incydent jest przekazany zespołowi technicznemu z wyższym poziomem uprawnień.
  • Śledztwo i diagnoza – wszelkie działania powinny być zarejestrowane w zapisie incydentu.
  • Rozwiązanie i przywrócenie usługi – rozwiązanie incydentu musi być przetestowane i zarejestrowane w zapisie incydentu.
  • Zamknięcie incydentu – sprawdzenie i potwierdzenie kategorii incydentu, wykonanie badania satysfakcji klienta, zaktualizowanie dokumentacji o incydentach.

WYZWALACZE

  • telefony użytkowników do centrum obsługi klientów albo zapis incydentu w internecie
  • automatyczne odnalezienie incydentu przez narzędzia procesu zarządzania wydarzeniami
  • personel techniczny może wykryć incydent poprzez obserwację potencjalnych niepowodzeń
  • incydent może zostać wygenerowany na prośbę dostawcy usługi

WEJŚCIA

  • informacje na temat elementów konfiguracji
  • informacje na temat znanych awarii oraz obejść systemowych
  • komunikaty o incydentach i ich symptomach
  • komunikaty o wnioskach o zmianę lub wydania
  • komunikaty o wydarzeniach
  • cele w zakresie poziomu świadczenia usługi
  • ocena klienta
  • kryteria nadawania priorytetów i eskalowania incydentów

WYJŚCIA

  • rozwiązane incydenty oraz standaryzowane działania naprawcze
  • zaktualizowane zapisy zarządzana incydentami
  • zapisy problemów
  • opinia o incydentach opartych na zmianach i wydaniach
  • identyfikacja elementów konfiguracji związanych – lub poszkodowanych przez – z incydentami
  • ocena satysfakcji

ROLE

  • Menedżer ds. incydentów (właściciel procesu) – jest odpowiedzialny za skuteczne wdrażanie procesu zarządzania incydentami oraz tworzy odpowiednie raporty. Reprezentuje także pierwszy etap eskalacji incydentów.
  • Pierwsza linia wsparcia – do ich zadania należy zarejestrowanie i klasyfikowanie wykrytych incydentów oraz podjęcie wstępnych działań zmierzających do przywrócenia usługi IT jak szybko się da. Jeśli nie można znaleźć jakiś natychmiastowych rozwiązań ta linia wsparcia przekazuje incydent dalej. Zespół ten pełni też funkcje informacyjne na linii z użytkownikami.
  • Druga linia wsparcia – przejmuje incydenty, które nie mogą być rozwiązane natychmiast, od pierwszej linii wsparcia. Jeśli jest to konieczne, to może żądać pomocy zewnętrznej, np. od producentów oprogramowania. Także ich celem jest przywrócenie uszkodzonej usługi IT, tak szybko jak to możliwe. Jeśli nie można znaleźć rozwiązania, incydent może zostać przekazany dalej.
  • Trzecia linia wsparcia – te grupy zazwyczaj znajdują się u producentów sprzętu lub oprogramowania. Ich wsparcie ma zatem charakter zewnętrzny, a są ​​wymagane przez druga linię wsparcia.
  • Zespół ds. poważnych incydentów – ustanowiony zespół menedżerów IT i ekspertów technicznych, zwykle pod przewodnictwem menedżera ds. incydentów, którego celem jest koncentracja na rozwiązywaniu poważnego incydentu.

ODPOWIEDZIALNOŚĆ

Macierz odpowiedzialności: Proces zarządzania incydentami

Rola ITIL/Podproces Menedżer ds. incydentów Pierwsza linia wsparcia Druga linia wsparcia Zespół ds. poważnych incydentów Analityk aplikacji Analityk techniczny Operator IT
Wsparcie zarządzania incydentami A R
Zapis i kategoryzacja incydentów A R
Natychmiastowe rozwiązanie incydentu A R
Rozwiązanie incydentu na dalszym etapie A R R R R
Obsługa poważnych incydentów A R R R R
Monitorowanie i eskalacja incydentów A R R
Zamknięcie i ocena incydentów A R
Informacja dla użytkowników A R
Raport z zarządzania incydentami A R

A: (ang. Accountable) Odpowiedzialność zarządcza – zgodnie z modelem RACI, osoba ostatecznie odpowiedzialna za prawidłowość i dokładne wypełnianie procesu zarządzania incydentami ITIL®.

R: (ang. Responsible) Odpowiedzialność – zgodnie z modelem RACI, osoba odpowiedzialna za realizację zadań w procesie zarządzania incydentami ITIL®.

POWIĄZANIA

  • Proces zarządzania poziomem świadczenia usługi – wymaga on procesu zdolnego do wykrywania i rozwiązywania incydentów w określonym czasie i jednocześnie pozwoli temu procesowi na ocenę usług i identyfikację ich słabości i możliwości rozwoju.
  • Proces zarządzania bezpieczeństwem informacji – wymaga informacji o incydentach związanych z bezpieczeństwem w celu pomiaru efektywności mierników bezpieczeństwa i wsparcia działań koordynacji projektowania.
  • Proces zarządzania potencjałem wykonawczym – wymaga monitorowania wydajności oraz informacji o problemach wydajnościowych.
  • Proces zarządzania dostępnością – wymaga informacji o cyklu życia rozwoju incydentów.
  • Proces zarządzania zasobami i konfiguracją usług – zapewnia dane potrzebne do identyfikowania incydentów oraz oceny ich wpływu.
  • Proces zarządzania zmianą – implementacja rozwiązań problemów musi być zapisana w RFC. Sam proces zarządzania incydentami zajmuje się określaniem i naprawianiem awarii spowodowanych nieudanymi zmianami.
  • Proces zarządzania uprawnieniami dostępu – wymaga informacji o nieautoryzowanych dostępach lub próbach oraz złamaniach zabezpieczeń.
  • Proces zarządzania problemami – zapewnia znajomość awarii, przydatną dla szybkiego rozwiązania incydentów.

KRYTYCZNE CZYNNIKI SUKCESU I KLUCZOWE WSKAŹNIKI WYDAJNOŚCI

Tabela zawiera przykładowe krytyczne czynniki sukcesu dla procesu zarządzania incydentami oraz przykłady odpowiednich dla danego czynnika sukcesu (CSF), kluczowych wskaźników wydajności. Należy monitorować spełnienie KPI i wykorzystać tą informację do identyfikacji okazji i do usprawnień oraz zapisywać ten fakt w rejestrze CSI w celu dalszej oceny i ewentualnej implementacji.

Krytyczny czynnik sukcesu Kluczowy wskaźnik wydajności
Rozwiązywanie problemów tak szybko jak się tylko da – minimalizowanie wpływu na biznes. Znaczne zmniejszenie czasu potrzebnego do znalezienia rozwiązania incydentu lub obejścia.
Zahamowanie incydentu na każdym etapie.
Incydenty zamknięte przez centrum obsługi klienta, bez wsparcia innych grup technicznych.
Incydenty rozwiązane zdalnie.
Rozwiązanie incydentów bez wpływu na biznes.
Utrzymanie jakości usług IT. Maksymalna liczba incydentów jako miernik kontroli.
Zapis wielkości incydentów dla każdej usługi IT.
Dopuszczalna liczba poważnych incydentów na jedną usługę IT.
Utrzymanie satysfakcji klienta z usługi IT. Średni wynik ankiety użytkowników.
Określony odsetek badań satysfakcji wobec ogólnej liczby wysyłanych ankiet
Zwiększona klarowność i komunikacja incydentów w organizacji i działach wsparcia IT. Średnia liczba telefonów do centrów obsługi w celu powiadomienia o incydentach.
Zmniejszona liczba skarg klientów na słabą komunikację w zakresie incydentów.
Powiązanie zarządzania incydentami z działaniami całej organizacji. Procentowy wzrost rozwiązań incydentów w zgodzie z ustalonym czasem.
Średni koszt poszczególnych incydentów.
Zapewnienie, że standaryzowane metody oraz procedury są wykorzystywane w celu wydajnego oraz szybkiego odpowiadania, analizowania, dokumentowania, zarządzania incydentami, co podnosi wiarę w możliwości IT. Zmniejszeni liczby źle przydzielonych incydentów.
Zmniejszanie źle kategoryzowanych incydentów.
Zwiększenie liczby incydentów rozwiązywanych przez centra obsługi.
Liczba incydentów powiązanych ze zmianami oraz wydaniami.

WYZWANIA I RYZYKA

Wyzwania

  • Umiejętność szybkiego wykrywania incydentów.
  • Przekonanie personelu, że wszystkie incydenty muszą być zapisane.
  • Dostępność informacji o obecnych problemach i znanych awariach.
  • Integracja z systemem CMS oraz sprawne wykorzystanie powiązań miedzy CI.
  • Integracja z procesem SLM, w celu poprawnej oceny wpływu incydentów oraz asystowanie przy procedurach eskalacyjnych.

Ryzyka

  • Zalew incydentów, z którymi nie można się uporać w wyznaczonym czasie, z powodu braku odpowiednich zasobów.
  • Mnogość incydentów wytworzonych przez nieadekwatne narzędzia wsparcia procesów.
  • Brak odpowiednich zasobów informacji z powodu braku integracji wielu procesów.
  • Nieporozumienia w realizacji celów z powodu źle zdefiniowanych lub powiązanych OLA lub UC.

ZASADY I PODSTAWOWE POJĘCIA

  • Incydent – jest to niezaplanowane przerwanie działania usługi IT albo czasowa redukcja jakości danej usługi.
  • Wpływ – miara w fazach ITIL Eksploatacja Usług oraz ITIL Przekazanie Usług.
  • Pilność – Pilność – miara pokazująca czas, po którym incydent, problem lub zmiana będzie wywierać znaczący wpływ na działanie organizacji biznesowej.
  • Priorytet – kategoria używana do zidentyfikowania relatywnej ważności incydentu, problemu lub zmiany.
  • Skale czasowe – tego rodzaju skale muszą zostać określone dla wszelkich procedur radzenia sobie z incydentami, w oparciu o wcześniej uzgodnione w SLA, OLA oraz kontraktach UC formy rozwiązywania problemów.
  • Model incydentów – jest to predefiniowany zbiór rozwiązań i kroków, jakie należy przedsięwziąć a by rozwiązać dany problem i incydent, w zgodzie z ustalonymi normami. Narzędzia wsparcia mogą służyć jako pomoc w zarządzaniu procesem. Zapewnia to, iż standardowe incydenty są szybko zwalczane w oparciu o wcześniej nakreślony scenariusz.
  • Poważny incydent – jest on często mylony z problemem. W rzeczywistości incydent nigdy nie staje się problemem. Ich zakres i wpływ mogą rosnąć, ale nigdy nie staną się problemem.
  • Śledzenie stanu incydentów – wszelkie incydenty powinny być śledzone przez cały czas trwania cyklu życia usługi, w celu właściwego radzenia sobie z nimi gdy wystąpią i zapisywania ich w bazach danych opisujących status incydentów.
  • Rozszerzony cykl życia incydentu – pomaga w zrozumieniu wszystkich czynników wpływu na incydent oraz w zaplanowaniu, w jaki sposób mogą być one kontrolowane lub zmniejszone.