W poprzednim odcinku cyklu dotyczącego backupu danych w firmie staraliśmy się skompletować listę pytań na które musimy sobie odpowiedzieć przed projektowaniem zasad bezpiecznej archiwizacji. W bieżącym artykule postaram się z kolei pokrótce przedstawić kilka współczynników, których wartości musimy uzgodnić przed projektowaniem i bieżącym wykonywaniem kopii zapasowych. Celem naszych operacji jest przecież bezpieczne i szybkie odtworzenie danych w sytuacjach awaryjnych.
Oto dwa magiczne skróty RTO i RPO oraz termin 'okno backupowe/okno kopii zapasowych’
- RTO – Recovery Time Objective określa nam interwał czasowy jaki jest niezbędny aby przywrócić nasz system do pełnej lub założonej częściowej funkcjonalności. W skrócie jest to czas poświęcony zarówno na próby diagnostyki, naprawy, przywracania funkcjonalności oraz udanego odtworzenia danych z kopii zapasowej.
- RPO – Recovery Point Objective określa nam maksymalny okres czasu z jakiego dane mogą zostać utracone. Dla przykładu RPO na poziomie 24 godzin oznacza iż organizacja poradzi sobie z brakiem lub ręcznym nadrobieniem zmian jakie zostały dokonane w danych przez ostatnie 24h. Doskonałym przykładem jest tu firma, która przetwarza dziennie kilka lub kilkanaście dokumentów – ich ponowne wprowadzenie do systemu jest rozwiązaniem akceptowalnym i tańszym niż skomplikowane plany wykonywania zabezpieczeń.
Z kolei trudno mówić o interwale 24godzinnym wspominając na przykład instytucje finansowe – tu ciężko sobie wyobrazić konieczność uzupełniania danych z takiego interwału – dane te są częścią większego systemu np. rozliczeń międzybankowych, nie ma więc mowy o zwłoce na nadrobienie strat.
- Okno kopii zapasowych jest z kolei interwałem, w którym nasze zaplanowane operacje mają szanse się wykonać. Podczas wykonywania kopii należy się liczyć z realokacją zasobów (czas procesora, operacje dyskowe, operacje sieciowe) na korzyść procesów wykonywania tychże operacji, jak również wziąść pod uwagę iż różnica czasowa pomiędzy plikami z początku okna kopii zapasowych może być dosyć znaczna. Oba te powody wpływają na wybór najczęstszego terminu wykonywania kopii – godzinach nocnych.
Bardzo ważnym jest aby te parametry, często narzucane przez część biznesową firmy, były po pierwsze: realne, po drugie: dotrzymywane. Nic nam nie da trzymanie się schematu kopii co godzinę wg. nierealnego planu, gdy okna kopii zapasowych będą się na siebie nakładać, w praktyce uniemożliwiając zabezpieczenie czegokolwiek.
Poprawnie wykonana kopia zapasowa w schemacie dobowym (np. o północy) pozwala na zabezpieczenie RPO na poziomie 24 godzin, przy współczynniku RPO wynoszącym 12h, (podczas pracy organizacji od 6 do 18). Oznacza to, iż kopie powinniśmy robić przynajmniej dwa razy dziennie.
Dla potrzeb artykułu zakładamy następujące wartości: organizacja pracuje od 06:00 do 18:00, RTO na 6h, RPO na 12h, I okno kopii zapasowych od godziny 10:00 do 14:00, II okno kopii zapasowych od godziny 22:00 do 02:00.
Powyższe współczynniki zależą głównie od technologicznych możliwości danej organizacji oraz ilości danych, które jesteśmy zmuszeni zabezpieczyć. Wartości te są przykładowe i dobrane tylko i wyłączne w celu demonstracji poniższego schematu – mogą być jednak łatwo adaptowalne.
RPO 12h, RTO 6h oznacza to, iż w przypadku awarii mamy 6 godzin na przywrócenie funkcjonalności systemu, nasze dane mogą być maksymalnie sprzed 12 godzin. W pierwszej kolejności oznacza to, iż nasze zaprojektowane okna kopii zapasowych uruchamiane są o godzinach 10:00 i 22:00, każde z nich trwa nie więcej niż 4h.
Skąd kluczowa wartość 4h? W RPO mamy czas na odtworzenie sprzętu, systemu oraz danych aplikacji – okno kopii zapasowych trwające np. 11h wyklucza interwał 6h RPO gdyż po prostu znacząco go przekracza. Zakładamy więc iż w 1h odtworzymy hardware (czy poprzez naprawę czy podstawienie), w kolejne 30 minut wykonamy odtworzenie BareMetal Recovery (MBR/GPT, tablice partycji, hidden MBR Data, system operacyjny, pliki/dyski wymiany itp), w kolejne 3-4h odtwarzamy dane i pozostaje nam ok. 30 minut na weryfikację całości.
W naszym schemacie zakładamy iż kompresja naszych przykładowych danych jest sporo wolniejsza od procesu dekompresji i przesłania danych w miejsce docelowe (pozwala nam to zaplanować odtwarzanie danych w czasie szybszym niż ich kopiowanie)
W przyszłej części – prosty schemat Disaster Recovery opierający się o wyznaczone wyżej założenia, za pomocą ogólnie dostępnych narzędzi, w tym rozwiązań open-source.
___
Artykuł powstał dzięki CORE – polskiemu dystrybutorowi antywirusów AVAST i AVG. Wykorzystaj najlepszy antywirus Avast Ultimate. Jeden antywirus zapewni ochronę wszystkim Twoim urządzeniom.