Często serwer traktuje się gorzej jak lodówkę czy pralkę, do których regularnie się przecież zagląda.

Pokutuje przekonanie, że dopóki da się coś na serwer zapisać lub z niego odczytać, tudzież jak działa baza danych, z którą łączy się np. program do wystawiania faktur, to znaczy, że serwer jest w pełni sprawny.

A jak się popsuje całkowicie? To wystarczy szybka wizyta w Media Expert, tak samo jak po nową lodówkę, która zastąpi starą, w czasie krótszym, niż to co mieliśmy w zamrażalce ulegnie rozmrożeniu.

Jeśli całe IT w firmie nie jest zbyt skomplikowane, a do tego postawione "po najniższej linii oporu" pod każdym względem, to wtedy zazwyczaj byle jaki PC + instalka programu handlowego ściągnięta ze strony producenta i już śmigamy dalej. ;)
Jeśli nie było kopi zapasowej danych, albo te były robione równie budżetowo (np. na tym samym dysku, na którym działa system, który uległ awarii), to zatrudni się studentów na "śmieciówce" i wklepią co trzeba do systemu, więc w ogóle o co tyle krzyku? Rozważanie odzyskiwania danych to raczej mało prawdopodobne przy takim podejściu, bo to koszty nie do zaakceptowania a i czekać trzeba w niepewności nawet kilka dni przy ekspresowej usłudze.

Jeśli jednak serwer jest nieco bardziej skomplikowany z uwagi na jego przeznaczenie, np. pełnił rolę tzw. kontrolera domeny (ang. Active Directory), do którego logowali się użytkownicy, to już zarówno podstawienie takiego serwera, jak i cała konfiguracja (mając nawet kopię danych), często już nie będzie do zrobienia w parę godzin, tylko raczej dni - o ile nie będziemy wybrzydzać co do sprzętu, tylko weźmiemy to co jest. Chyba, że całkowita awaria została przewidziana i jest umowa serwisowa z gwarantowanym Czasem Naprawy lub w firmie pracuje równolegle drugi serwer zapasowy, który na zasadzie redundancji, natychmiast przejmuje funkcję popsutego.
Jeśli taki bardziej skomplikowany serwer nie był zreplikowany zapasowym, to ratuje nas tutaj kopia systemu wraz z danymi i podstawienie serwera o analogicznej konfiguracji. Przy nowych systemach może się udać migracja na inną maszynę (choć zazwyczaj kosztem konieczności zakupu nowej licencji na system), ale trzeba będzie doinstalować sterowniki czy oprogramowanie narzędziowe. Przy starszych systemach może być z tym kłopot, nawet jeśli jakimś cudem decydenci dali się naciągnąć na drogie oprogramowanie do robienia kopii z możliwością migracji (np. Acronis z funckją Universal Restore), bo te nie zawsze zadziała, jak pokazuje doświadczenie.
Często jednak backupy obejmują tylko na przykład bazę danych programu handlowego i o ile serwer nie pełnił innej roli np. kontrolera domeny, czy serwera plików, gdzie potrzebna jest baza użytkowników z ich uprawnieniami, to da się dość sprawnie przywrócić działanie. Co nie oznacza, że w godzinę i że wszystko od razu. Oprogramowanie na serwerze to nie tylko system + baza danych programu handlowego na przykład. Może była jakaś mniej typowa konfiguracja (np. inna wersja bazy danych, inne niż domyślne ustawienia tzw. portów), oprogramowanie antywirusowe, do sterowania UPS'em, do backupu, monitorowania, a to nie są programy do przeklikania "dalej, dalej, zakończ". Jeśli zaś był stosowany model dostępu Active Directory lub byli po prostu pozakładani użytkownicy grupy roboczej z konkretnymi uprawnieniami, to bez kopii całego systemu lub bazy kontrolera domeny, czasem trzeba ponownie konsultować, kto jakie uprawnienia powinien posiadać, a i bez tego chwilę to zajmie.
Serwery to też często NAS (ang. Network Attached Storage) - będące sieciowymi magazynami danych, dla wymiany plików bieżących lub jako dyski przechowujące kopie zapasowe ze stanowisk i innych urządzeń w sieci, np. aparatu do zdjęć RTG. Te również nie są całkowicie bezawaryjne, a systemy wiecznie aktualne bez luk umożliwiających atak wirusa, tym bardziej, że nie posiadają oprogramowania antywirusowego działającego w tle.

Zatem, o ile uda się od ręki podstawić nowy serwer, to bez odpowiedniego, wcześniejszego przygotowania na taką ewentualność, przywrócenie do pełnej gotowości operacyjnej, w tym odzyskanie danych – o ile będzie to możliwe, zająć może nawet parę dni.

No i pytanie czy to wszystko będzie robił szef lub pracownik firmy, czy może zewnętrzny informatyk? A ten ostatni, stawi się na każde zawołanie? Może warto zatem pomyśleć zawczasu o umowie na obsługę informatyczną, uzgadniając maksymalny dopuszczalny Czas Przestoju?
Zapewne ci najbardziej kreatywni w optymalizacji kosztów, odpowiedzą, że lepiej mieć wszystko wiecznie prowizorycznie, bo jak się sypnie to szybko się złoży kolejne byle co, do przysłowiowej kupy. ;) Jednak nie zawsze się tak da na dłuższą metę funkcjonować w każdej firmie i nie każdy decydent z zarządu ma taką mentalność, by oszczędzać na wszystkim czego nie jest świadom, choć to dość powszechna strategia.

Czemu ma służyć stały nadzór i monitorowanie serwerów?

Warto zdać sobie sprawę, czy znamy odpowiedzi na pytania dotyczące kondycji serwera (lub zna je Państwa informatyk):
1) Czy któryś dysków macierzy nie uległ uszkodzeniu i nie wymaga natychmiastowej wymiany, mimo, że serwer działa?
Gdy ulegnie awarii drugi, odzyskanie danych z dysku przez wyspecjalizowane laboratorium, poza znacznymi kosztami może trwać wiele dni i mało kiedy udaje się odzyskać całość, tak by włożyć dysk do serwera i go odpalić jakby nigdy nic się nie stało.
2) Czy program antywirusowy nie zgłasza, że znalazł groźnego wirusa ale leczenie nie powiodło się, więc przy następnym restarcie skasuje go wraz z cennymi danymi, bo takie ma domyślne ustawienie?
Skuteczny atak wirusa szyfrującego pliki, może pozbawić danych gromadzonych latami, a usunięcie wirusa pociągnie za sobą i dane.
3) Czy mamy ustawione kopie zapasowe według harmonogramu i fizycznie poza serwer? Czy działają nadal?
Wykonywanie kopii zapasowych może się zatrzymać z powodu braku miejsca, konfliktu z jakąś aktualizacją systemu lub antywirusem itp. Pamiętajmy też, że dyski pracujące w macierzy RAID to nie kopia zapasowa.
4) Czy działają automatyczne aktualizacje systemu operacyjnego (o ile w ogóle były włączone)?
Działanie aktualizacji automatycznych bywa czasem zawodne, a na serwerach aktualizacje powinny być wdrażane pod nadzorem.
5) Czy system chłodzenia działa prawidłowo czy może zacierający się wentylator lada moment spowoduje przegrzanie?
Mimo, że cześć układów (jak np. procesor) posiada zabezpieczenie termiczne i się powinien wyłączyć, to dłuższe wystawianie na pogorszone warunki, z czasem potrafi doprowadzić nawet procesor do uszkodzenia całkowitego.
6) Czy w logach serwera nie pojawił się jakiś krytyczny błąd systemowy lub sprzętowy?
System operacyjny jest jak złożony organizm, który zmienia się, ewoluuje. Czasami drobna zmiana będąca np. wynikiem aktualizacji lub chwilowej niestabilności jakiegoś podzespołu może spowodować zatrzymanie jakiegoś programu, np. do backupu czy komunikacji z UPS.

Częściowo uszkodzony serwer, potrafi podziałać kilka miesięcy a nawet lat, z każdym dniem pogarszając szanse na powodzenie naprawy czy odzyskania danych, a innym razem będzie to kwestia minut czy godzin zanim padnie wszystko.

Pewność i spokój, może nam zapewnić wdrożenie stałego monitorowania serwera, bieżące administrowanie serwerów, wykonywanie kopii zapasowych, okresowa konserwacja oraz wybór optymalnego rozwiązania sprzętowego czy programowego, nie tylko w zakresie samego serwera ale i np. UPS'a czy backupu. Warto też rozważyć umowę serwisową z gwarantowanym Czasem Naprawy lub przynajmniej Czasem Reakcji, a w środowiskach wymagających ciągłej pracy, redundancja serwerów to w zasadzie podstawa.