Coraz częściej spotykamy się z problemami zgłaszanymi przez naszych klientów związanych z rozbudowanymi systemami RAID. Ten artykuł opisuje autentyczny przypadek Ratowania danych z Macierzy Dell.

Firma, w której administratorem był nasz klient, pozyskała środki z dotacji na zakup sprzętu. Zakupiono zatem rozbudowany system dyskowy Dell (wraz z obsługą suportową). Wszystko wyglądało bardzo dobrze. System miał być bezawaryjny i bezobsługowy, bo miał zapewniony suport on-line. W związku z tym administrator przekierował wszystkie najważniejsze dane na ten system dyskowy. Skonfigurowano na nim RAID50 wraz z dodatkowymi dyskami Spare, które zainstalowane były poza woluminem. Co więc się mogło stać? No i stało się.

Po jakimś czasie eksploatacji macierzy system zaczął wykazywać błędy związane z dyskami. Oczywiście suport della doskonale się sprawdził. On-line połączył się z macierzą, ponaprawiał błędy i błędy zniknęły. Jednak po jakimś czasie macierz znowu zaczęła sygnalizować problemy. Tym razem jednak nie skorzystano już z pomocy Della, bo gwarancja się zakończyła. A finanse firmy, nie przewidywały dodatkowych wydatków na infrastrukturę informatyczną. Dopóki, więc wszystko działało nikt się macierzą nie interesował. Ta tymczasem sygnalizowała coraz więcej błędów, które były przez administratora ignorowane. Macierz wymagała wymiany dysków. Niestety oryginalne dyski Della są dość kosztowne, więc zrezygnowano z zakupu nowych. Wszystko było dobrze – jednak do czasu. Kiedy macierz już sama sobie nie mogła poradzić z błędami , odmówiła posłuszeństwa. Wtedy cała firma i administrator wpadli w panikę. Znalazły się pieniądze na suport on-line Della. Panowie zrobili, co mogli zrobić przez połączenie internetowe. Działali według wytycznych punkt po punkcie, posprawdzano logi serwisowe, kody błędów. Jednak na odległość nie udało się zrobić więcej. Próby przywrócenia PS serii 6000 do życia, nie powiodły się. Wykonano przy tym wiele błędnych i zbędnych czynności, których nie wykonują inżynierowie zajmujący się odzyskiwaniem danych.

Oto lista błędów, jakie popełniono w związku z utratą dostępu do danych na tej macierzy:

– błąd przy wyborze i wyposażenia urządzenia przez zarząd firmy (można było wybrać mniej skomplikowane i kosztowne urządzenie)

– Zarząd firmy powinien utrzymać budżet na infrastrukturę informatyczną zapewniając ciągłość fabrycznego suportu oraz części zamienne do urządzenia (wymieniać uszkodzone dyski na czas)

– błędy w konfiguracji urządzenia popełnione przez Administratorów. Opiekę nad macierzą obejmowały zmieniające się osoby, nie mające do końca pojęcia o konfiguracji i zarządzaniem PS serii 6000

– Mylne przeświadczenie wszystkich o bezawaryjności rozwiązań macierzowych serii PS6000

– Brak odpowiedniej Administracji i serwisowania

– A w końcu najważniejsze – Brak kopii zapasowej danych!!!

Macierz Della trafiła w końcu do nas. Można by powiedzieć, że w ostatniej chwili. Mając sprzęt w laboratorium, mogliśmy dopiero ocenić rozmiary awarii. Na pierwszy rzut oka widać i słychać było uszkodzenia dysków. Macierz w ogóle nie bootowała się, więc problem musiał dotyczyć na pewno kilku dysków. Niektóre dyski były w takim stanie, że obawialiśmy się, czy w ogóle da się odczytać z nich dane. A bez danych z nich nie da się odczytać metadanych i poskładać macierzy.

Na tym przykładzie widać, że nie zawsze odzyskiwanie on-line to dobry pomysł. Wiele rzeczy można w ten sposób skonfigurować, ale nie wszystko. Próby odbudowania macierzy, na dyskach, które mają symptomy awarii nie mogłyby mieć miejsca, gdyby suport był na miejscu. Odzyskiwanie danych na odległość, nie jest więc dobrym rozwiązaniem. Tym bardziej, ze przed rozpoczęciem operacji trzeba zabezpieczyć dane ze wszystkich dysków fizycznych bez względu na to w jakim są stanie. Tego już się nie da zrobić on-line

Jeżeli dochodzi do takiej katastrofy jak w przypadku Dell Serii ps6000 , to znaczenie mają wszystkie błędy począwszy od zarządzania i finansowaniu infrastruktury informatycznej, poprzez błędy w zarządzaniu macierzą, a na koniec brak backupu.

więcej na stronie https://rrl.com.pl