Skip to main content

Co to jest RAID? (Nadmiarowa tablica niedrogich napędów)

Jak stworzyć RAID 0 i RAID 1 i co to jest? - PORADNIK (Może 2024)

Jak stworzyć RAID 0 i RAID 1 i co to jest? - PORADNIK (Może 2024)
Anonim

RAID to rozwiązanie opracowane pierwotnie dla rynku serwerów sieciowych jako środek do tworzenia dużego magazynu przy niższych kosztach. Zasadniczo wymagałoby to wielu tańszych dysków twardych i złożenia ich razem za pomocą kontrolera, aby zapewnić jeden napęd o większej pojemności. Oto, czym jest RAID: zbędny zestaw niedrogich dysków lub dysków. Aby to osiągnąć, potrzebne było specjalistyczne oprogramowanie i kontrolery do zarządzania dzielonymi danymi między różnymi napędami.

Ostatecznie moc obliczeniowa twojego standardowego systemu komputerowego pozwoliła funkcjom filtrować drogę na rynek komputerów osobistych.

Teraz pamięć RAID może być oparta na oprogramowaniu lub sprzęcie i może być używana do trzech różnych celów. Obejmują one pojemność, bezpieczeństwo i wydajność. Pojemność jest prosta, zazwyczaj związana z prawie każdym typem konfiguracji RAID. Na przykład dwa dyski twarde mogą być połączone razem jako pojedynczy dysk z systemem operacyjnym, skutecznie tworząc wirtualny dysk, który ma dwukrotnie większą pojemność. Wydajność jest kolejnym kluczowym powodem używania konfiguracji RAID na komputerze osobistym. W tym samym przykładzie dwóch dysków używanych jako jeden napęd, kontroler może podzielić porcję danych na dwie części, a następnie umieścić każdą z tych części na osobnym dysku. To skutecznie podwaja wydajność zapisu lub odczytu danych w systemie pamięci masowej. Wreszcie, RAID może być używany do ochrony danych.

Odbywa się to poprzez użycie części miejsca na dyskach, aby zasadniczo sklonować dane zapisane na obu dyskach. Ponownie, dzięki dwóm napędom, możemy zrobić tak, aby dane były zapisywane na obu dyskach. Tak więc, jeśli jeden dysk ulegnie awarii, drugi nadal ma dane.

W zależności od celów macierzy pamięci masowej, które chcesz zestawić w systemie komputerowym, do osiągnięcia tych trzech celów użyjesz jednego z różnych poziomów macierzy RAID.

Dla osób używających dysków twardych w komputerze wydajność prawdopodobnie będzie większym problemem niż pojemność. Z drugiej strony osoby korzystające z dysków półprzewodnikowych prawdopodobnie będą chciały wziąć mniejsze dyski i połączyć je w jeden większy dysk. Przyjrzyjmy się zatem różnym poziomom macierzy RAID, które mogą być używane z komputerem osobistym.

RAID 0

Jest to najniższy poziom RAID i faktycznie nie oferuje żadnej formy nadmiarowości, dlatego jest określany jako poziom 0. Zasadniczo, RAID 0 zajmuje dwa lub więcej napędów i łączy je w celu stworzenia napędu o większej pojemności. Osiąga się to za pomocą procesora o nazwie striping. Bloki danych są dzielone na porcje danych, a następnie zapisywane w kolejności na dyskach. Zapewnia to zwiększoną wydajność, ponieważ dane mogą być zapisywane jednocześnie na dyskach przez kontroler, skutecznie pomnażając prędkość dysków. Poniżej znajduje się przykład tego, jak to może działać na trzech dyskach:

Dysk 1Dysk 2Dysk 3
Blok 1123
Blok 2456
Blok 3789

Aby RAID 0 działał efektywnie w celu zwiększenia wydajności systemu, musisz wypróbować dopasowane dyski. Każdy dysk powinien mieć dokładnie taką samą pojemność i cechy wydajności.

Jeśli nie, pojemność zostanie ograniczona do wielokrotności najmniejszego napędu i wydajności do najwolniejszego z napędów, ponieważ musi czekać na zapisanie wszystkich pasków przed przejściem do następnego zestawu. Możliwe jest użycie niezgodnych dysków, ale w takim przypadku konfiguracja JBOD może być bardziej efektywna.

JBOD to tylko kilka napędów, a efektywnie jest to tylko zbiór napędów, do których można uzyskać niezależny dostęp, ale który pojawia się jako pojedynczy napęd pamięci masowej w systemie operacyjnym. Zwykle osiąga się to poprzez rozpiętość danych między napędami. Często jest to nazywane SPAN lub BIG.

W efekcie operacja widzi je wszystkie jako jeden dysk, ale bloki będą zapisywane na pierwszym dysku, dopóki się nie zapełnią, a następnie przejdą do drugiego, trzeciego, trzeciego itd. Jest to przydatne do dodania dodatkowej pojemności do istniejącego systemu komputerowego i z dyskami o różnych rozmiarach, ale nie zwiększy to wydajności macierzy dysków.

Największy problem z konfiguracjami RAID 0 i JBOD to bezpieczeństwo danych. Ponieważ masz wiele dysków, szanse na uszkodzenie danych wzrosły, ponieważ masz więcej punktów awarii. Jeśli jakikolwiek dysk w macierzy RAID 0 ulegnie awarii, wszystkie dane staną się niedostępne. W JBOD, awaria dysku spowoduje utratę wszelkich danych znajdujących się na tym dysku. W związku z tym najlepiej dla tych, którzy chcą korzystać z tej metody przechowywania, aby mieć jakieś inne sposoby tworzenia kopii zapasowych swoich danych.

RAID 1

Jest to pierwszy prawdziwy poziom RAID, ponieważ zapewnia pełny poziom nadmiarowości danych przechowywanych w macierzy. Odbywa się to poprzez proces zwany odbiciem lustrzanym. W efekcie wszystkie dane zapisane w systemie są kopiowane na każdy dysk w tablicy poziomu 1. Ta forma RAID jest zwykle wykonywana za pomocą pary napędów, ponieważ dodanie większej liczby dysków nie zwiększy dodatkowej pojemności, a jedynie zwiększy nadmiarowość. Aby lepiej podać przykład tego, oto tabela, która pokazuje, jak byłby zapisany na dwóch dyskach:

Dysk 1Dysk 2
Blok 111
Blok 222
Blok 333

Aby uzyskać jak najbardziej efektywne wykorzystanie konfiguracji RAID 1, system po raz kolejny użyje dopasowanych dysków, które mają taką samą pojemność i wydajność.

Jeśli używane są niepasujące dyski, pojemność tablicy będzie równa najmniejszej pojemności dysku w macierzy. Na przykład, jeśli jeden i pół terabajtów i jeden terabajt były używane w macierzy RAID 1, pojemność tej tablicy w systemie byłaby tylko pojedynczym terabajtem.

Ten poziom macierzy RAID bardzo skutecznie chroni dane, ponieważ oba napędy są praktycznie takie same. Jeśli jeden z dwóch dysków ulegnie awarii, drugi ma pełne dane drugiego. Problem z tym typem instalacji zazwyczaj określa, który z dysków nie działa, ponieważ często pamięć staje się niedostępna, gdy jeden z nich ulegnie awarii i nie zostanie poprawnie przywrócony, dopóki nie zostanie włożony nowy napęd zamiast uszkodzonego i nastąpi przywrócenie proces jest uruchamiany. Jak wspomniano wcześniej, nie ma w tym również żadnego zwiększenia wydajności. W rzeczywistości wystąpi niewielka utrata wydajności z powodu obciążenia kontrolera dla macierzy RAID.

RAID 1 + 0 lub 10

Jest to nieco skomplikowana kombinacja zarówno poziomów RAID 0, jak i poziomu 1. W rzeczywistości, aby móc działać w tym trybie, kontroler będzie potrzebował co najmniej czterech napędów, ponieważ to, co zamierza zrobić, to zrobić dwie pary napędów. Pierwszy zestaw napędów to tablica z lustrzanym odbiciem danych pomiędzy tymi dwoma. Drugi zestaw napędów jest również odbijany lustrzanie, ale ustawiony jako pasek pierwszego. Zapewnia to zarówno nadmiarowość danych, jak i wzrost wydajności. Poniżej znajduje się przykład sposobu zapisywania danych na czterech dyskach korzystających z tego typu konfiguracji:

Dysk 1Dysk 2Dysk 3Dysk 4
Blok 11122
Blok 23344
Blok 35566

Szczerze mówiąc, nie jest to pożądany tryb RAID do działania w systemie komputerowym. Chociaż zapewnia ona pewien wzrost wydajności, to nie jest tak dobry ze względu na ogromne obciążenie systemu. Ponadto jest to ogromna strata miejsca, ponieważ macierze dyskowe będą w stanie połączyć tylko połowę pojemności wszystkich dysków. Jeśli używane są niezgodne dyski, wydajność będzie ograniczona do najwolniejszego z dysków, a pojemność będzie równa podwójnemu najmniejszemu napędowi.

RAID 5

Jest to najwyższy poziom RAID, który można znaleźć w komputerach konsumenckich i jest o wiele bardziej skuteczną metodą zwiększania pojemności i redundancji. Osiąga to poprzez proces pasmowania danych z parzystością. Do tego potrzebne są co najmniej trzy napędy, ponieważ dane są podzielone na paski na kilku napędach, ale następnie jeden blok na pasku zostaje ustawiony na parzystość. Aby to lepiej wyjaśnić, przyjrzyjmy się najpierw, jak dane mogą być zapisane na trzech dyskach:

Dysk 1Dysk 2Dysk 3
Blok 112 str
Blok 23 str 4
Blok 3 str 56

W istocie, sterownik napędu pobiera fragment danych do zapisania na wszystkich dyskach w macierzy. Pierwszy bit danych umieszczany jest na pierwszym dysku, a drugi na drugim. Trzeci napęd otrzymuje bit parzystości, który jest zasadniczo porównaniem danych binarnych na pierwszym i drugim. W binarnej matematyce masz tylko 0 i 1. Boolean matematyczny proces jest wykonywany w celu porównania bitów. Jeśli dwa sumują się do liczby parzystej (0 + 0 lub 1 + 1), bit parzystości będzie wynosił zero. Jeśli dwa sumują się do liczby nieparzystej (1 + 0 lub 0 + 1), bit parzystości będzie wynosił jeden. Powodem tego jest to, że jeśli jeden z dysków zawiedzie, kontroler może wtedy dowiedzieć się, jakie są brakujące dane. Na przykład, jeśli dysk ulegnie awarii, pozostawiając tylko napęd drugi i trzeci, a napęd drugi ma blok danych jednego, a napęd trzeci ma blok parzystości równy jeden, wówczas brakujący blok danych na dysku jeden musi być zerowy.

Zapewnia to efektywną redundancję danych, która pozwala przywrócić wszystkie dane w przypadku awarii dysku. Teraz w przypadku większości instalacji konsumenckich awarie nadal będą skutkować brakiem działania systemu, ponieważ nie jest on w stanie funkcjonalnym. Aby system działał poprawnie, należy wymienić uszkodzony dysk na nowy. Następnie należy przeprowadzić proces rekonstrukcji danych na poziomie kontrolera, który wykona odwrotną funkcję boolowską, aby odtworzyć dane na brakującym dysku. Może to zająć trochę czasu, zwłaszcza w przypadku dysków o większej pojemności, ale jest to co najmniej odzyskiwane.

Teraz pojemność macierzy RAID 5 zależy od liczby dysków w macierzy i ich pojemności. Ponownie, tablica jest ograniczona przez najmniejszy dysk w macierzy, dlatego najlepiej jest używać dopasowanych napędów. Efektywne miejsce do przechowywania jest równe liczbie napędów minus jeden razy najmniejsza pojemność. Więc w kategoriach matematycznych tak właśnie jest (n-1) * Capacitymin . Tak więc, jeśli masz trzy dyski 2GB w macierzy RAID 5, całkowita pojemność wynosiłaby 4 GB. Kolejna macierz RAID 5, w której zastosowano cztery dyski 2 GB, miałaby pojemność 6 GB.

Teraz wydajność RAID 5 jest nieco bardziej skomplikowana niż niektóre inne formy RAID z powodu procesu boolowskiego, który należy wykonać, aby utworzyć bit parzystości, gdy dane są zapisywane na dyskach. Oznacza to, że wydajność zapisu będzie mniejsza niż tablica RAID 0 z taką samą liczbą dysków. Z drugiej strony wydajność odczytu nie ma tak dużego znaczenia jak pisanie, ponieważ proces boolowski nie jest wykonywany, ponieważ odczytuje proste dane z napędów.

Duży problem ze wszystkimi konfiguracjami RAID

Omówiliśmy różne zalety i wady każdego z poziomów macierzy RAID, które mogą być używane na komputerach osobistych, ale jest jeszcze inny problem, który wiele osób nie zdaje sobie sprawy, jeśli chodzi o tworzenie konfiguracji dysków RAID. Zanim będzie można użyć konfiguracji RAID, musi ona najpierw zostać zbudowana za pomocą oprogramowania kontrolera sprzętowego lub oprogramowania systemu operacyjnego. To zasadniczo inicjuje specjalne formatowanie wymagane do prawidłowego śledzenia sposobu zapisu i odczytu danych na dysku.

Prawdopodobnie nie brzmi to jak problem, ale jest tak, jeśli musisz zmienić sposób konfiguracji macierzy RAID. Na przykład, powiedzmy, że masz mało danych i chcesz dodać dodatkowy dysk dla macierzy RAID 0 lub RAID 5. W większości przypadków nie będzie można tego zrobić bez wcześniejszej rekonfiguracji macierzy RAID, która spowoduje również usunięcie wszystkich danych zapisanych na tych dyskach.Oznacza to, że należy wykonać kopię zapasową danych, dodać nowy dysk, zmienić konfigurację macierzy dysków, sformatować tablicę dysków, a następnie przywrócić oryginalne dane z powrotem na dysk. To może być niezwykle bolesny proces. W związku z tym upewnij się, że konfiguracja macierzy jest taka, jak chcesz, gdy robisz to po raz pierwszy.