Strona 1 z 1

RAID programowy - jak rozpoznać uszkodzony dysk

: 06 stycznia 2010, 17:36
autor: Marsell
Może i banalne ale jakoś ciągle mnie męczy (pewnie do pierwszej prawdziwej awarii).

Jest sobie np.
Lenny zainstalowany na RAID (spięte 3 identyczne dyski SATA):
3 partycje spięte w RAID1 - startowe
3 w RAID0 na dane i bazy
3 w RAID5 na OS i resztę
3 partycje SWAP

Męczy mnie jak w razie awarii rozpoznać, który z tych identycznie wyglądających dysków się posypał.
Nie mogę polegać na informacji /dev/sd[abc] ponieważ jak odłączam dyski to system zmienia nazwy urządzeń, czyli jak usuwam coś co było dyskiem /dev/sda to następny pierwszy aktywny dostaje to oznaczenie.

Niby mogę odczytać S/N przez smartctl ale musiałbym wykręcać i wyciągać każdy dysk i go oglądać w poszukiwaniu numeru seryjnego - a nie mam na to ochoty.

Jest jakiś inny cywilizowany sposób na odkrycie który jest który?
Tak, żeby je sobie elegancko pooznaczać DEV 0, 1, 2.

Można jeszcze kolejno odpinać każdy i sprawdzać w

Kod: Zaznacz cały

mdadm --detail /dev/md[012]
którego brakuje, ale po każdej takiej operacji trzeba je na nowo synchronizować, a to przy dużych dyskach trwa wieki.

Ma ktoś na to jakieś fajne patenty?

: 13 stycznia 2010, 09:18
autor: Marsell
Tak przy okazji/koło tematu to interesuje mnie również, jak wygląda w praktyce awaria opisanego wyżej układu:
  1. Zakładam, że jeżeli dysk dogorywa, i będzie awaria zasilania to po powrocie zasilania twardziel po prostu się nie załączy, macierz zareaguje prawidłowo, wskaże brak dysku, RAID0 się wysypie - zresztą taką sytuację łatwo symulować odłączając dysk.
  2. Bardziej ciekawi mnie co się stanie jeżeli dysk rozleci się w czasie pracy?
    • System operacyjny zawiesi się i po restarcie wykona pkt. 1., to obstawiam.
    • Mdadm/system operacyjny, odłączy automatycznie uszkodzony dysk i będzie starał się pracować prawidłowo.
    [/list :o :659c02292b]Przerabiał to już ktoś może?

Re: RAID programowy - jak rozpoznać uszkodzony dysk

: 13 stycznia 2010, 09:49
autor: Unit
Marsell pisze: Jest sobie np.
Lenny zainstalowany na RAID (spięte 3 identyczne dyski SATA):
3 partycje spięte w RAID1 - startowe
3 w RAID0 na dane i bazy
3 w RAID5 na OS i resztę
3 partycje SWAP
Jeżeli masz to tak skonfigurowane to lepiej, żebyś wykonywał backup tych partycji RAID0, bo pierwsza awaria będzie kosztowała Cię utratą danych z tych partycji. Co do RAID1 i RAID5 będziesz wstanie odzyskać dane.
Dane dotyczące raidu softwarowego wyciągniesz sobie z /proc/mdstat.

: 13 stycznia 2010, 10:22
autor: Marsell
Jeżeli masz to tak skonfigurowane to lepiej, żebyś wykonywał backup tych partycji RAID0, bo pierwsza awaria będzie kosztowała Cię utratą danych z tych partycji. Co do RAID1 i RAID5 będziesz wstanie odzyskać dane.
Wiem, wiem.
Ponieważ serwer nie musi pracować w trybie 24/7 (w razie awarii i tak mnie ściągną i tak muszę go obejrzeć i ożywić) to pomysł jest taki, że pliki baz danych wylądują na RAID0 a nocna kopia codzienna bazy na RAID5 i na zewnątrz.
W razie awarii, hdd jedzie na serwis, odzyskuję z backupu dane na RAID5 i robię ln -s do nowego miejsca - serwer pracuje dalej, serwis naprawia dysk, ja inkasuję fakturę, taki jest plan.
Dane dotyczące raidu softwarowego wyciągniesz sobie z /proc/mdstat.
To wiem.
Chodzi o to, że odczytam sobie w /proc/mdstat np. awarię /dev/sdb albo lepiej via mdadm --detail /dev/md0 awarię urządzenia nr2 i co dalej.

Otwieram obudowę i widzę 3 identyczne dyski (jakby jeden chociaż był zwęglony) to byłoby łatwiej.
Szukam patentu jak sprawnie je odnajdywać/oznaczać?

: 13 stycznia 2010, 10:27
autor: Unit
Na płycie głównej najczęściej są zapisy na portach sata -> SATA0, SATA1, SATA2 - tak kolejno są ładowane, chyba, że inaczej jest to skonfigurowane w biosie, w związku z tym, jeżeli masz kolejno na sata0,1,2 podpięte dyski to są to sda, sdb i sdc

: 13 stycznia 2010, 10:50
autor: Marsell
Unit pisze:Na płycie głównej najczęściej są zapisy na portach sata -> SATA0, SATA1, SATA2 - tak kolejno są ładowane, chyba, że inaczej jest to skonfigurowane w biosie, w związku z tym, jeżeli masz kolejno na sata0,1,2 podpięte dyski to są to sda,sdb i sdc
Dobrze, ale jeśli podniesie się i nie zamontuje dysku sda to nazwy się "przesuwają" i kolejne dyski dostaną nazwy sda i sdb ...
wolę polegać na tym co wskazuje:

Kod: Zaznacz cały

mdadm --detail
bo oznacza dyski, urządzenia 0, 1, 2 i trzyma to cały czas.

Pozostaje tylko do wybadania jak bios "podaje" dyski.
U mnie jest to:
  1. Kontroler SATA - 1 port
  2. Kontroler SATA - 1 port
  3. Kontroler SATA - 2 port
  4. Kontroler SATA - 2 port
Ale znalezienie tej kolejności, który jest który, i oznaczenie dysków naklejkami, trochę czasu mi zajęło, dlatego pytam bo może o czymś nie wiem.

Przy awarii sytuacja robi się dość stresująca i nie chciałbym odpiąć nie ten dysk, z drugiej strony macierz RAID5, chyba po prostu nie wstanie i trzeba będzie spróbować z kolejnym.

: 13 stycznia 2010, 11:03
autor: Unit
Jeżeli są to kontrolery SATA na PCI, to ich numeracja zaczyna się od tak jak numerowane są PCI od najniższego, czyli jeżeli masz kontroler SATA na z dwoma portami na PCI1, to będą to porty kolejne po SATA na płycie głównej, na następnym PCI będą kolejne - przynajmniej ja tak miałem.