Problema Raid 1

Discussioni relative a Debian e Linux

Problema Raid 1

Messaggioda wtf » 26/04/2012, 8:59

Mi ritrovo tutti e 3 i miei volumi in modalità degraded (ubuntu 10.04 lts).
Il raid 1 è composto da soli due dischi e strutturato in tre volumi:
  • md0 --> swap
  • md1 --> root
  • md2 --> home
L'output di mdadm --query --detail /dev/md1 è (riporto solo quello di md1, in quanto gli altri sono simili):
Codice: Seleziona tutto
/dev/md1:
Version : 00.90
Creation Time : Fri Dec 25 12:55:07 2009
Raid Level : raid1
Array Size : 95803520 (91.37 GiB 98.10 GB)
Used Dev Size : 95803520 (91.37 GiB 98.10 GB)
Raid Devices : 2
Total Devices : 2
Preferred Minor : 1
Persistence : Superblock is persistent

Update Time : Thu Apr 26 09:17:14 2012
State : clean, degraded
Active Devices : 1
Working Devices : 1
Failed Devices : 1
Spare Devices : 0

UUID : 0b71e4db:43d56d8d:e784c35a:0064bc0f
Events : 0.967328

Number   Major   Minor   RaidDevice State
0       8        5        0      active sync   /dev/sda5
1       0        0        1      removed

2       8       21        -      faulty spare   /dev/sdb5

L'output di /etc/mdadm/mdadm.conf:
Codice: Seleziona tutto
DEVICE partitions
CREATE owner=root group=disk mode=0660 auto=yes
MAILADDR root
ARRAY /dev/md0 level=raid1 num-devices=2 UUID=6f6eb1e4:9524c16e:03c6f282:0ec8b3a7
ARRAY /dev/md1 level=raid1 num-devices=2 UUID=0b71e4db:43d56d8d:e784c35a:0064bc0f
ARRAY /dev/md2 level=raid1 num-devices=2 UUID=283b358c:0e6d5812:e844c039:1f196270

Questa sarebbe la terza volta in 2 anni che il disco secondario si guasta, mentre il primo sembra non aver mai avuto problemi. Ora tutto ciò mi lascia estremamente perplesso, vorrei quindi chiedere un aiuto sia per interpretare correttamente l'output del primo comando sia per fare una diagnosi completa del raid (preciso che ho già letto Software Raid 1: configurazione e verifiche).
Cose da sapere:
Avatar utente
wtf
wiki member
wiki member
 
Messaggi: 359
Iscritto il: 12/04/2011, 10:58
Località: Brianza

Re: Problema Raid 1

Messaggioda wtf » 27/04/2012, 9:29

Stamane riaccendendo il computer l'output di mdadm --query --detail /dev/md1 è leggermente cambiato:
Codice: Seleziona tutto
/dev/md1:
Version : 00.90
Creation Time : Fri Dec 25 12:55:07 2009
Raid Level : raid1
Array Size : 95803520 (91.37 GiB 98.10 GB)
Used Dev Size : 95803520 (91.37 GiB 98.10 GB)
Raid Devices : 2
Total Devices : 1
Preferred Minor : 1
Persistence : Superblock is persistent

Update Time : Fri Apr 27 10:18:33 2012
State : clean, degraded
Active Devices : 1
Working Devices : 1
Failed Devices : 0
Spare Devices : 0

UUID : 0b71e4db:43d56d8d:e784c35a:0064bc0f
Events : 0.973728

Number   Major   Minor   RaidDevice State
0       8        5        0      active sync   /dev/sda5
1       0        0        1      removed


Comunque ho provato a passare /dev/sdb come argomento a:
  • smartctl restituisce "A mandatory SMART command failed: exiting."
  • fsck restituisce "Attempt to read block from filesystem resulted in short read durante l'apertura di /dev/sdb.
    E' possibile che questa sia una partizione di dimensione zero?".
  • cfdisk restituisce "FATAL ERROR: Cannot read disk drive".
  • fdisk restituisce "Unable to read /dev/sdb".
Pare proprio che il disco sia partito, ma trovo davvero strano che continuino a saltarmi i dischi secondari.
Cose da sapere:
Avatar utente
wtf
wiki member
wiki member
 
Messaggi: 359
Iscritto il: 12/04/2011, 10:58
Località: Brianza

Re: Problema Raid 1

Messaggioda GipPasso » 29/04/2012, 2:44

Puoi pensare a un effetto dovuto a quella posizione. Nello spazio fisico (lì fa molto caldo, lì ci sono vibrazioni dannose ...) o in quello elettrico (quella linea di alimentazione è anomala o chissà cos'altro.

Sicuramente, in ogni caso, io penserei a sostituire quel disco e a cambiare configurazione per non rimettere un disco lì dove tanti se ne sono rotti così al di sopra della frequenza media.

GipPasso
Avatar utente
GipPasso
Global Moderator
Global Moderator
 
Messaggi: 3376
Iscritto il: 02/03/2006, 8:30
Località: Passo della Cisa (PR)

Re: Problema Raid 1

Messaggioda wtf » 29/04/2012, 10:01

Tra l'altro ho cambiato il blocco MB, CPU e RAM un 7-8 mesi fa. Con cambiare configurazione cosa intendi? Un esempio?
Cose da sapere:
Avatar utente
wtf
wiki member
wiki member
 
Messaggi: 359
Iscritto il: 12/04/2011, 10:58
Località: Brianza

Re: Problema Raid 1

Messaggioda GipPasso » 29/04/2012, 23:47

Tipo alimentarlo da altri cavi dell'alimentatore, spostare i cavi sata su altre porte (ma dato che hai cambiato da poco la MB e il problema viene da prima va esclusa questa opzione)...
Intendevo cose del genere.

GipPasso
Avatar utente
GipPasso
Global Moderator
Global Moderator
 
Messaggi: 3376
Iscritto il: 02/03/2006, 8:30
Località: Passo della Cisa (PR)

Re: Problema Raid 1

Messaggioda ferdybassi » 30/04/2012, 9:31

Quasi sicuramente non è il tuo caso, ma dopo aver speso notti per cercare di capire come mai una Squeeze montata su un server HP segnalasse i dischi come guasti/fuori sync con frequenza troppo sospetta, ho cambiato il cavetto SATA che collegava lo slot dei dischi sospetti al controller RAID e tutto è andato a posto.

Ciao ciao
Immagine  Immagine
Avatar utente
ferdybassi
wiki member
wiki member
 
Messaggi: 2777
Iscritto il: 28/12/2006, 4:22
Località: S. Angelo Lodigiano (LO)

Re: Problema Raid 1

Messaggioda wtf » 30/04/2012, 15:43

Proverò a cambiare sia il cavo di alimentazione che quello sata allora.
Cose da sapere:
Avatar utente
wtf
wiki member
wiki member
 
Messaggi: 359
Iscritto il: 12/04/2011, 10:58
Località: Brianza


Torna a Generale

Chi c’è in linea

Visitano il forum: Nessuno e 3 ospiti