[RISOLTO] Messaggi incomprensibili per due dischi

Discussioni relative a Debian e Linux

[RISOLTO] Messaggi incomprensibili per due dischi

Messaggioda sirio81 » 02/01/2018, 11:50

Buon giorno a tutti!
Ho una debian jessie (8.6) con kernel 3.16.0-4-amd64.
Il /var/log/messages ho una sfilza di messaggi come questi e continuano ad aggiungersi
Codice: Seleziona tutto
Jan  2 10:58:18 vmserver011 kernel: [15640279.244846]  sdb: sdb1
Jan  2 10:58:20 vmserver011 kernel: [15640281.005968]  sde:
Jan  2 10:58:20 vmserver011 kernel: [15640281.041223]  sde:
Jan  2 11:03:41 vmserver011 kernel: [15640602.398228]  sde:
Jan  2 11:08:28 vmserver011 kernel: [15640889.909108]  sdb: sdb1
Jan  2 11:08:30 vmserver011 kernel: [15640892.257206]  sde:
Jan  2 11:13:35 vmserver011 kernel: [15641197.081960]  sde:
Jan  2 11:18:43 vmserver011 kernel: [15641506.283727]  sde:
Jan  2 11:23:55 vmserver011 kernel: [15641818.187772]  sdb: sdb1


sdb è un disco Western Digital da 2T (WDC WD20EZRX-00D8PB0).
sde è un ssd da 256G Samsung SSD 840 PRO Series.

Non vedo nessuna relazione logica tra i due e non capisco la natura dei messaggi.
Gli stessi messaggi sono listati in kernel.log.
I valori di smart non segnalano anomalie particolari.

Avete idea cosa possa scatenare questi messaggi?

Grazie.
Ultima modifica di sirio81 il 08/01/2018, 9:00, modificato 1 volta in totale.
sirio81
Hero Member
Hero Member
 
Messaggi: 1054
Iscritto il: 13/02/2006, 5:04

Re: Messaggi incomprensibili per due dischi

Messaggioda sirio81 » 02/01/2018, 11:58

A dirla tutta, quando eseguo smartctl -a sul disco ssd, impiega diversi secondi a rispondere e questo non l'ho notato.
Inoltre la temperatura è alta per un ssd.

Codice: Seleziona tutto
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  5 Reallocated_Sector_Ct   0x0033   099   099   010    Pre-fail  Always       -       2
  9 Power_On_Hours          0x0032   093   093   000    Old_age   Always       -       30326
 12 Power_Cycle_Count       0x0032   099   099   000    Old_age   Always       -       167
177 Wear_Leveling_Count     0x0013   023   023   000    Pre-fail  Always       -       2788
179 Used_Rsvd_Blk_Cnt_Tot   0x0013   099   099   010    Pre-fail  Always       -       2
181 Program_Fail_Cnt_Total  0x0032   099   099   010    Old_age   Always       -       2
182 Erase_Fail_Count_Total  0x0032   100   100   010    Old_age   Always       -       0
183 Runtime_Bad_Block       0x0013   099   099   010    Pre-fail  Always       -       2
187 Uncorrectable_Error_Cnt 0x0032   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0032   059   054   000    Old_age   Always       -       41
195 ECC_Error_Rate          0x001a   200   200   000    Old_age   Always       -       0
199 CRC_Error_Count         0x003e   099   099   000    Old_age   Always       -       5
235 POR_Recovery_Count      0x0012   099   099   000    Old_age   Always       -       91
241 Total_LBAs_Written      0x0032   099   099   000    Old_age   Always       -       201819639838


Per completezza, riporto anche lo smart del disco meccanico (sdb):

Codice: Seleziona tutto
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   177   176   021    Pre-fail  Always       -       4108
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       17
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   093   092   000    Old_age   Always       -       5663
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       15
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       4
193 Load_Cycle_Count        0x0032   144   144   000    Old_age   Always       -       168045
194 Temperature_Celsius     0x0022   106   095   000    Old_age   Always       -       41
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0
sirio81
Hero Member
Hero Member
 
Messaggi: 1054
Iscritto il: 13/02/2006, 5:04

Re: Messaggi incomprensibili per due dischi

Messaggioda Aki » 03/01/2018, 13:22

@sirio81: i messaggi sono ancora presenti ? In caso affermativo, puoi fornire maggiori informazioni sulla configurazione del server con cui sono utilizzati tali dischi e le relative partizioni ?
Aki
Global Moderator
Global Moderator
 
Messaggi: 7874
Iscritto il: 27/12/2007, 16:59

Re: Messaggi incomprensibili per due dischi

Messaggioda sirio81 » 03/01/2018, 15:01

Questa mattina ho sostituito il disco samsung (ex sde).
In questo momento, il messaggio compare ancora ma solo per sdf (l'altro disco ssd che prima non compariva nei messaggi).
Il disco sdf NON ha partizioni e fa parte di /dev/md2.
Attualmente md2 è in stato degraded perché vi è un solo dispositivo (sdf).
Sul disco che ho sostituito ho preferito create una tabella delle partizioni (msdos) e questa notte verrà aggiunto sde1 al device md2.
Ho notato che i messaggi appaino ogni 5 minuti.
Ho fermato il demone smartd e anche nagios-nrpe-server perché potevano essere "responsabili" di interrogare lo smart dei dischi, ma i messaggi continuano a venir generati.
Ho verificato il cron di root e non ci sono job schedulati.
Nota: dopo aver creato sde1 ho eseguito partprobe e sono più di 10 minuti che il messaggio non compare.

Codice: Seleziona tutto
Jan  3 14:46:51 vmserver011 kernel: [12065.901917]  sde: sde1
Jan  3 14:46:55 vmserver011 kernel: [12069.574874]  sde: sde1
Jan  3 14:46:57 vmserver011 kernel: [12071.796836]  sdf:
Jan  3 14:47:00 vmserver011 kernel: [12075.260821]  sde: sde1
Jan  3 14:47:00 vmserver011 kernel: [12075.268276]  sdf:
Jan  3 14:47:00 vmserver011 kernel: [12075.294546]  sdf:
sirio81
Hero Member
Hero Member
 
Messaggi: 1054
Iscritto il: 13/02/2006, 5:04

Re: Messaggi incomprensibili per due dischi

Messaggioda sirio81 » 04/01/2018, 15:38

Ho trovato il colpevole: cloudmin/webmin.
Mi sono ricordato di aver anche fermato il servizio webmin quando ho partizionato il nuovo disco.
Poco fa l'ho riabilitato e i messaggi hanno ripreso a comparire.
sirio81
Hero Member
Hero Member
 
Messaggi: 1054
Iscritto il: 13/02/2006, 5:04

Re: Messaggi incomprensibili per due dischi

Messaggioda Aki » 06/01/2018, 14:57

La discussione può essere considerata risolta ?
Aki
Global Moderator
Global Moderator
 
Messaggi: 7874
Iscritto il: 27/12/2007, 16:59

Re: Messaggi incomprensibili per due dischi

Messaggioda sirio81 » 08/01/2018, 8:59

La scorsa settimana ho contattato Cameron, sviluppatore di webmin e ha risposto
Codice: Seleziona tutto
This is harmless - it's likely a side effect of regular disk partition table scans.


Discussione conclusa.
L'unica cosa che non mi spiego sono i vecchi messaggi che comparivano per il disco meccanico che, a differenza dell'attuale sdf, la tabella delle partizione l'aveva.

Comunque l'importante è essere sicuri che il messaggi non siano sintomo di alti problemi.
sirio81
Hero Member
Hero Member
 
Messaggi: 1054
Iscritto il: 13/02/2006, 5:04


Torna a Generale

Chi c’è in linea

Visitano il forum: Nessuno e 3 ospiti