Problem z HDD. UDMA_CRC_Error_Count = 37

Autor: Netx <user72cut-it-out_at_go2.pl>
Data: Thu 15 Feb 2007 - 23:41:43 MET
Content-Type: text/plain; format=flowed; charset="iso-8859-2"; reply-type=original
Message-ID: <45d4cddd$0$13175$f69f905@mamut2.aster.pl>

W/g Smart: UDMA_CRC_Errors = 37 - czy to jest coś z powierzchnią dysku,
z elektroniką, czy może też być kontroler dysku (ten na płycie głównej) ?
Wszystko jest na gwarancji, ale nie wiem jak ustalić winowajcę?

Na dysku jest Swap i dane aplikacji a problem jest taki, że system
operacyjny
od paru dni często się "zamraża" (na nic nie reaguje),
przypuszczam że przez ten dysk.
Niekiedy też dysk zostaje nagle "odłączony" przez linuxa (Suse 10.2 64 bit).

Proszę o info jak przetestować dysk (nie mając Windows) i czy on się
nadaje na wymianę gwarancyjną? (Smart nie pokazuje "reallocated sectors")

Według smartctl --all /dev/sda:
Reallocated_Sector_Ct = 0 , ale
UDMA_CRC_Error_Count = 37
* W systemie jest drugi dysk taki sam ale u niego
UDMA_CRC_Erroc_Count=0.
(Samsung SpinPoint 250GB "SataII").

Natomiast "smartctl -l error" dla wadliwego dysku pokazuje problemy z
"READ MULTIPLE" i "READ DMA". Dla drugiego dysku wogóle nie ma żadnych
błędów.

/var/log/messages pokazuje jakieś błędy i wydaje mi się (o ile dobrze
rozumiem
ten log) że system próbuje spowalniać tryb transferu dysku do UDMA133,
UDMA100,
 UDMA66, UDMA 44, UDMA16 aż w końcu to nie pomaga i odłącza dysk.

Jeśli to ma znaczenie to płyta główna Asus M2N-Sli Deluxe (ale nie jest w
trybie SLI),
Athlon 64 3000+ Orleans. Mostek na płycie jest chłodzony pasywnie i paży
przy dotknięciu.

Z góry dzięki za pomoc,
Marek

PS. jakby ktoś chciał się wczytać to podaję logi
(bardzo długie):

smartctl --all /dev/sda:
****************************************************8
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED
WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x000f 100 100 051 Pre-fail
s - 0
  3 Spin_Up_Time 0x0007 100 100 025 Pre-fail
s - 5952
  4 Start_Stop_Count 0x0032 100 100 000 Old_age
ys - 336
  5 Reallocated_Sector_Ct 0x0033 253 253 010 Pre-fail
s - 0
  7 Seek_Error_Rate 0x000f 253 253 051 Pre-fail
s - 0
  8 Seek_Time_Performance 0x0025 253 253 015 Pre-fail
ine - 0
  9 Power_On_Hours 0x0032 100 100 000 Old_age
ys - 2174
 10 Spin_Retry_Count 0x0033 253 253 051 Pre-fail
s - 0
 11 Calibration_Retry_Count 0x0012 253 253 000 Old_age
ys - 0
 12 Power_Cycle_Count 0x0032 100 100 000 Old_age
ys - 328
187 Unknown_Attribute 0x0032 253 253 000 Old_age
ys - 0
190 Temperature_Celsius 0x0022 118 091 000 Old_age
ys - 40
194 Temperature_Celsius 0x0022 118 091 000 Old_age
ys - 40
195 Hardware_ECC_Recovered 0x001a 100 100 000 Old_age
ys - 1787728
196 Reallocated_Event_Count 0x0032 253 253 000 Old_age
ys - 0
197 Current_Pending_Sector 0x0012 253 253 000 Old_age
ys - 0
198 Offline_Uncorrectable 0x0030 253 253 000 Old_age
line - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age
ys - 37
200 Multi_Zone_Error_Rate 0x000a 100 100 000 Old_age
ys - 0
201 Soft_Read_Error_Rate 0x000a 253 100 000 Old_age
ys - 0
202 TA_Increase_Count 0x0032 253 253 000 Old_age
ys - 0

sdb - ten dysk nie sprawia problemów:
***************************************
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED
WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x000f 100 100 051 Pre-fail
s - 0
  3 Spin_Up_Time 0x0007 100 100 025 Pre-fail
s - 5888
  4 Start_Stop_Count 0x0032 100 100 000 Old_age
ys - 335
  5 Reallocated_Sector_Ct 0x0033 253 253 010 Pre-fail
s - 0
  7 Seek_Error_Rate 0x000f 253 253 051 Pre-fail
s - 0
  8 Seek_Time_Performance 0x0025 253 253 015 Pre-fail
ine - 0
  9 Power_On_Hours 0x0032 100 100 000 Old_age
ys - 2177
 10 Spin_Retry_Count 0x0033 253 253 051 Pre-fail
s - 0
 11 Calibration_Retry_Count 0x0012 253 253 000 Old_age
ys - 0
 12 Power_Cycle_Count 0x0032 100 100 000 Old_age
ys - 328
187 Unknown_Attribute 0x0032 253 253 000 Old_age
ys - 0
190 Temperature_Celsius 0x0022 112 088 000 Old_age
ys - 42
194 Temperature_Celsius 0x0022 112 088 000 Old_age
ys - 42
195 Hardware_ECC_Recovered 0x001a 100 100 000 Old_age
ys - 9295384
196 Reallocated_Event_Count 0x0032 253 253 000 Old_age
ys - 0
197 Current_Pending_Sector 0x0012 253 253 000 Old_age
ys - 0
198 Offline_Uncorrectable 0x0030 253 253 000 Old_age
line - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age
ys - 0
200 Multi_Zone_Error_Rate 0x000a 100 100 000 Old_age
ys - 0
201 Soft_Read_Error_Rate 0x000a 253 100 000 Old_age
ys - 0
202 TA_Increase_Count 0x0032 253 253 000 Old_age
ys - 0

smartctl -l error /dev/sda
**************************************
Error 28 occurred at disk power-on lifetime: 2174 hours (90 days + 14 hours)
  When the command that caused the error occurred, the device was active or
idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 51 40 f4 1e 8e e8 Error: ABRT at LBA = 0x088e1ef4 = 143531764

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
  -- -- -- -- -- -- -- -- ---------------- --------------------
  c4 00 40 f4 1e 8e e8 00 00:57:45.063 READ MULTIPLE
  c4 00 08 ec 1e 8e e8 00 00:57:45.063 READ MULTIPLE
  c4 00 08 d4 1e 8e e8 00 00:57:45.063 READ MULTIPLE
  c4 00 10 c4 1e 8e e8 00 00:57:45.000 READ MULTIPLE
  c4 00 08 14 0e 8e e8 00 00:57:45.000 READ MULTIPLE

Error 27 occurred at disk power-on lifetime: 2174 hours (90 days + 14 hours)
  When the command that caused the error occurred, the device was active or
idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 08 7c 79 41 e8 Error: ICRC, ABRT 8 sectors at LBA = 0x0841797c =
  138508668

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
  -- -- -- -- -- -- -- -- ---------------- --------------------
  c8 00 08 7c 79 41 e8 00 00:56:45.500 READ DMA
  c8 00 08 fc 78 41 e8 00 00:56:45.500 READ DMA
  c8 00 08 7c 78 41 e8 00 00:56:45.500 READ DMA
  c8 00 08 fc 77 41 e8 00 00:56:45.500 READ DMA
  c8 00 08 7c 77 41 e8 00 00:56:43.750 READ DMA

/var/log/messages
************************
Error 28 occurred at disk power-on lifetime: 2174 hours (90 days + 14 hours)
  When the command that caused the error occurred, the device was active or
idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 51 40 f4 1e 8e e8 Error: ABRT at LBA = 0x088e1ef4 = 143531764

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
  -- -- -- -- -- -- -- -- ---------------- --------------------
  c4 00 40 f4 1e 8e e8 00 00:57:45.063 READ MULTIPLE
  c4 00 08 ec 1e 8e e8 00 00:57:45.063 READ MULTIPLE
  c4 00 08 d4 1e 8e e8 00 00:57:45.063 READ MULTIPLE
  c4 00 10 c4 1e 8e e8 00 00:57:45.000 READ MULTIPLE
  c4 00 08 14 0e 8e e8 00 00:57:45.000 READ MULTIPLE

Error 27 occurred at disk power-on lifetime: 2174 hours (90 days + 14 hours)
  When the command that caused the error occurred, the device was active or
idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 08 7c 79 41 e8 Error: ICRC, ABRT 8 sectors at LBA = 0x0841797c =
  138508668

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
  -- -- -- -- -- -- -- -- ---------------- --------------------
  c8 00 08 7c 79 41 e8 00 00:56:45.500 READ DMA
  c8 00 08 fc 78 41 e8 00 00:56:45.500 READ DMA
  c8 00 08 7c 78 41 e8 00 00:56:45.500 READ DMA
  c8 00 08 fc 77 41 e8 00 00:56:45.500 READ DMA
  c8 00 08 7c 77 41 e8 00 00:56:43.750 READ DMA
Received on Thu Feb 15 23:40:09 2007

To archiwum zostało wygenerowane przez hypermail 2.1.8 : Thu 15 Feb 2007 - 23:51:14 MET