debian から USB3.0 経由でマウントして使っている HDD が飛んだ。
最近、smartctl から無理くり S.M.A.R.T. 情報を引いていたことの祟りではないかという気もするが、ともかくバックアップ用 HDD が飛んで心配なので、すぐに新しい HDD を手配する。
で、どうせアクセスできないので、この HDD は遊んでみることにする。
mount しながら kern.log を見ると、たまにエラーを吐く。毎回じゃないのが謎。
最初に出たエラーはこれ。
warning: mounting fs with errors, running e2fsck is recommended
言われるがまま、e2fsck するも no error だった。
んじゃスキャンするか、と思って
dd if=/dev/sdb1 of=/dev/null bs=64k
するが、たまに飛ばしていた kill -USR1 への応答がなくなり、9GB 目前で突然、停止。
その時に出たのがこの2種類のエラー。
end_request: critical target error, dev sdb, sector 1598034432
と、
end_request: I/O error, dev sdb, sector 1598034448
なおエラーセクタの番号は、アクセスする度に違う数が出る。
次に、S.M.A.R.T. 情報はこんな感じ。
笑える。
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 10260
3 Spin_Up_Time 0x0027 163 144 021 Pre-fail Always - 8833
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 978
5 Reallocated_Sector_Ct 0x0033 109 109 140 Pre-fail Always FAILING_NOW 726
7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0
9 Power_On_Hours 0x0032 086 086 000 Old_age Always - 10447
10 Spin_Retry_Count 0x0032 100 100 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 438
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 19
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 943
194 Temperature_Celsius 0x0022 113 093 000 Old_age Always - 39
196 Reallocated_Event_Count 0x0032 001 001 000 Old_age Always - 715
197 Current_Pending_Sector 0x0032 199 197 000 Old_age Always - 539
198 Offline_Uncorrectable 0x0030 200 199 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 1
200 Multi_Zone_Error_Rate 0x0008 156 001 000 Old_age Offline - 8920
これでも、5回に1回くらいはアクセスが成功するから不思議なものだ。
なお今回は旧バックアップを最近とっているうえ、オリジナルの HDD が無事だからこんなテキトーなことしているが、普通は最初にデータ救出しましょう。