周回遅れの日記

はてなダイアリーから移転

代替処理の出たHDD

3年前に買ったハードディスクに代替処理が出ています。
HDS721050CLA362 というモデル、日立時代のHGSTのHDDです。メインマシンの内蔵ドライブとして、データ用として使っていました。

代替処理が行われる

昨年9月。
とりたてて異常もなく無事に昨夏まで使えていたのですが、CrystalDiskInfoでSMARTを確認したところ、05とC4、「代替処理済のセクタ数」と「セクタ代替処理発生回数」のRAWが0から2になっていました。

いつ代替処理が行われたのかは、実はよく解りません。
当時は主にAMD機を、AHCIモードで、WindowsXPで使っていたのですが、この「AMD/AHCI/XP」の組み合わせだとSMARTが読めないんですね。そこで、週一くらいのペースでWindows7を起動してSMARTを見ていたのですが、夏の間いろいろ忙しくて夏の間SMARTチェックを怠っていたのです。そうしたら、チェックを怠っている間に代替処理が出ていたという次第です。

傘を持たずに出れば必ず雨が降るし、朝食を食べずに出勤すると昼飯を食う暇が必ず無くなるものです。
そういうジンクスってありますよね。
SMARTチェックを怠ると必ず代替処理が出るのです。

代替処理が出たとはいえ、特にファイルが失われるようなこともなく正常に代替処理が行われたようで、それ以上代替処理が増えることもなかったので、あまり心配はしておりませんでした。

代替処理が一気に増える

昨年11月末。
とはいえ、HDS721050CLA362はもう3年目だし、円安進みそうだしその前に新しいの買っちゃおう。
ということで昨年10月に新しいHDDを購入し(この新しいHDDには初期不良があって交換してもらった、その件はそのうち別に書きましょうか。)、HDS721050CLA362はいつ壊れてもいいような態勢にはしていたのですが、愚かにも自分で余計にHDDを痛めるようなことをしてしまいました。
何をしたかというと、パーティション操作です。使いにくい小さなパーティションをまとめようかどうしようかと考えていて、パーティションをまとめる案がまとまったので、あまり深く考えずにパーティションのマージを実行してしまいました。すぐにHDDがカリカリ言いはじめて、「あ、そういえば、このHDDは負荷をかけるとヤバいかも!」と思いましたが、もう遅い。操作を取り消そうかと思いましたが、中途半端な形で終了させると余計に状況が悪化すると考えて、何もせずパーティション操作が終わるのを待つことにしました。

終了後にCrystalDiskInfoを起動すると、ああ、やはり。
C4「セクタ代替処理発生回数」のRAWが24(十進表記で36回)。
05「代替処理済のセクタ数」のRAWが23(35セクタ)。
そしてペンディングも出てしまいました。
C5「代替処理保留中のセクタ数」のRAWが2。


パーティション操作をしなければきっと代替処理は進まなかっただろう、と思うと非常に悔やまれますが、自業自得なので仕方ありません。
ああ、馬鹿

回復不可能セクタが出る

一気に代替処理が進んだので、もうこのHDDは危ないと考えて内蔵から外すことに。
その前に、せっかくパーティションを修正したので、もったいないから修正して空いたスペースにデータを入れておこうと思いました。データといっても、もう見ないだろう動画データなど、失なわれても構わないけどなんとなく捨てる気もしない、重要性の低いデータです。巨大なゴミ箱みたいなものです。
そこで60GB程度のデータをコピーしていたところ、CrystalDiskInfoからキンコンというチャイムが。

C4「セクタ代替処理発生回数」のRAWが25(十進表記で37回)。
05「代替処理済のセクタ数」のRAWが24(36セクタ)。
C5「代替処理保留中のセクタ数」のRAWが3。
そして、ついに回復不可能セクタが出ます。
C6「回復不可能セクタ数」のRAWが2。
コピー中に回復不可能セクタが出たということは、コピーしたファイルをベリファイで読み出そうとしたら読めなかったということなのでしょうか?まあ、ゴミファイルだからいいですけど、でも余計なことをしなければ回復不可能セクタは出なかっただろうと思うと非常に悔やまれますが、自業自得なので仕方ありません。
ああ、馬鹿

回復不可能セクタが消える

C6が出たからにはもうこのHDDはダメだろう、と思いました。
そして、完全に動作しなくなる前にデータを完全消去してしまおうか、などと考えていました(動かなくなってしまうとデータも消去できなくなってしまいますが、動かないからといって捨てたら拾った誰かがデータを吸い出しを試みる可能性があります)。その上でジャンク品扱いで売ってしまおうか、などと考えてはいたものの、ちょっと作業する時間がなくて、PCから外したまま一月ほど放置しておりました。

そして昨年年末、12/30のことですが、ふとこのHDDのことを思い出して、一月以上放置しちゃったから一応通電してやるか、と外付けケースで接続してみました。

するとどういうわけか、C6が消えてるじゃありませんか。
代替処理は増えています。
C4「セクタ代替処理発生回数」のRAWが27(十進表記で39回)。
05「代替処理済のセクタ数」のRAWが26(38セクタ)。
C5「代替処理保留中のセクタ数」のRAWが3から2に。1つ減りました。
そして、C6「回復不可能セクタ数」のRAWが2から0に。

あれれ、まだ生きてるんですかこのHDD、これ。

ペンディング中のセクタが消える

回復不可能セクタはなぜ消えたのでしょう。分かりません。
分からないので、不良セクタがあるのかどうか、SMARTだけではなくて、HDD全体の読み込みテストをしてみることにしました。
ついでに、ペンディング中のC5はまだ残ったままなのですが、これも消えてくれたらいいなあという願いをこめて。
テストはWestern DigitalのDLGを使おうと最初思っていましたが、やっぱり止めて、ちょっと古いですがフリー版のHD Tuneのエラースキャンを使ってみることしました。HD Tune だと、不良セクタがどの辺りにあるのかイメージで分かるので、そのあたりを避けてパーティションを切り直せば普通に使えるんじゃないかという目論見です。

まずはクイックスキャン。500GBを45秒で終了。不良ブロック無し。
クイックスキャンを終えて、SMARTの値を確認して(本テストで負荷がかかるので、代替処理が進むことが予想されるので)から本番を実施。

全部緑色です。無事不良ブロックが無いことが確認できました。
所要時間は500GBで2時間程度。

直後にSMARTを確認すると、予想通りテストのせいで代替処理が進んでいます。
C4「セクタ代替処理発生回数」のRAWが27から33へ(十進表記で51回)。
05「代替処理済のセクタ数」のRAWが26から32へ(50セクタ)。
そして、C5「代替処理保留中のセクタ数」のRAWが2から0に。
HD Tuneのエラースキャンが何をやっているのかはよく知らないんですが、たぶん全領域の読み込みをやってるんだろうと思います。そして、ペンディングになっていたセクタを読み込んでみたら無事読み込めました、と。

次、HD Tuneのベンチマークを実行してみます。
速度を測るというよりも、極端に速度が遅いところがあるか、あるとしたらそれはどの辺かを知るのが目的です。
もし、ギザギザのグラフができたら、その辺りに異常があるために読み込みが遅くなっている可能性があるわけです。

ちなみに↑が、3年前の購入直後にやった結果。
(OSもPCも違うので単純に比較はできませんが)

そして、今回のベンチマークはこう↑なりました。
右半分の内周の方はほとんど違いがありませんが、左半分の外周の方に一箇所大きな落ち込みがあります。幸い、目立つギザギザはこの一箇所だけです。
これたぶん、まさにベンチマーク中に代替処理が行われたんだと思います。
テスト前とSMARTを比較したら05が1増えていたので。
代替処理で時間がかかった分速度が大きく落ち込んだのでしょう。そして、代替処理は正常に行われたので、以後は問題は生じないはずです。

最初はDLGでゼロフィル⇒全領域読み込みテストをやってみるつもりだったのですが、無事エラースキャンをクリアしたので、もういいや、という気になって止めます。
テストのせいで余計に負荷がかかるのも嫌だし。

さて、すぐには死なないであろうことが分かったものの、まだちょっと不安ではあります。大事なデータの置場には使う気にはなれません。
とりあえず、内蔵に戻して、\Tempとかキャッシュファイルとかインデックスファイルの置場にして様子を見てみることに。OS入りのSSD、データ置場の健全なHDD、そしてキャッシュ置場のこのくたびれたHDDというストレージ3台構成です。
そうすると一日1個か2個くらいのペースで代替処理が増えていきます。でも、もう代替処理のチャイムでも驚かなくなってきました。

再び代替処理激増

このHDDの先頭パーティションには、OSが入っています。Windows7 x86の評価版で、昨年の11月にインストールしたものの、その後回復不可能セクタが出たので使わないままずっと放置していたものです。
Windows8x86版のダウンロード版のインストールメディアを作る必要があって、この放置OSを使ってみることにしました。が、インストールしただけで放置していたので、ドライバが全く入っていません。画面も解像度が低くて作業がやりにくい。
そこで、モニタのドライバ、Catalyst、LANドライバ、オーディオドライバ等をインストールしました。再起動を5、6回繰り返したでしょうか、一応作業できる状態になって、ふとSMARTを確認すると代替処理がいっぱい。

C4「セクタ代替処理発生回数」のRAWが33から66へ(十進表記で102回)。
05「代替処理済のセクタ数」のRAWが32から63へ(99セクタ)。
いやあ、ドライバをインストールするのって結構HDDに負荷がかかるんですねえ。
でも、C5とC6が出ないので安心しました。

代替セクタの余裕ってどのくらいあるんだろう?

用意されている予備領域がどのくらいあるのかは分からないですけれども。
このHDD、代替処理済セクタが99個になっても、Currentの値は100のままです。
なかなか99に減ってくれません。
Currentがパーセンテージだとして、1%未満切り下げ表示だとすれば、99÷10,000=0.0099ですから、予備領域は少なくとも10,000セクタは用意されているということになります。
閾値が5ですから5%、9,500セクタ代替されるまでは(一応)使えるということです。

昨年11月末、パーティション操作を行ってから代替処理が急に増え始めたわけですが、そのときの使用時間は13,622時間。
今13,705時間で、その83時間の間に97セクタの代替処理が実行されました。
1時間あたりに直すと、1時間あたり約1.17セクタです。
1セクタあたりに直すと、1セクタ代替処理されるのに約0.86時間かかっています。
となると、あと9401セクタ代替処理されるまでにかかる時間は約8085時間。
24時間連続稼働させるとして、337日目の12月8日に予備領域の残りが閾値を下回ることになります(そして、354日目の12月25日に予備領域を使い切って代替処理ができなくなる)。

こういう計算でいいんだろうか?あんまり自信がありませんが。
そう、おかしいです。1万も予備領域があるはずがない。Currentは単なるパーセンテージではないということだと思います。こちらに補足記事を書きました。

ちなみに、HDDの寿命は平均2万時間とか聞きますけど、13,622時間の時点で余命8,085時間だとだいたい平均レベルということになりますね。

まあ実際は24時間連続稼働なんてさせませんから、実際に予備領域を使い切るのはずっと先になるんじゃないかと思います。
もっとも、予備領域以外の問題でその前に壊れるかもしれませんが。

なし崩し的に7乗り換えが進んでしまった

上の方でも書きましたが、XP+AMD+AHCIの組み合わせだとSMARTが読めないのです。
Windows7よりはWindows XPの方が断然好きなのですが、くたびれたHDDを使っているせいで、SMARTを常時チェックしていないと不安になり、それが原因でWindows 7 を主に使うようになってしまいました。
HDDのせいで意図せずOSの乗り換えが進んでしまった形です。

(追記)

このHDDについては、この後にこんな記事を書いています。
HDDの代替処理について調べている方は参考になるかもしれません。
全く参考にならないかもしれません。
予備領域ってどのくらいある?
HDDの代替処理が増える
HDDの劣化が進んできた
代替処理が出て半年後のHDD
CDIをアップデート
代替処理急増後一年経ったHDD