HDDはそんなに壊れるか?

〜羮に懲りて膾を吹く〜

作成
2008/12/21 Sun
公開
2008/12/22 Mon
更新
2009/08/23 Sun

目次


おじさんの工夫へ戻る トップへ戻る

概要

 HDDなど情報を記録する装置は、故障した場合、修理しても多くの場合、記録されたデータが失われます。修理しても記録した情報は取り戻せないことが多いということが、HDDを内蔵した機器を使い始めの人にはあまり実感できない事柄のようです。このため、HDDの障害に備える必要性に気が回らないようです。

 HDDも通常の電子機器ですので寿命があります。またソフトウエア的な要因により記録がおかしくなることもあり得ます。ソフトウエアの要因かハードウエア的な要因化にかかわらず、HDDに大規模な障害が起きるとほとんどの場合、記録された情報を失ってしまいます。

 このようなことを一度経験すると、今度は異様にHDDの故障に過敏になってしまう人を少なからず見かけます。ひどくHDDの信頼度が低い印象を持ってしまうようです。この影響か寿命について平均的に2年くらいで壊れるなどの書き込みがQ&Aサイトに見受けられます。

 HDDの障害に備えないのも、極端に短い平均寿命を想定するのも極端です。以下では、私が20数年PC関係の外部記憶装置とつき合って来た経験に基づいて、整理したいと思います。


目次に戻る おじさんの工夫へ戻る トップへ戻る

バックアップは不可欠です

 HDDなど情報を記録する装置は、故障した場合の被害が、他の一般的部品と大きく異なります。

 通常の部品の場合、故障したら交換すれば機能を取り戻します。例えば、電源が故障すると全くその機器は使えなくなってしまいますが、正常な物と交換すればその機器は全く問題なく使えるようになります。冷蔵庫やエアコン、テレビなどの普通の機器は直せば機能を取り戻します。

 HDDの場合、交換されれば記録された情報はなくなってしまいます。HDDの修理はほぼ間違いなく交換になってしまいます。HDD以外の記憶を蓄える機器の場合、記憶媒体とそれを読み書きする装置が別のことが多いので、読み書きする装置の交換は情報の喪失につながりません。装置の故障が即情報の喪失につながるのはHDDの悪い特長の一つです。

 メーカがRMA(Return Merchandise Authorization)をつけて保証していようが、販売店の保証がついていようが、故障したら多くの場合情報は失われます。運良く故障したのが制御基板の場合、同じ品種で同じ時期のHDDを入手して制御基板を交換すれば情報を取り出せる場合もあります。また、専門の業者に依頼して記録媒体上から情報をサルベージしてもらうような手段で情報を取り戻すことが出来るかも知れません。しかし、これらは偶然の幸運によるか、高い技術料と引き替えに成し得る物です。

 また、機器の故障以外の要因で記録された情報を失うことも発生します。間違って削除したり上書きする、コンピュータウィルスに書き換えられる等、考えられる要因はたくさん存在ます。この辺りの話はバックアップの多様性に別途まとめています。

 通常、読み出し専用の記録媒体でなく、HDDのような定常的に読み書きできる不揮発性記録媒体は、利用者自身が関与した他の人は知りようがない記録が行われます。知る人がいないので、多くの場合、無くしてしまっては困ります。また、多くの場合、再度作り直すことが困難です。

 このようなことを考えると、PCの利用においてバックアップは必要と考えます。バックアップが必要のない状況は非常に特殊で例外的な状況だと思います。必要であるにも関わらず、バックアップを行わずに運用しているPCの何と多いことか。バックアップしていても後で大きく悔やむことのない間隔でバックアップしていないと言うことも多々見受けられます。

 普通にPCを使っていればバックアップは必要不可欠なのに、それを行わずに記録した情報を失ってしまう人が多くいます。準備無く情報を失うと非常に大きな精神的衝撃を受けることがあり、それが強く印象に残ります。このため、HDDの故障は誇張されて伝わることが多いのではないかと思います。「羮に懲りて膾を吹く」に落ちいりやすい状況だと思います。

 端的に述べると、以下のようなことになります。


目次に戻る おじさんの工夫へ戻る トップへ戻る

適材適所

〜用途が合えば見合う寿命が有ります〜

 HDDは偶発故障と思われる異常が目立つ機器です。Googleが公表しているレポート(Failure Trends in a Large Disk Drive Population)の通り、初年度でも6%程度、それ以降5年程度までの間、1年ごとに6%〜8%弱の故障見込まれます。この結果は私の経験ともほぼ合致しますが、業界が大きな問題を抱えた時期を除いた印象では、もっと不良率が低い印象を持っています。

 時々見かける2年が寿命という説は極端であると思います。例えば、ほぼ毎日自動的に録画を行い、平均8時間以上稼働している当サイト内の録画用PCは、もう3年半を超えて稼働しています。夏の暑い日も、録画が予定されていれば空調なしで稼働しているので、定格内の動作をしているとはいえ特に優良な環境で稼働しているわけではありません。 また、この録画PCを使いはじめる前、NECのHDDビデオレコーダ「PK-AX10」を録画のメインに使っていました。これは2003年初めから2005年半ばまで毎日8時間程度稼働し、それ以降は時々しか稼働していませんが、今でも動きます。

 もっと規模の大きな話では、メールサーバ用として、電気設備点検時の停電と2回の引っ越しの時以外24時間365日運転しているHDD6台が1998年から今日現在(2008/11/23 Sun)まで10年間1台も故障することなく運用されているのを見ています。またファイルサーバとして同様に運用しているHDD12台が2000年から8年1台も故障することなく運用されているのを身近に見ています。前者は旧IBMのPATAのHDDで、後者はMAXTORのSATAのHDDです。後者はサーバ用途として販売されているHDDですが、前者は全く一般的な物です。特に高信頼に設計されたSCSIデスクというわけではありません。

 多少、通常のPCでの利用と違うのは、これらが連続運転を考慮したRAID-BOXに入れて運用されていると言うところです。連続運転を考慮したRAID-BOXは、空気の流れが良く考慮されています。通常のPCの中に比べると高発熱のCPUもなく、描画状態で大きく消費電力を変動させるグラフィックボードもありません。このため、温度や電源電圧が安定しています。連続運転を考慮したRAID-BOXの中はHDDの動作にかなり良い条件です。

 RAID-BOXのように整った環境でなくとも用途に適したHDDと環境を整えれば、製品の用途に見合う寿命が得られます。ホットスワップ対応HDDゲージに入れて常に一定上の風速にさらされるようなことを想定しているRAID向きHDDを外付スリムHDDケースにいれては十分な寿命が得られません。外付スリムHDDケースは性能は抑え気味ではあるがそれに見合った低発熱低振動HDDがあります。HDDには向き不向きが存在します。

 以下のよう配慮がHDDの寿命を全うさせるに必要な注意点であると考えます。

 また、上記でも数例書いていますが、おおむねHDDは以下の得意分野を持つ物に分けられるようです。

 ベンチマークなどで測られるような性能向上のため、多めの自己発熱があり、十分なエアフローを想定しているHDDを、外付HDD用スリムケースに納めたのでは十分な寿命は期待できません。

 また、寿命以外でも想定外の用途では欠点が目立ちます。例えば、「車載やバックアップテープ装置代わりなどの用途として使われる、振動や温度などで読み書きの性能を変化さず、記録されたデータの安定性の高いHDD」の場合、安定した記録を実現するために記録密度が同世代の物より低めに設計されていることが多いのです。これが一般特的な特性が劣化させます。通常、記録密度が下がるとデータ転送速度が低下するのでベンチマークなどではかなり不利になります。よって、一般PCのシステムHDDには向かないことになります。一般PCのシステムHDDには別の特性の物を使うべきで、その用途で性能が低いと言ってもお門違いと言うことになります。

 このようにHDDには適材適所があり、これを外すと寿命以外にもろくなことがありません。


目次に戻る おじさんの工夫へ戻る トップへ戻る

悪い物と時期を避ける

 何処製のHDDが良いとか悪いとか言う噂は何時でありますが、メーカ差よりも時期の問題の方が重要であると思います。ある世代の製品が良いメーカも次の世代がよいとは限りません。トラブルを起こしたメーカでも次の世代が良いことは往々にしてあります。業界全体に悪い時期というのも存在しました。

 これは定期的なものではなく、不定期にやってくる業界全体を覆うトラブルが発生している時期があるという意味です。これは、都市伝説的な曖昧な話ではなく、業界紙(日経エレクトロニクス等)にとり上げられ、技術解説が行われるような明確な原因を持ったトラブルが発生することがあるのです。

 その時期には最低限必要な物だけにして、積極的な買い増しや買い換えを避けると言うことが必要です。また、その問題に関わっていない一つ古い製品世代の物をあえて買うとか、その次の世代まで待つな配慮も一考にに値します。

 また、特定メーカで発生している問題の場合は、発生している世代の製品を避ける等の配慮も必要です。購入後問題が発覚する場合もあります。対策ファームウエアの導入や、場合によっては早めの入れ替えなどが必要になる場合もあります。自作PCの場合、メーカ製のPCのように誰かがリコールなど対策をしてくれるわけではありません。購入前購入後の情報収集が欠かせません。

 HDDは、高度なメカトロニクス製品であり、また、高度な磁気を取り扱う技術に支えられる部品です。信号処理面でも訂正技術など高度な基礎技術にささえられています。通常の電子機器以外の側面を強く持つ最先端の総合技術に支えられる製品でありながら極端な価格競争にさらされる製品の一つでもあります。

 通常の電子機器に比べると、多様な技術分野に支えられています。また、利用されている技術分野の基礎的な部品の多くは価格競争で生き残れるような、効率と量産によるメリットを持つ企業の製品で寡占状態に近い状態になっていることが多くあります。

 このため、基本的な物を生産している1社の製品が問題を抱えると、メーカの枠を超えて多くHDD製品が問題を内包してしまうことが良くあります。

 有名な事例として、2001年頃に発生した、富士通製HDD問題があります。この件の一方の当事者である住友ベークライトの平成17年3月期の決算短信(連結)の20ページに重要な後発事象として和解の記述が有ります。

 これは、以下のような物でした。

  1. 当時、半導体封止材は住友ベークライト社が大きなシェアを持っていた
  2. 環境問題への対応のためこの封止材の難燃剤を変更した
  3. その難燃剤の取り扱いの不慣れなメーカのICに問題が内包された
  4. そのICを利用していた富士通製HDDの出荷後不良率が極端に増加した

 当然、開発時の確認試験や、出荷検査などもすり抜けるような不良ですから、初期動作などは何の問題もなく、数年経ってから動作不良が多発すると言うやっかいな問題でした。

 当時は富士通が正直に公表し、リコールを行ったので富士通製HDDの問題のように思われている方も多くおられます。しかし、こと大きなシェアを持っていた半導体封止材の問題ですから、富士通だけで済む話の訳がありません。上記の、住友ベークライトの平成17年3月期の決算短信(連結)の17ページに重要な後発事象を見ると、富士通以外にもシーゲートとの和解についても記述が有ります。このほかの多くのメーカも影響を受けたであろうことは想像に難くありません。

 結果として、この時期のHDDは1〜2年で突然死する物が多く見られました。この頃の印象を強く持っておられる方は、HDDは2年で寿命を迎えるなどとおっしゃるのではないかと想像します。

 これ以外にも、以下のような問題が目立っていたように思います。

 その他、様々な理由で発生していました。

 問題が内包していても障害が発生する前や、情報が公になる前にこれらに対処することは出来ません。しかし、問題になっている最中には、業界紙やそれに関連するWeb、メーカ製PCのサポートサイトなどで、情報を得ることができます。わざわざ問題になっている物を使ってしまわないよう注意を払うだけでもリスクを軽減できます。

 このような悪い時期を避けてしまえば、2年などと言う短い寿命ではなく10年程度は持ち5年程度を目安にしても問題がないとの感触を持っています。ただし、偶発故障はついて回りますので、必ずバックアップは必要です。


目次に戻る おじさんの工夫へ戻る トップへ戻る

慎重に輸送する

 販売店での取り扱いの様子や、宅配便の取り扱いについて気遣う人は珍しいことはありません。ところが購入した自身の取り扱いに気遣いが欠ける人も珍しくないように思えます。以下のようなことに覚えはありませんか?

 寿命を気にするならば、このようなことに気をつけないと片手落ちです。明らかに購入後の取り扱い不良で寿命を縮めいている例を見かけます。


目次に戻る おじさんの工夫へ戻る トップへ戻る

しっかり固定する

 普通にケースに固定されていれば、寿命に影響が及ぶような問題が発生することはないと思います。しかし、この普通に固定するというのが守れていないことが往々にしてあります。

 緩んで揺れても、さすがに脱落はしないのが普通です。しかし。簡易に取り付けられるようにネジ溝がL字に切ってあったり長穴の場合、滑り落ちることがあります。また、ネジが短い場合、片側のネジが脱落することがありこの場合片方が完全に浮いてしまうことがあります。

 微妙なヘッド制御を行っている今のHDDにこのような予測しづらい外乱による制御負荷の増加は好ましい物とは思えません。

 締め付けの問題に関しては、本格的なトルクドライバ(数万円から10万円弱)を用意する程でもありません。トルククラッチ付きの電動ドライバ(数万円)を一つ用意しておけばほとんどの場合十分です。これで作業は楽になりますし一石二鳥です。また、これで適切な締め付けを行ったネジを緩めたり締めましたりして感覚をつかんでおくと手で締める時の参考になります。多くの場合これで解決してしまいます。

 留め具の出来の問題やバリの問題は観察と締め付けた後の確認しか有りません。基本に忠実に対角線上にネジを締めていくと問題の発生を少なくできますが、絶対にうまくいくわけではありません。

 しっかり固定するというのは、基本的な部分だ有りながら、案外に抜けている部分だと思います。


目次に戻る おじさんの工夫へ戻る トップへ戻る

温度と電源に気をつける

 HDDはメカトロニクス製品です。しかも一般の家庭内で身近にある機器の中では群を抜いた超精密機器です。これを正しく稼働させるには厳密に定格を守る必要があります。実際には、定格を外れて実力値でぎりぎりで動作しているHDDが自作PCにはまれとは言い切れない状況に思います。これによるHDDのクラッシュがHDDの寿命に対して悪い印象を助長しているように思います。

 自作PCでなくとも、外付HDDケースに単体で購入したHDDを入れて使っている場合や、メーカ製PCに自身で内蔵HDDを増設したような場合に、定格を外れて動作しているHDDはまれではないと思います。

 HDDの品種差による寿命を語る前に、まずは、定格内で動作させているかどうかを確認する必要があると思います。特に、温度と、電源電圧が定格内にあるかどうかは、取り付け後に確認した方がよい項目のように思います。

 排熱性能や電源容量に十分に余裕があるときには、さほど確認は必要有りません。しかし、元々想定するオプションの範囲ぎりぎりに設計されたスリムケースのメーカ製PCや、低消費電力HDDしか想定していない外付HDDケースを使うときは要注意です。自作PCでも、使っている電源の供給能力に定評のある物でないならば、やはり確認が必要です。

 HDDに関わる電力の場合、起動時に最大の電力を消費します。昔は、HDD以外で12V系で大電力を消費する物がなかったため、安定して起動できれば問題のないと言われた時期がありました。ところが、10年程前からCPUは12V系を大量消費しますし、高機能グラフィックボードは大電力をまかなうためにマザーボードからの電力供給だけでは足らず別途電力供給する必要があるほどで、ここでも電力を消費します。

 加えて、電源の商用電源の入力電圧が下限に近い場合の供給力の低下の問題があります。日本は、商用電源の呼称電力が100Vと言う低い電圧を使う珍しい国であり、入力される電圧が電源の定格下限に近くなることがあります。この場合、カタログ値の電力が供給できない電源が多く、この状態で12V系を大量に消費されると十分電力が供給できない事態に陥りかねません。このような低入力電圧で動かすためには、カタログ値に対し低減率をかけて、その範囲内で使うことが必要です。

 これらの理由で、普段何ともないのに、電力消費が大きいときのみ電圧定格を外れるようなことがあり得ます。非常に重いグラフィックを扱うヘビーなゲームのやっている最中は、全体に電力消費が上昇し、消費電力が大きいため、電源電圧が低下しやすくなり、そこへHDDの負荷も高まるようなことがあると、電源が不安定な動作になることがあります。結果としてHDDの定格電圧を外れることが発生します。

 また、それだけの電源供給能力が要求されると言うことは、ケース内では、供給されている電力分の発熱が発生していると言うことでもあります。起動時の短い時間や特に負荷が高まる一瞬と言うことだけではなく、動画などのエンコードを行っているときはその時間、大きな電力が消費され続けます。非常に重いグラフィックを扱うヘビーなゲームのやっている最中は、GPUの消費電力も加わり、かなりの電力が消費され、それがケース内で熱になっています。

 ケースの排熱に十分余裕があるときは良いのですが、そうでないときは、余裕のない使い方をした分だけ温度について注意を測らねばなりません。最低限、定格温度を超えさせないようにする必要があります。

 HDDの品種による寿命を言及するのであれば、せめて定格内での動作に注意をする必要があります。確認の仕方に不確実性が混ざるほど、それに見合う定格に対する余裕も必要です。まずは肝心の定格内動作を保証するための余裕の確保であり、無駄に温度に神経質になる前にそれを確保する必要があります。

 例えば、500Wを切る電源で、SLI&HDD4台によるはRAID0などという機器を運用するのであれば、最低限総消費電力は測定しておくべきです。Quad SLIを組んで、ハイエンドのCPUと共に使う場合は、750Wの電源を使っていても十分な余裕があると安心は出来ません。そのようなシステムでHDDを数多く使うのならばHDDの電源端子のところで電圧を測っておきたいところです。スワップベイを使っていて個々のHDDの電源を測れない場合でもスワップベイの電源端子で電圧を確認したいところです。

 大電力を消費させているのなら、常時温度を監視するところまで行かずとも、排気温度の絶対値と室温の差の2つは確認しておかないと安心できません。内蔵ベイに取り付けたHDDもその発熱に影響を受けていたり、クーリングエアがそこに回らず自己発熱で温度が上昇している可能性があります。S.M.A.R.T.による温度測定値が定格を外れていなければ多くの場合安心できます。測定できない場合でも分解して測ることで目安を得られます。冷えていく様子を記録すれば、停止してから温度を測るまでの時間を加味して温度を推定できます。

 当サイトのメインPCの場合、総電力はLCD1枚ぶんと合わせてUPSが監視しています。また、電圧低下については、92VでUPSが昇圧運転に入るようになっており定格下限の入力で能力が低下することを防いでいます。また、温度や電源電圧、ファンの回転数などは、マザーボード付属の管理ツールで確認しています。HDDの温度はRAIDを組んでいる関係でS.M.A.R.T.による温度測定が巧くできていませので、HDDを組み替えた時などには、小型の放射温度計で温度を確認しています。

 ここまで神経質に取り扱いたくなければ、余裕を十分に取ることが必要です。また、数百Wを消費するPCを無防備にたこ足配線の先につけるようなことは最低限避けねばなりません。

 余裕が十分取ってあり、定格内動作していれば、HDDの寿命は2年で多くが壊れるような極端なことはないように思います。数年の利用であれば、偶発的な不良に遭遇するだけにとどまると考えます。


目次に戻る おじさんの工夫へ戻る トップへ戻る

まとめ

 現在、手持ちのHDDを調べると、75台程度有ります。取り扱ったHDDは300台をくだらないように思います。サービスをやっておられる方などに比べると桁違いに少ないとは思いますが、多分普通のPCの利用者に比べるとたくさんのHDDとつき合って来ていると思います。

 この数字は%オーダーの話をするには統計的には十分な量とは言えません。よって感覚的な話にはなるのですが「HDDの寿命は2年が目安」とか言われると大きな違和感を感じます。用途のあったHDDを使う限りに於いては、2年で寿命を迎えるのは少数派だと思います。

 私が20年ほどの運用で持つ実感と、Q&Aサイトで取り上げられる寿命では大きな開きがあります。この問題は、結局のところ、次のようにまとめられるのではないかと思います。

 このような事柄に注意を払って、期待される寿命の目安が2年ということはないと思います。「適材適所」のところで例を挙げたとおり、2年で寿命を迎えたHDDの方が例外的存在です。注意を払った環境であるならば、10年は持つ感触はありますので、目安として5年を超える寿命を期待しても良いのではないでしょうか。10年以上の寿命を目安とするのは難しい気がしますが、10以上持ってもおかしくないユニットだと思います。

 繰り返しになりますが、目安として5年以上の寿命が期待できても、それより短い期間で偶発故障が起こりえます。故障すれば記録されたデータに対する被害が通常回復できない機器ですのでバックアップは必須です。


目次に戻る おじさんの工夫へ戻る トップへ戻る