バックアップの多様性

 バックアップディスクにコンバインやストライド構成はダメか?

作成
2007/11/25 Sun
公開
2007/11/27 Tue
更新
2008/03/05 Wed

目次

  概要
  基礎的な問題を整理
    バックアップの用途
    記憶媒体に要求されること
  バックアップの方法
    方式と頻度
    記憶媒体の選択
  まとめ
  参考文献

おじさんの工夫へ戻る トップへ戻る

概要

 以下はバックアップに関しての私の意見です。

 ここでは、なぜバックアップするか、どんな頻度でするかなど、ちょっと抽象的な事を取り扱っています。ツールなどを使って実際にバックアップする事については触れていません。それらについては、もっと詳しいサイトが有りますのでそちらを参照なさってください。

 バックアップについては、単純な話のようで、議論すると案外紛糾します。これは、基礎的な事柄に認識のずれがあるのに話を進めるからのようです。このバックアップの基礎的な事柄について整理します。

 この基礎的な事柄に付いて話を進めながら副題にもある「バックアップディスクにコンバインやストライド構成はダメか?」に対する私の考え方を整理していきます。

 先にこのページで展開する個人が持つデータバックアップについての結論の要約を5項目の箇条書きで示します。下記1項目目のRAID1等を組むことと2項目目の別の記憶媒体に同じものを取っておく通常のバックアップは互いに補い合う関係です。このため下記1項目目と2項目目は両方行うのが望ましいと思います。

  1. 消費電力や場所に余裕があるデスクトップの場合、HDDの故障に備えての通常の備えとしてRAID1を組むのが良いと考えます。
  2. 次に、誤操作による上書きや消去、悪性プログラムによる障害、ソフトウエアの暴走などに備えてバックアップ用に用意したHDDに日常的に2世代以上のバックアップを用意するのが良いと考えます。
  3. ノートパソコンなど電力的制限や場所の制約が多い機器も、上記の要因に加えて、故障や紛失、盗難に備える意味でもバックアップ用に用意した外部のHDDに日常的に2世代以上のバックアップを用意するのが良いと考えます。
  4. 自身で作成した取り返しのつかないオリジナルなデータは、DVD-RAMなどの長期保管特性について一定の評価が得られている単純な媒体に保管するの良いと考えます。
  5. 厳選したデータを火災、水害、震災などに備えて、時々地理的に離れた学校や勤め先のロッカー、友人宅、帰省先などに保管しておく事も考慮の一つではないかと思います。

 最後に「バックアップディスクにコンバインやストライド構成はダメか?」についてですが、異常が起こったことが検出できる上記上から2項目のような日々のバックアップ用のバックアップ先としては十分有用ですが、オフラインの世代保存用などには向かないという結論になっています。


目次に戻る おじさんの工夫へ戻る トップへ戻る

基礎的な問題を整理

バックアップの用途

どんなことが起こるか

 バックアップの基本は、「プログラムやデータの毀損に備えて予備を用意する事」だと思います。

 この「毀損」の原因の想定がズレの多い所ではないかと思います。原因として次の様なことが上げられると思います。なお、以下の全てに対応しようという話を展開するわけではありませんのでお間違いなく。

 この中で、「(A)ハードウエアの故障による毀損」の中の「(あ)記憶媒体の劣化・故障(HDDの故障など)」しか想定していない人と、これら全般について考える人では議論がかみ合わなくて当然です。

 ここに書かれている事柄を全て考慮しなければならないような重要なデータを個人的に保持しなければならない人は、なかなか想定しにくい物があります。さりとて、「(あ)記憶媒体の劣化・故障(HDDの故障など)」しか想定せずにいて悔いが残らない人が多数派とも思えません。自分が作り上げたオリジナルのデータや記録の類を抱える多くの人は、せめて「(B)ソフトウエア的な原因による毀損」の「(あ)人間の過失に基づく操作による」毀損からある程度保護したいと思うのでないでしょうか。

 どんな毀損の原因に備えるか?どこまで備えるか?を想定してバックアップを考えなくてはなりません。

参考文献
岩波書店 1998,2005   広辞苑                         バックアップの項
大修館書店 2002-2004 明鏡国語辞典                   バックアップの項
日経BP社             日経パソコン パソコン用語辞典 バックアップの項
朝日新聞社 2005      パソコンで困ったときに開く本  バックアップの項
旺文社               カタカナ語新語辞典 第五版   バックアップの項

バックアップに期待する物

 バックアップの用途として私が一番期待するのは素早く作業が継続出来る状態に復帰出来る様にすることです。修復中に作業が継続できるればさらに良いことになります。このことに異論のある方は少ないようです。

 この作業の継続性と並んで重視するのが、蓄えてきたデータが無くならないことです。「個人で蓄えているデータ」についてはピンから切りまでの意見があります。

 一方は、個人で蓄えているデータにそんなに重要な物はないのでバックアップでコストをかけるほどの物はないという立場です。これの変形として、HDDは個人がバックアップを必要とするほど壊れる確率は無いという人もいます。こう公言した翌朝にHDDが飛んでしまった人を上司に持ったことがあります。昔はよく見かけたのですが、この頃はさすがにこのような人たちは減ったようです。

 もう一方は、個人こそ必要という立場です。企業の成果物としてのデータは、複合的な文書群から生成されます。このため一部が無くなってもそのほかの物から再生成できるのが建前です。しかし、個人の物はそのような物がないのでよりバックアップなどが重要であるという意見です。確かに、プログラム一つをとっても仕事で作る場合は文書類が整備されます。企画書(要件定義書)⇒要求仕様書⇒外部仕様書⇒詳細仕様書⇒内部仕様書⇒モジュール仕様書・・・と続いていくので、何処かが無くなっても前後から戻せそうな気がします。個人で作るプログラムはこうはいきません。

 私が個人的に抱えてきたディジタルデータの古い物としては、1980年頃の、パソコンを触り始めた頃に作ったテキストのデータがありますが、さすがにこれは現在使うようなの物ではなくなっています。実際に使っている一番古そうな物は、1986年頃からの使いはじめた当時のワープロの辞書データです。変換を何回もしつつ今の日本語FEPに引き継がれてきています。これ以降は、コンピュータが十分扱える能力を獲得する度ごとに保存されるデータが増えていきました。まず階調の少ない静止画像、MIDI等の音楽のデータ、多階調の静止画像、ビットストリームの音のデータ、フルカラーの高解像度静止画像と増えてきました。この頃一番データ量が多いのはSD(Standard Definition)の動画で、もうすぐHD(High Definition)の動画が増えようとしています。

 これらのデータは、保存環境の不備による高温高湿度、凍結、何度も繰り返した引っ越しによる輸送の影響、震災による激しい振動、震災後の粉塵や電源の不安定などを乗り越えてきました。

 上記に上げたような問題を乗り越えさせれなかったデータもたくさんあります。データが毀損すればああしておけば良かったこうしておけば良かったなどと少なからず後悔します。個人のバックアップを考えるとき、もし毀損した時にどのくらいまで保護に手間をかけた結果であれば、「あれ以上手間をかけられなかったのだから仕方ない」と、あきらめられるかというのが分かれ目ではないかと思います。このため、手間と効果のバランスになるためデータ量の増減や効率の良いバックアップ方法の一般化などで基準は変わっていくのだとは思いますが、ある程度の指針はあると思います。

どこまで備えるか?

(1)HDDの故障に備える

 「(A)ハードウエアの故障による毀損」の中の「(あ)記憶媒体の劣化・故障、その中でもHDDの故障は、目につきやすいトラブルです。これに備えるのであれば、1番直接的な解決策はRAID等により冗長化することです。RAID1以上の冗長化、特に直接的な方法はミラーリングをすることです。これであれば最低2台のHDDでミラーリングを構成できあます。HDDは寿命部品ではありますが、信頼度の高い部品でもあり、偶発故障期間では2台同時に故障する確率はかなり低くなりますので目的を達成できます。

 しかし、副作用も存在します。

 特に平均メンテナンス間隔が縮むという事はメンテナンス忘れによるトラブルが増えると言うことでもあります。せっかくミラーリングしていても、1台目の故障に気がつかず2台目が故障して停止してから気がつくという情けない話はよく聞く話です。サーバ用途ではスペアHDDを設定してこの問題を緩和します。個人のメインで使うパソコンの場合、スペアディスクをまで設定して運用する事は多くはないようです。(メリットを知って設定する人も少なからず居られる)

 この傾向は、RAID5やRAID0+1を構成してHDDの数を増やすと顕著になっていきます。また、HDDは高度な工業製品で非常にばらつきが少なく作られているために、同じ環境に置かれて同じように使われた結果、同じように寿命を迎える(磨耗故障期に入る)こととなり、似たような時期に故障してしまうことも増えます。

 StorageMojoのEverything You Know About Disks Is Wrong(あなたがディスクについて知っている全ては、間違っている)によると、RAID 5 の同一ドクラスタの2つのドライブが1時間以内に同時に異常を報告する実際の確率は、単独ディスクの故障率から推定される2台の故障確率より4倍大きいとの趣旨の記述があります。

 私も経験上この傾向に同意できます。ファンが故障し警報に気がつかず熱がこもっていたなどの場合を除いても、RAID1やRAID5を構成していたHDDが1日から3日の間に2台故障する経験を17年ほどの間に2度ほど経験しています。このうち1度は再構築中に起きています。もう1台は再構築完了後半日以内に故障しました。同時に多数のHDDを管理していた時期があるとはいえ高確率な同時故障経験です。RAIDを組んでいると単独で故障するほうが珍しいような気分を味わってきました。

 どうも、長期間使って弱ってきているHDDが再構築の全面アクセスでとどめを刺されているように思えてなりません。再構築中に故障が起きるとデータが毀損します。RAID1の場合、RAID1を解除して単体ディスクに戻すと一部のデータだけでも助ける事が出来る場合がありますが、RAID5の様な場合クラスタ全体が毀損します。このような傾向があるため、日々のメンテナンスが手薄になりやすい個人の場合、多ディスクで再構築に時間がかかるRAID5は個人で扱うのにはあまり勧められないと感じています。これを避けるために、RAID5のクラスタ2つでRAID1を組んだりRAID0+1で避ける工夫もしましたが、これはさらに多ディスク化するためメンテナンス間隔が縮んでいきます。ディスク数の増加を抑えて安全性を高めたRAID6が市場に出だした時には非常に感心した物です。

 冗長化した場合、監視方法の効率化にも気をつけないとメンテナンス間隔が縮んだ分だけ損と言うことになります。工夫の一つとしてスペアディスクの設定して自動で修復が走るようにして安全性が劣化した状態が少なくなるようにしたいと感じます。この場合さらに多ディスク化することになります。このように多ディスク化した場合、同時に故障しにくいように半年や1年経った後に冗長化ディスクの一部を交換してしまうような工夫も必要になってきます。

 これらを考えて自分の納得できるレベルのHDDの故障に備えを行うことになります。結局、個人の場合、単純に2つのディスクでミラーリングするのが一番素直なような気がします。

(2)人の間違いに備える

 HDDの故障以上に発生しやすいのは「(B)ソフトウエア的な原因による毀損」の「(い)人間の過失に基づく操作によるもの」です。

 削除してしまう事については、ゴミ箱から取り戻す機能などOSの機能として取り戻す事が出来ることも一般的になってきましたが、間違って同じ名前で保存してしまうとか、変更して別のファイルを作ろうとしていたのに名前を変え忘れて保存してしまうなど上書きしたものは取り戻すことが出来ません。

 大型計算機やVAXの時代は、備え付けのエディタを使っていれば、そのようなことをしてもLOGを再生すれば任意のキー操作の位置を取り戻すことが出来る機能がありましたが、パソコンのアプリケーションの機能はこれに比べると制限の多い物になっています。

 この場合、RAID等による備えは間違えた結果を冗長化してしまうので役立ちません。間違いを犯した事を気づくまでの期間があるので直近の物が役立つとは限らず世代保存も必要になります。

(3)異常な動作に備える

 「(B)ソフトウエア的な原因による毀損」の「(う)OSの異常動作によるもの」や「(え)アプリケーションの異常動作によるもの」、「(お)コンピュータウイルス等による改変や破壊などソフトウエアの異常」ばかりでなく、「(A)ハードウエアの故障による毀損」全般による異常書き込みは、取り返しのつかない結果をもたらすことが多くなります。このため遭遇することは少なくとも備えたい事柄の一つです。

 異常書き込みからの保護を対象とすると、オフラインに出来る記憶媒体を使う必要があります。常に接続されている記憶媒体の場合、異常動作で書き込まれてしまう恐れがあるからです。

 また、バックアップが実際に行われている最中に異常動作が起きてバックアップされた内容が壊れていることがあり得ます。バックアップ中にバックアップ元が故障すると、バックアップ元はなくなって、バックアップ先は中途半端な物になりこれも失われます。このため、ひとつの記憶媒体では、情報が完全に毀損して無くなってしまう可能性があります。

 このバックアップ中のトラブルは連続運転機器が増えると良く経験する事柄のようです。バックアップ動作は記憶媒体を酷使することが多いので、長期に使われた機器の故障に至る最後の引き金を引くこになると言うのが一つにはあるようです。もう一つは、電源系のトラブルに巻き込まれることが多くなるという事が多くなることがあります。バックアップ中は激しくファイルシステムにアクセスしているので、その時に電源系のトラブルが発生すると致命傷になりやすくなります。電源系のトラブルには以下のような物が上げられます。

 このような問題があるので、オフラインに出来る記憶媒体を複数用意してせめて2世代管理する必要があります。

(4)バックアップの劣化に備える

 バックアップ先に要求される特性については「記憶媒体に要求されること」に書くこととして、ここでは、バックアップの劣化に備えることについて書くことにします。

 記憶媒体の中でもHDDについては「(1)HDDの故障に備える」で少し記述していますが、HDDは記憶媒体の中ではかなり特別な位置になると考えます。通常の記憶媒体は読み書きする機構と記憶を行う物が分離していて取り替えられる物が多いと思います。世代保存するためには、オフラインで保存するHDDも含めて、通常の記憶媒体の劣化を考える必要があります。

 記憶媒体は、時間と共に劣化します。HDD系の場合、記憶媒体を取り外すことが出来ない代わりに管理されな環境に守られており、周辺環境の影響による劣化の主なものは外の環境に近い駆動系や信号増幅処理系になります。

 一方、光磁気ディスクやCD-R系、DVD-RやDVD-RW等は、直接外部環境にさらされており、光、湿気、汚れ、傷、物理的な力など、様々な物に耐えなければなりません。光磁気ディスクやシェル付きのDVD-RAMはかなり有利ですが、あまりメジャー地位を占められなくなってきています。特に保存場所を取るので、蓄積する物としてはかなり不利になりつつあります。ただ、HDDに比べると記録後の長期保存について、一定の評価が行われており、正しく媒体を選べば十分満足できる保存期間が確保できるグループでもあります。

 さらにテープなど接触する媒体は、読み書きそのものでの劣化があり、読み書きで汚れなどが発生します。その代わりに、光に直接影響を受けることは少なく、物理的な力についても、今、個人の周辺で見かける事の無くなったオープンリールテープをのぞけばカートリッジテープがほとんどでディスクにカートリッジを持たないCD-R系やDVD-RやDVD-RWに比べるとかなり有利になります。高い記録密度を有する物が多いのも特徴です。このため保存場所の確保の点でもかなり有利になります。別の特徴としてベースになる樹脂や記憶の主体が異なるので劣化を引き起こす要因が光ディスク等と異なる傾向が有るようです。この異なる傾向の中に界面活性剤などにまつわる劣化や、場合によってはカビなど他の媒体にはないあまりない好ましくない問題も含んでいます。

 このようにHDD、光磁気ディスクを含む光ディスク類、カートリッジテープ類は三者三様に特徴と別の劣化モードを持ちます。

 さてここで、日々のバックアップだけでなく、世代保存や、ライブラリとして保存されるオフラインの記憶媒体のバックアップを考えます。この場合、必要となるまでドライブに取り付けられて読み書きされるまで、劣化したかどうかが分かりません。業務や研究室の重要なデータの場合、定期的にベリファイや移し替えが行われますが、個人の場合このような手間をかけるのは極まれと思われますので、使うときまで劣化に気がつかないことがほとんどだと思います。

 長期保存の際、同じ保存場所に同じように取り扱って保存すると同じように劣化してしまいますので、同じ媒体に複数のバックアップをとっても、少し劣化が早い遅いが有っても結局、似た様な時期に劣化してしまいます。保管場所の観点からもかなり不利です。ここまで心配するのならば、別の記憶媒体に保存するというのが良い手段と言うことになります。ただそこまで思い詰めるようなデータかと言うことは、自身に良く問うてみる必要があるように思います。

 この時個人の取る方法は以下の4つであると考えます。

 バックアップの劣化に備えるような場合、多くの場合、記録媒体の劣化を時々調べる虫干しのような作業が必要になります。そこまでするのか?と言うような気もします。この手間が少なければ十分価値があるので、普段使いのHDDとバックアップにMOと言うような組による備えや、MOとまで行かずとも、HDDとDVD-RAMの組のように、普段に使いやすい記憶媒体と長期保存に一定の評価がある媒体との組はオリジナルのデータが多いような方におすすめできる方法だと思います。

 なお、個人であっても、継続的に長期にわたって観測したデータの類は、それだけで価値を持つことがい多いので、そのようなデータをお持ちの方はデータの性格を振り返ってみて負担の少ない保管方法を検討なさると良いことが多いように思います。

(5)災害に備える

 災害に備えるには、離れた場所への保存が必要です。どのくらい遠隔地に保存できるかで、どこまでの災害に耐えられるかが変わります。

 遭遇しやすい災害としては「浸水」だと思います。浸水の原因は豪雨による物ばかりでありません。マンションなどでは上層階の水周りのトラブルによる浸水や消火活動に巻き込まれての浸水もあります。もっと単純には自身が水を誤ってぶちまけてしまって浸水すると言うこともありえます。コーヒーなどの飲み物をこぼすなどというのはよく聞く話です。

 これに対しては、防水性の容器に記録媒体に保存するということで防げます。比較的簡単に対策できますが、これに備えると考えない限りなかなか実施されないことでもあります。

 震災による建物の崩壊それに続く火災と津波という極端な事態まで考えると、かなりの遠隔地での保管しか考えられなくなります。このためインターネット経由で送るか、テープやディスクなどの記憶媒体に保管してこれを送るかの手段を取ることになります。これにはデータサイズの制限や手間やコストが結構かかることになります。

 個人的にあり得る方法としては、遠隔地に帰省先がある場合に実家の倉庫や倉などに置かせてもらのが一つあります。たとえば、お子さんの成長記録等は、おじいさんおばあさんに孫の様子といって送れば多くの場合大切に保管してもらえます。この場合、遠隔地のデータ保管としてはかなり理想的な手段になります。もう一つは遠隔地に同好の士がいる場合にお互いにデータを交換して保管するぐらいではないでしょうか。完全復旧を考えなければ公開されているWebデータの場合Googleのキャッシュをバックアップとして使う変則的な手も考えれます。

 震災経験者としては、あのようなとんでもない状況でも、決して失いたくないデータ類が私にあるかと考えると、首をかしげざるを得ません。しかし、そのようなデータを持っていた人がいたことも確かです。これに備えるかどうかはかなり人によると考えます。

 建物が流されるほどの土石流や地滑り、土砂崩への備えについても遠隔地の距離が違う程度で似た備えが必要になります。

 これが単独の火災などに備えることになると、随分手間とコストが軽減されます。遠隔地とは行っても別棟の建屋程度で済むことが多くなり、ぼや程度の備えであればデータメディアセーフボックスやデータメディア耐火金庫という初期投資だけで済む選択肢も出てくるようになります。

 個人の場合、勤め先や学校のロッカー、部室などに置かせてもらえばかなりの部分に備えることが出来ます。この場合、個人情報が拡散しやすくなりますので内容よっては暗号化等の別の安全確保も必要になります。

 私としては、勤め先に一部を持っていくことと防水性の容器に収めることを考える程度です。あなたが納得できる備えはどこまででしょうか。

記憶媒体に要求されること

要求の整理

 記憶媒体に要求される特性は、オンライン用途とオフライン用途で大別できます。

オンラインに近い状態で使うバックアップ先

 オンラインに近い状態で使うバックアップ先は異常が検出されやすいので劣化に関して許容性が大きくとれます。このため、高速性や容量に主力をおいて考えられます。たとえば、外付けの HDD に毎日のバックアップを行う場合、異常があれば短い期間で検出されますのでその手軽さと速さにおいて良い手段となりえます。

 このようにバックアップ先の異常が検出されやすい環境であれば、バックアップ元とバックアップ先が同時に故障する確率と、復旧作業中にバックアップ先が壊れる確率が十分低ければ実用に耐えます。容量を稼ぐために単純に2つ程度のHDDで構成されたRAID0のドライブやコンバインされたディスクをバックアップ先に選んでも十分であると考えます。特に、日々のバックアップ容量の増加に負けてバックアップしていないなどの状況に比べれば、RAID0やコンバインで故障率が増加している状態のドライブにバックアップしても十分役立つと思います。しかし、これは普段からバックアップに使って異常が検出できるという状況に限ります。

オフラインに近い状態で使うバックアップ先

 世代保存のためや離れた場所に保存するために、オフラインで保存されるバックアップ先は、劣化したことが検出しにくいので記憶媒体の劣化に対して厳しく考えることになります。この用途では、RAID0やコンバインしたドライブでなくともHDDのような複雑な物は故障しやすいので選択肢として選びたくない私は考えます。現状他の記憶媒体と比べると圧倒的な容量差と転送速度差があるので、リムバブルケースに入れたHDDにシステムごと一時保存してクラッシュ時に元に戻すような用途を否定するものではありません。しかし、世代保存など長期の保存されたものが有効に使えることが必要な用途では、製造時の包装から封を解かれて記録した後に、停止状態で通常の開放された雰囲気中に長期にわたりさらされたHDDは信用しにくいように思います。垂直記憶になって状況は変化しているかもしれませんが、そのような用途に特に設計されたものが入手できる場合を除いて、難しい選択であると考えます。

光磁気ディスク

 オフライン用途では、ドライブとしての機能が分離されて、純粋な記録媒体として扱われる、光磁気ディスクや光ディスク、テープなどがかなり有力であると感じます。特に光磁気ディスクは原理的にも実績的にも信頼性が高いと目され(ウィキペディア光磁気ディスクMOの耐久性)、このような用途で最強であると考えます。光磁気ディスクは厚みのある小径ディスクであるが故の丈夫さや磁気と光両方がそろわないとデータが揺らぎにくい特性、記録層が外面から遠く外因に影響されにくいなど、丈夫で書き換えに強い媒体の割に、書き換えた後、長期保存することも出来ます。特に長期保存に関しては、MOフォーラムにあるように50年はほぼ確実の寿命は魅力的です。しかし、容量の少なさはいかんともしがたく、他の用途的では地味な存在で手近な物でなくなっていることが残念です。印刷やデザイン関係で標準の地位を確保して入るようですが、このような状況ではドライブの入手性に少し不安があります。

DVD-RAM

 次に DVD-RAM が有力だと思います。国産ブランドのDVD-RAMディスクを使う場合、記録後のディスクを静かに保管する限りに於いては安定して100年を超える寿命があると推測されています。しかしながら、光磁気ディスク系に比べるとディスクそのものが相当に薄いなど機械的にヤワな所があり、シェルを使わずに扱ってディスクだけで保存するような場合特に注意が必要であります。しかし、スーパーマルチドライブ等、DVD-RAMが取り扱える光ディスクドライブはメジャーであり、生産量も多く多く安価です。メディア自身の入手性も良く、この手軽さは魅力的です。

 DVD-Rの方が寿命が長いという意見もあります。「AllAboutの上手に保管して、長持ちさせよう! CDやDVDにも寿命がある?!」によると、米国標準技術研究所(NIST)はDVD-RAM/RWは、温度に敏感な素材を使っているので長期保存に向かないとしているとのことです。

 もう一度、先ほど引用した高信頼(長寿命・高セキュリティ)光ディスク媒体の活用システムの開発に関するフィージビリティスタディ報 告 書− 要 旨 −の4.8 アレニウス法による寿命推定結果4.8.1 DVD-Rを確認すると、加速度試験で劣化が認められないため寿命が推定できなくなるほど強い物があるのが分かります。ところが国産ブランドに限ってみても、15年程度の寿命と推定される物もあり、ディスクの選定で大きく異なることになると言うことも見て取れます。

 これに対して、4.8.3 DVD-RAMの結果によると、国産ブランドに限れば、100年から数100年で安定しており安心して保存に使えます。つまり、DVD-Rの方が長寿命の物があるので、それが選択的に使えれば(購入し続けることが出来れば)保存に向くことになるが、ばらつきが大きいことを考えるとそうはうまくいきそうにないように思います。よってDVD−RAMは安定的に十分な寿命になるため使い続けることを考えるとこちらの方が優位であると考えます。

 なお、DVD-RWはブランド間ばらつきが大きい傾向が見て取れるので、DVD-Rと同じような結論になると考えます。

フラッシュ系の記憶媒体はどうか?

 この頃は、フラッシュメモリ系の記憶媒体も容量が増えて安価になっているので、バックアップ媒体として候補に挙がることがあります。この媒体は、フローティングゲートに電荷を蓄えたり引き抜いたりして状態を変え記憶を行います。電荷の状態による記憶はDRAMと同じで主記憶としては一般的ですが、補助記憶とし一般化したのはこの媒体が初めてではないかと思います。

 このため、この媒体、副記憶としての長期保存特性に関してほとんど資料がありません。記録保持時間はフラッシュメモリのフローティングゲートから電荷が正しい値を保つ時間に依存します。この頃の高容量のフラッシュディスクはこの電荷が小さくなっており、様々な影響を受けやすくなってきています。特に、大容量化のために1つのフローティングゲートの記憶状態を多値化してメモリの1セルの保持ビット数を多値化した、マルチレベルセルの場合どのような保持特性になるについて参考になる資料がほとんどありません。

 このため、現時点ではオフライン用途で用いるバックアップ用の媒体としてはかなり不安に思います。これも、通常の1ヶ月程度の世代保存に供すだけであれば、気分だけの問題ともいえます。

 オンラインで用い書き込みが主力となるバックアップ用の記憶媒体としては書き換え速度が遅く書き換え回数の少ないところに不安がりますが、十分な物もありの有り、記憶容量とその低消費電力性は魅力です。ノートパソコンのバックアップ用など低消費電力が生きる用途では十分考え得る記憶媒体になってきています。

磁気テープ

 本質的には安定な傾向の記憶媒体を選びたいと思います。しかし、そう言う物は通常重視される性能に劣ることが多く、扱える機器がどの程度市場に生き残ってくれるかも重要な要素です。個人の場合、バックアップ用途に選択した記憶媒体を再生できる装置が市場に豊富に生き残ってくれてないと保存できても実際にデータを読み出すことが出来ないという事態に陥ります。または、頻繁に記憶媒体の移し替えが発生することになります。

 現在生き残っているテープ媒体の場合、オフラインバックアップの用途がほとんどのため、それに関連する特性で性能が評価されます。よって、オフラインバックアップ用途で優れた物が残っていくので、良い物を選べば長期にわたって読み書きできることが期待できます。また、記憶媒体の記憶容量あたりの価格が安いので本数の増えやすい世代保存する用途では有難い特性になっています。

 しかし、光ディスクなどのドライブに比べると極端に生産量が少ないので、そのドライブの価格は高くなりやすくなります。現在(2007/11/03 Sat)個人用途に一番近いDDS-4ドライブは、9万円程度の価格です。この価格は普通に使えるパソコンが買える価格でなかなか個人では導入しにくい価格です。

 これに対して、DDS4カートリッジの価格は10巻程度をまとめ買いすれば1本あたり1200円程度で、1GBあたり60円弱となり、DVD-Rよりは高くなりますが国内産の5倍速のDVD-RAMよりは安くなります。dumpを使ってバックアップした場合の速度はDDS-4でバックアップした方が速く、容量あたりの保存場所もDDS-4の1巻でDVD-RAM片面タイプ5枚程度なりメディア掛け替えの手間も少なく、保存場所のことを考えると優位です。

 結局の所、初期投資が大きいほど安価で楽にに保存でき方法が採れます。どの程度の期間、どの程度のデータを残しておきたいかで、メディアに要求する水準が決まると思います。


目次に戻る おじさんの工夫へ戻る トップへ戻る

バックアップの方法

方式と頻度

2つの方向性

 バックアップ方法は、「(A)ハードウエアの故障による毀損に対する備え」と、「(B)ソフトウエア的な原因による毀損」や「(C)環境条件による毀損(災害を含む)に対する備え」では逆の方向性を持ちます。

 前者では、故障の影響の無い出来るだけ直近のデータが保存される必要があります。故障の影響でデータを失われないために、数世代の保存も必要ですが、この用途では古い物はあまり価値がありません。

 後者は、期間が離れた過去のデータが重要になります。世代保存も出来る限り多く有った方がバックアップとして有効になります。これは正しいデータを生き残らす確率を増やす意味の他に、毀損の拡大を確認して失敗を後で明らかにする意味でも必要になります。

ハードウエアの故障による毀損への備え

 今まででも書いてきているように、このためだけで、処理能力の向上に欲を出さないのであれば、RAID1が簡単で効果的です。RAID1の場合、インターフェイスは1つで2つのディスクで分けるミラーリングと、インターフェイスも分けるデュープレキシングが有ります。

 ミラーリングの場合、故障したHDDがインターフェイスに影響を出すような故障の仕方をすると、冗長性が生かせず機能停止に落ちっいてしまいます。この頃のSATA環境の場合、内蔵ディスクはマルチプライヤで分けることの方が少ないように思いますので、自然にデュープレキシングに近い物となっていますのでこの心配が少なくなっています。

 デュープレキシングでほとんどの用途で十分な安全性が確保されます。しかし、スリムタワーやノートパソコンなどこのような対策をとれない機器の為に、ソフトウエアによるバックアップが有効です。これを実施しておけば異常が検出されないタイプの故障等にも備えられます。

 毎回フルバックアップを取っていたのでは、時間がかかって実用的ではありません。また、時間ががかるのでバックアップ中に更新されてしまってハードウエアの故障に備える意味では問題があります。更新した物だけバックアップされればより手軽で安全になります。

 要件を上げると以下のようになります。

 要件を満たす個人で利用できそうな物には以下のような物があります。以下の中で同期ソフトは、そのままではブートできないことが多いのでディスクイメージを作成できるソフトと併用するのが普通のように思います。

 Windowsのブリーフケースなどもこの用途に使えそうですが、設定してあるディスクのインターフェイスのドライバの入れ替えなどで障害になるような事が見受けられたので、私はバックアップ用途では使っていません。

 これらのソフトを使って、まずフルバックアップを取った後に、差分や増分バックアップを最低でも週に一度、通常は毎日バックアップしていきます。増加したり更新したりする量の多い人はその頻度の高い時間帯に合わせて、午前と午後とか、さらに夜間や早朝のバックアップを追加する等を考えます。この頻度でバックアップしていれば、ハードウエアの障害でデータを失った時も大きなダメージを受けずに済むように思います。

 自動的に高頻度でバックアップしたいので、その速度と動作時の負荷の軽さを重視せざるを得ません。このためこのてのバックアップ先にはHDDを選ぶか、その他の記録媒体を選ぶ場合はバックアップ対象を絞るかすることになります。

 HDDでバックアップする場合でも、速度や負荷を考えるとUSB等で接続された外付けHDDよりはSATAで接続される物がよいことになります。GbitEtherで接続されたHDDにバックアップする場合もあるので、バックアップ中の負荷が影響を与えないように転送速度制限や優先度の変更が出来る方がよいことになります。

 バックアップ対象を絞る場合は、バックアップ忘れの無いよう対象が簡単に指定できて一括して自動でバックアップできることが重要になります。

 このような備えで毀損に備えることが出来ます。ハードウエアの故障による毀損への備えとしては、通常これで十分です。

 しかし、この上を考えたいときもあります。上記対策では、ハードウエアの異常動作時に異常なデータを書き込んでしまうような障害への備えとしては十分ではありません。これに備えるためには、ソフトウエア的原因や環境条件による毀損への備えと同じようなことをする必要があります。

ソフトウエア的な原因や環境条件による毀損への備え

 プログラムやデータの毀損の原因の一番多い物は、「(い)人間の過失に基づく操作によるもの」です。結局、人の間違が一番多いので、これに対する備えが第1番目に必要です。

 人の間違いを含めて、「ソフトウエア的な原因や環境条件による毀損への備え」の場合、異常に気づくまでの時間が必要なのでその時間を確保するだけの古いバックアップがが必要です。また、なるべく最新の情報も欲しいので新しいバックアップも必要です。この二つを成り立たせるため、複数世代のバックアップの保存が必須になります。

 また、間違いや故意による毀損への耐性を向上させる意味でも、普段接続されていないオフラインの記憶媒体へのバックアップが望ましいと思います。この頃、Virusやその他悪性ソフトのリスクも高まっているのでその意味でもオフラインのメディアへのバックアップは重要です。

 まずは、バックアップを複数世代取ることが重要ですので、そちらを優先した考えることにします。これには、容量の大きなHDDやオフラインにもしうる容量の大きな記憶媒体を普段から接続した状態にして、複数世代を、フルバックアップと差分と増分を組み合わせてバックアップするのが間違いが少なく手軽です。

 この場合、容量が優先されますので、RAID0やコンバインをかけたHDDを使うことも多くなります。これには条件があります。それは、普段高頻度で使い、故障に気がつきやすい用にしておかなければならないと言うことです。そのために、フルバックアップをかけた後、差分、増分を毎日、最低限、週に1回は使うようにする必要があります。これは、「ハードウエアの故障による毀損への備え」と同じです。

 バックアップ用途で人の間違いを復旧するには1〜2ヶ月の世代は欲しいところです。半年程度の世代を保存できれば通常は十分です。容量と時間が十分にあればフルバックアップで保存していけば非常に簡単ですが、これが成り立つほど個人が蓄えているデータの量は少なくありません。無理にこの方針をとると、手間が重荷でバックアップそのものの頻度を下げてしまいかねません。通常考えられるのは差分バックアップと増分バックアップを使った方法です。

 差分はフルバックアップから更新されたり増えた物をバックアップする物です。増分バックアップは前回のバックアップから更新されたり増えたりした物をバックアップする物です。

 単純な物は、差分バックアップを繰り返す物です

 Nを自身の更新頻度に応じてきめてサイクルを回すことになります。差分バックアップを毎日行い、フルバックアップを月に1回とすると1ヶ月の世代保存が出来ることになります。差分の場合フルバックアップと1つの世代の差分1つが有れば復旧できます。このため管理が簡単でNを増やしやすい方法になります。

 問題になるのは保存容量で6ヶ月の世代保存を行おうとすると、Nが180強となりかなりの容量が必要になります。特に、大型プリケーションをインストールした後の差分の保存は困難になることが予想されます。このため、差分バックアップ頻度を1週間程度に落としてフルバックアップを半年(26週)に1回程度に落とすのが限界ではないかと考えます。

 容量を減らすためには増分バックアップを利用するのが有効です。

 増分バックアップは容量面から考えると一番有利になります。しかし、以前のバックアップが全てそろわないと復旧できません。このため、全て同じHDDに保存するような場合などバックアップが散逸しにくい方法であれば有効です。散逸しにくい環境を確保している限りに於いては1回のバックアップが小さくなるのでNを増やすことが出来ます。

 フルバックアップを毎月取って毎日増分バックアップを取れば1ヶ月の毎日の履歴が残ります。フルバックアップを6世代残せば1ヶ月以内は毎日のバックアップが、それ以上の過去については1ヶ月ごとに復旧できる形になります。

 差分バックアップで記述したのと同じように増分バックアップを1週間に1回程度にすれば1年(52週)に1回フルバックアップも可能のように思います。

 バックアップ方補を組み合わせるとバックアップ頻度とバックアップ世代の両方を増やしやすくなります。

 特に古い世代のバックアップは、通常あまり高頻度で要らないとが多い言うところを利用するとバックアップ量を大幅に削減できます。

 フルバックアップを半年に1回、増分バックアップを毎月、差分バックアップを毎日行う方法が典型例になると思います。増分バックアップは6世代、差分バックアップは約28〜31世代保存されることになります。保存容量に余裕がない場合は、変形として、増分バックアップは毎週(26世代)、差分バックアップを毎日(7世代)として、保存する方法もあります。この場合増分バックアップを取った日も差分バックアップを時間をずらして取ります。このような方法を使えば比較的少ない容量で高頻度・長期間の保存が出来ます。

 現実的にはこのようなサイクルが一般的になるのではないでしょうか。

 これで、約2ヶ月強で一回りしますので、フルバックアップを3世代保存すれば6ヶ月になります。復旧の時のことを考えると、もう少し短い間隔でフルバックアップして、関連するバックアップを減らした方がよい場合も多いと思います。

 これがBSD系等のバックアップツールであるdumpの場合、もっと効率的にバックアップできます。dumpはバックアップ時に0から9までの10レベルを指定します。0が一番上位で、必ずフルバックアップになります。1以上のバックアップ時は、同じレベルを指定すると1つ上位のレベルのバックアップからの差分になり、1つずつ番号を増やしていくと、増分バックアップになります。

 このレベルをうまく使うと修正ハノイの塔シーケンスと言われる方法などでもっと効率の良いバックアップが出来ます。以下のようなレベルでバックアップしていきます。レベル1は2世代保存します。このシーケンスで毎日バックアップすると1ヶ月弱が保存されます。レベル0バックアップを上書きせずに6世代保存すれば半年分のバックアップが確保できます。

 この方法はdumpを扱うとき基礎的な事項としてマニュアル他に良く記述されている事柄です。詳しくはそちらの記述に譲ります。

 このように複雑にしていけば効率が上がりますがバックアップ・リストア時の取り扱いミスが増えます。自動化を考えなければうまくいかないと思います。容量の大きなHDDに1セット全てバックアップするようなときは、自動化しやすいのですが、これが許されない状況があります。

 以下のようなのような要因による毀損にも備える場合、オフラインできる記憶媒体にバックアップする必要が出てきます。

 この場合、記憶媒体の差し替えが必要になるので、自動化での障害になります。テープなどの場合オートチェンジャが有りますがこれは非常に高価です。DVDなどの場合はもっと希少でほとんど個人では手に入りません。

 個人の場合、手動で記憶媒体を交換することになるので、あまり複雑な事をすることは出来ません。普通は差分バックアップをかけて程度が普通で、差分と増分バックアップの組み合わせまでが限界ではないでしょうか。

記憶媒体の選択

ハードウエアの故障による毀損への備え用

 自動化のしやすさ、バックアップ時間、容量あたりの価格を考えると、HDD以外がほとんど考えられません。これは今まで記述してきた通りです。通常この用途の場合、普段から使っていますので、いつの間にか壊れているという事はほとんど有りません。このためRAID0やコンバインして容量拡張した外付HDDやNAS(Network Attached Storage)も候補にはいります。

 容量が少ない場合は、DVD類を候補にすることが出来ます。このほかには、フラッシュディスクの類(USBスティックやSDカード等)は書き換え回数に若干不安がありますが、ノートパソコン用等の場合候補になります。

ソフトウエア的な原因や環境条件による毀損への備え用

 オフラインでの特性を重視するので、DVD-RAMへのバックアップが多くの要求を満たすと考えます。DVD−RAMは容量面で不満がありますので、BD-RE(Blu-ray Disc Rewritable)は実績が出来てくれば良いバックアップメディアになると考えます。

 MO(光磁気ディスク)は、特性の面では申し分ないのですが、容量の大きなGIGAMOはメディアの入手が難しくなってきており、安心して使えるのは640MB系になるためバックアップする物を絞ってバックアップする用途になります。特に威力を発揮するのは、災害などに備えるために遠隔地に保存するために宅急便やバイク便で送ったりする輸送を考えると、その物理的な強靱さが生きます。個人の場合、テープが使いにくいので、このような場合MOが頼みの綱になるところがあります。

 遠隔地への輸送で大きな容量が必要な場合や、大容量のたくさんの世代のバックアップを考えるような貴重なデータを対象とする場合は、個人といえどもテープを考えざるを得ません。この場合、DDS4(DAT40)かDAT72がまず候補に挙がると思います。(業務用途でテープを考える場合は最初からDLTかLTOを考えた方がよいように思います。)また、ここまで貴重なデータをお持ちの場合は、特に厳選したデータを全く保存特性の異なるMOなどでバックアップすることも考慮に入れるべきのような気がします。


目次に戻る おじさんの工夫へ戻る トップへ戻る

まとめ

 繰り返しになりますが結論をまとめると、以下のようになります。RAID1等を組むことと別の記憶媒体に同じものを取っておく通常のバックアップは互いに補い合う関係で、下記1と2は両方行うのが望ましいと思います。

  1. 消費電力や場所に余裕があるデスクトップの場合、HDDの故障に備えての通常の備えとしてRAID1を組むのが良いと考えます。
  2. 次に、誤操作による上書きや消去、悪性プログラムによる障害、ソフトウエアの暴走などに備えてバックアップ用に用意したHDDに日常的に2世代以上のバックアップを用意するのが良いと考えます。
  3. ノートパソコンなど電力的制限や場所の制約が多い機器も、上記の要因に加えて、故障や紛失、盗難に備える意味でもバックアップ用に用意した外部のHDDに日常的に2世代以上のバックアップを用意するのが良いと考えます。
  4. 自身で作成した取り返しのつかないオリジナルなデータは、DVD-RAMなどの長期保管特性について一定の評価が得られている単純な媒体に保管するの良いと考えます。
  5. 厳選したデータを火災、水害、震災などに備えて、時々地理的に離れた学校や勤め先のロッカー、友人宅、帰省先などに保管しておく事も考慮の一つではないかと思います。
  6. 厳選しても災害時に毀損が許されない貴重なデータが多いような場合は、個人でもテープを考えざるを得ないと思います。また、そこまで貴重な物が多い場合、特に貴重な物を選んで異なる保存特性を持つMOへのバックアップなどへのバックアップを考えて2重化すべきです。
  7.  「バックアップディスクにコンバインやストライド構成はダメか?」についてですが、異常が起こったことが検出できる日々のバックアップ用のバックアップ先としては十分有用ですが、オフラインの世代保存用などには向かないと考えます。

目次に戻る おじさんの工夫へ戻る トップへ戻る

参考文献


おじさんの工夫へ戻る
トップへ戻る