「SSD」と「HDD」はどちらが故障しやすいのか?:Backblazeが自社データセンターの機器で検証
クラウドストレージを手掛けるBackblazeは、自社データセンターで使ってきたSSDとHDDの故障率の比較結果を報告した。単純な比較ではSSDの故障率が6分の1以下になったが、よく調べてみるとこれとは異なる結果が出た。
Backblazeは2021年9月30日(米国時間)、同社のデータセンターで使ってきたSSDとHDDの故障率の比較結果を公式ブログで報告した。同社はクラウドストレージの他、企業や個人向けのクラウドバックアップサービスを提供している。
一般に、SSDの方がHDDよりはるかに故障しにくいといわれる。「この説の根拠はSSDには可動部品がないことだ。ベンダーはこのように主張しているが、曖昧なMTBF(平均故障間隔)の計算に支えられているだけだ」とBackblazeは指摘する。このような主張はSSDのマーケティングという目的にはかなっているが、実態を見る必要があるとの観点から、同社は自社のデータセンターで使ってきたSSDとHDDの故障率を直接比較した。比較結果報告の概要は次の通り(続報:最新のHDD、故障しやすいのか?)。
単純な比較ではSSDの故障率が低いが
Backblazeは自社のデータセンターで、ストレージサーバの起動ドライブとしてSSDとHDDの両方を使っている。これらのドライブは、システムアクセスや診断などのログファイルの保存にも使われている。つまり、サーバを起動させるだけでなく、ファイルの読み書き、削除も行っている。
BackblazeはもともとHDDを起動ドライブとして使っていた。SSDのコスト低下に伴い、2018年半ばから、新規ストレージサーバでは起動ドライブとしてSSDのみを使うようになり、故障したHDDもSSDに置き換えるようになった。
このように、Backblazeのデータセンターでは長期にわたって、SSDとHDDという2つのドライブのグループが、同じ環境で稼働して同じ機能を実行し、同じワークロードを処理してきた。そこでBackblazeはまず、SSDとHDDの故障率を直接比較した。両グループの2021年第2四半期における年間平均故障率(AFR:Annualized Failure Rate)は次の通りだった。ドライブの台数はどちらも約1600台だ。
同じ条件で比較すると故障率の違いは小さくなる
ただし、この比較には、2つの注意点がある。「平均使用期間」(Avg Age)と「正常稼働日数」(Drive Days)について、SSDとHDDには違いがあるからだ。
・SSDの平均使用期間が14.2カ月であるのに対し、HDDの平均使用期間は52.4カ月であり、3倍以上長い
・使用期間が最も「長い」SSDは約33カ月だが、使用期間が最も「短い」HDDはで27カ月だった
平均して、HDDはSSDより3年以上長く使われている。つまりライフサイクルにおいて、SSDとHDDは全く異なる段階にあることになる。ドライブは、古くなると故障しやすくなるため、このままでは妥当な比較にならない。
「正常稼働日数」は、SSDとHDDそれぞれの全てのドライブが、故障せずに稼働した日数を指す。この日数に大きな差があると、信頼区間(統計学的に真の値が含まれると確信できる範囲)が大きく異なることになる。
より正確な比較のためには、平均使用期間と正常稼働日数を調整すればよい。HDDについては2016年第4四半期までのデータを見ることで、2021年第2四半期におけるSSDと、使用期間および正常稼働日数の条件をそろえ、ライフサイクルにおいて同じ段階にあるもの同士で比較できることが分かった。その比較結果を次に示す。
この比較では、SSDとHDDでAFRの違いはそれほど大きくない。実のところ、SSDもHDDも他方の95%信頼区間に収まる。この信頼区間はかなり広く(プラスマイナス0.5%)。正常稼働日数が比較的少ないからだ。
この表から分かるのは、使用期間が短ければ(この場合、約14カ月)、SSDの方が故障頻度は低いものの、HDDとの差はあまり大きくないということだ。
だが、ドライブを14カ月で廃棄するとは限らない。14カ月よりもっと長く使った場合の故障率については、どう考えればよいのだろうか。
長期で見た故障率はどうなのか
HDDについては2013年以降、SSDについては2018年以降のデータがある。そこで、それぞれについて2021年第2四半期までの年間平均故障率の推移を見ると、次のようになる。
HDDの故障率は2018年から、毎年1ポイント以上の上昇を示し、2021年に入って頭打ちになりつつある。
興味深いのは、HDDとSSDのグラフで、最初の4つのデータポイントについてカーブが似ていることだ。SSDも今後、故障率が上昇しそうだが、HDDのように大幅に上昇するかどうかは不明だ。
結局SSDとHDDのどちらを購入すべきなのか
以上のことから、SSDとHDDの購入選択は、どのように行うとよいのだろうか。
故障率を基準に選ぶことには疑問の余地がある。使用期間と正常稼働日数を調整すると、SSDの方がHDDより故障率が低いが、その差は、HDDと比べたSSDのコストの高さを正当化するほど大きくはない。
現時点での比較結果からすると、故障率以外の要素、例えばコストや必要なアクセス速度、消費電力、フォームファクター要件などに基づいて、購入決定を行う方が得策だ。
今後数年を経て、SSDの故障率に関するデータが充実すれば、SSDとHDDの購入選択基準に、AFRを追加すべきかどうかが判断できそうだ。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- 最新のHDD、故障しやすいのか?
クラウドストレージを提供するBackblazeは、自社データセンターで使用中のHDDについて使用年数別に故障率を調査した。2013年の調査結果と最新の結果を比較した結果、故障パターンがかなり変化していることが分かった。 - OneDriveのファイルを「ファイルオンデマンド」に設定してローカルストレージの空き容量を増やす
OneDriveを活用しているといつの間にか、Windows 10上のOneDriveフォルダの容量が増えてしまい、ローカルストレージを圧迫してしまうことがある。このような場合、ファイルを整理するのと同時に、ある程度の期間アクセスしていないファイルを「ファイルオンデマンド」にして、ローカルストレージから削除するとよい。その方法を紹介しよう。 - Windows NASの可用性をいろいろと試したくて――仮想マシンにNAS環境を再現する方法
最近、「Windows Server IoT 2019 for Storage」搭載NASを試用する機会がありました。ディスク障害からの回復性をいろいろと試してみたいのですが、実機で試すにはリスクがありますし、時間もかかります。そこで、仮想マシンに同様の環境を再現して、そちらで試してみることにしました。その詳細を、今回と次回の2回にわたってお伝えします。