Backblazeは自社データセンターにおけるSSDの使用統計レポートを発表した。対象となった2558台のSSDは全て、ストレージサーバの起動ドライブとして使われている。さらにSSDとHDDの寿命についても分かったことがあるという。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
クラウドストレージやクラウドバックアップサービスを提供するBackblazeは2022年9月13日(米国時間)、自社データセンターにおけるSSDの使用統計レポートを発表した。壊れにくいSSDと壊れやすいSSDについてもモデル名を示した。
Backblazeが世界各地のデータセンターで使用する総計2558台のSSD(2022年6月末時点)を扱った。これらのSSDは全て、ストレージサーバの起動ドライブとして使われているものだ。
SSDを起動ドライブとして利用しているだけでなく、ストレージサーバが生成するログファイルや一時ファイルを保存する役割も担っている。ストレージサーバの稼働に応じて、ファイルの読み出し、書き込み、削除を実行するため、SSDの負荷は軽くない。Backblazeのストレージサーバでは、従来HDDを起動ドライブとして使用したが、2018年第4四半期にSSDに置き換えた。起動ドライブを更新する場合にもSSDを利用している。今回のレポートでは2018年第4四半期以降のSSDについて扱っている。
最初に過去2四半期(2022年第1四半期、2022年第2四半期)の四半期データについて、全体的な状況を示す(図1、図2)。
図中の年間平均故障率(AFR:Annualized Failure Rateは、SSDのモデルごとに「(故障台数/(正常稼働日数/365))*100」を計算した数値だ。
図1と図2については次のような前提条件があり、幾つかの発見があった。
フォームファクタは2種類ある
図1と図2に示したSSDは、2モデルを除き全て標準の2.5インチ型だ。Dell Technologiesの「DELLBOSS VD」(480GB)とMicron Technologyの「MTFDDAV240TCB」(240GB)の外観は基板に部品を実装した形の「M.2」フォームファクタだ。
最も多く増設したのはCrucialブランドのSSD
2021年第4四半期以降、Micron TechnologiesのCrucialブランド「CT250MX500SSD1」(250GB)を192台追加し、Dell Technologiesの「DELLBOSS VD」を101台、Western Digitalの「WDS250G2B0A」(250GB)を42台追加した。
新規のモデルを2機種追加した
2022年第2四半期には、Seagate TechnologyのSSDを2機種、新たに追加した。「ZA500CM10003」(500GB)を3台、同じく「ZA250NM1000」(250GB)を18台だ。どちらも故障しなかったものの、寿命についての結論を出すために必要な台数と稼働日数には至っていない。
Crucialモデルの故障率は高くない
Backblazeが以前公開したSSDレポートでは、Crucialブランドの「CT250MX500SSD1」(250GB)の故障率が高いという結論を出したが、非常に限られた量のデータに基づいていた。現在、CrucialのSSDは不具合なく動作しており、第1四半期、第2四半期ともに故障は発生していない。
1回の故障の影響は大きい
1四半期に3台のSSDが1回だけ故障したため、AFRの値が悪くなっている。故障したのはWestern Digitalの「WDS250G2B0A」(250GB、AFRは10.93%)とMicron Technologyの「MTFDDAV240TCB」(240GB、AFRは4.52%)、Seagate Technologyの「SSD」(300GB、AFRは3.81%)だ。この1回の故障がなければ、AFRは0%だった。
AFRの値には適切でないものもある
今回の統計データを扱う際、計算されたAFRを「妥当」と見なすには、最低でも1四半期に100台のSSDと1万台日の稼働実績がなくてはならない。ただし、四半期ごとのデータは変動しやすい傾向にあるため、次に詳細な検討を加える。
2022年第2四半期末現在で稼働している2558台のSSDについて、AFRを計算した(図3)。
図3から分かることは次の通りだ。
生涯故障率から長期的な傾向が分かる
図3にあるAFRは2018年第4四半期から2022年第2四半期までの累積値だ。これを「生涯故障率」(Lifetime AFR)と呼ぶ。SSDには経年劣化があるので、生涯故障率は長期的な傾向を見るために有効だ。後ほど解説するように、SSDとHDDの生涯故障率を経年比較すると、その効果が分かる。
生涯故障率が一時的に低下した
2022年第2四半期のSSD全体の生涯故障率は0.92%だった。2021年末の生涯故障率(1.04%)から低下しているものの、2021年第2四半期の値(0.92%)と全く同じだった。
信頼区間の幅が重要
一般に、データが多ければ多いほど、さらにデータの値が一貫していればいるほど、データに基づく予測がより確実になる。AFRの値だけを見て判断するのではなく、信頼区間(Confidence Interval)の低値と高値の差を確認すべきだ。差が1.0ポイント以下であれば、判断を下すのに妥当な値だといえる。ただし、信頼区間が1.0ポイントより大きい場合、AFRに意味がないということではない。より多くのデータを今後取得して、確認し続ける必要がある。
AFRが悪い場合、信頼区間を確認しよう
図3に挙げたAFRが最も高い3モデルのSSDは、信頼区間の値がかなり大きい(図4)。
逆に、図4で示したように、信頼区間が1.0ポイント以下のモデルも3種類あった。この3モデルは最も壊れにくいSSDだといえる。
図5で取り上げた3モデルのうち、Dell TechnologiesのSSDが最も優れていると、Backblazeは判断した。これは前述の通り、M.2フォームファクタのサーバ向けSSDだ。ただし、Dell Technologiesから購入する場合の価格が2022年9月時点で468.65ドルであるため、(480GBという容量から判断すると)、多くのユーザーが考慮する価格帯から外れているかもしれない。
残りの2つのSSDは、明らかに消費者向けの製品で、一般的なSSDと同じ2.5インチ型だ。Seagate Technologyの「ZA250CM10003」(250GB)は、残念ながら新品では入手できず、再生品のみが販売されている。「ZA250CM10002」(250GB)は、2022年9月現在、Amazon.comでは45ドルで販売されている。
SSDは本当にHDDより信頼できるのか、という問いに答えるだけの1年分のデータが、今回そろった。
比較するSSDとHDDは、いずれも起動ドライブとして使われている。それぞれの利用方法は同じだ。ストレージサーバを起動し、ログファイルを記録する。いずれもS.M.A.R.T.統計情報を記録するための一時的なストレージとしても使われている。
冒頭で紹介した通り、2018年後半までHDDを起動ドライブとして使用しており、その後SSDに切り替えた。このため、2つのコホート(特定の期間、つまり四半期や年間、生涯について選択されたドライブのセットであり通常はモデル別に選ぶ)は、それぞれの寿命曲線の異なる場所にある。
そこで、SSDとHDDを公平に比較するために、2つのコホートの平均年齢を制御し、平均1年経過したSSDと、平均1年経過したHDDを比較した。図6に示したグラフは、2つのコホートの平均年齢を制御済みであり、2021年第2四半期までの結果を示した。
2021年第2四半期(グラフでは4年目)までは、SSDの生涯故障率が若干低いものの、HDDの生涯故障率を経年的に追従している。しかし、5年目以降、SSDの生涯故障率がHDDに追従し続けるのか、フラットになるのか、その中間に位置するのか、これまでは明確にはなっていなかった。
2022年第2四半期までのデータに基づき、5年目のSSDのデータを示した図7を見れば、答えは明らかなようだ。
2022年第2四半期時点で、少なくともBackblazeの環境で起動ドライブとして使用する場合は、SSDの方がHDDよりも信頼性が高いと合理的に主張できる(SSDは生涯故障率が頭打ちになる)。
Backblazeは今後も定期的にSSDのデータを収集、提示し、今回の知見を確認し、次なる展開を明らかにする予定だ。SSDの故障率がいずれ上昇に転じることは、(工業製品として)間違いのないことだ。さらにある時点で、SSDの寿命が尽きるだろう。そこで、今後数カ月間、SSDのS.M.A.R.T.統計情報を監視し、それが故障にどのように関係しているのかを調べる予定だ。
Copyright © ITmedia, Inc. All Rights Reserved.