Backblaze、自社データセンターにおけるSSDの使用統計レポートを発表モデル別に年間平均故障率(AFR)を算出

Backblazeは、自社データセンターにおけるSSDの使用統計レポートを発表した。統計対象のSSDは全て、ストレージサーバの起動ドライブとして使われている。

» 2022年04月20日 14時00分 公開
[@IT]

この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。

 クラウドストレージやクラウドバックアップサービスを提供するBackblazeは2022年3月3日(米国時間)、自社データセンターにおけるドライブ使用統計レポートの初のSSD版を発表した。

 同社はこれまで、HDDに特化した使用統計の年次レポートと四半期レポートを発表してきた。今後はSSD版も年2回発表していく。HDD版は引き続き年4回発表する。

 SSD版使用統計レポートでは、Backblazeが世界各地のデータセンターで使用する総計2200台のSSD(2021年12月末時点)の統計が報告されている。これらは全て、ストレージサーバの起動ドライブとして使われている。

 Backblazeの環境における起動ドライブは、ストレージサーバを起動させるだけでなく、ストレージサーバが生成するログファイルや一時ファイルを保存する役割も果たす。起動ドライブは毎日、ストレージサーバの稼働に応じて、ファイルの読み書き、削除を行っている。

 Backblazeは、以前はストレージサーバの起動ドライブとしてHDDを使っていたが、2018年第4四半期から、全ての新しいストレージサーバの起動ドライブおよび故障したHDD起動ドライブの代替として、SSDを採用している。

SSDの年間平均故障率

 2019年、2020年、2021年のSSDの年間平均故障率(AFR:Annualized Failure Rate)を次の表に示す。

図1:2019年、2020年、2021年におけるBackblazeのSSDの年間平均故障率(AFR)(提供:Backblaze)

 Backblazeはこの表について、次のように説明している。

 Crucial製モデル「CT250MX500SSD1」とSeagate製モデル「ZA2000CM10002」は、2021年のAFRが極めて高い。このCrucial製モデルは、使用台数(Drive Count)が80台と少なく、平均使用期間(Avg Age)も0.4カ月と短いからだ(後に示す表「2021年におけるBackblazeのSSDの年間平均故障率」を参照)。このSeagate製モデルも同様に、使用台数(Drive Count)が4台しかなく、その1台が2021年の早い時期に故障している(図1を参照)。

 どちらの場合も、AFRは非常に少ないデータに基づいており、そのために信頼区間の幅が非常に広い。だが、Backblazeは完全性の観点から、これらのモデルも統計レポートに含めた。

 表中の正常稼働日数(Drive Days)は、各モデルの個々のドライブが正常に稼働した日数の合計を示している。2021年を通じて正常に稼働したドライブは、正常稼働日数(Drive Days)が「365」となる。あるドライブが1年の201日目に故障した場合、そのドライブは正常稼働日数(Drive Days)が「200」となり、ドライブ故障(Drive Failures)にカウントされる。

 年間平均故障率(AFR)は、次のように算出される。

 AFR=(ドライブ故障/(正常稼働日数/365))*100

2021年のSSDの年間平均故障率

 Backblazeは、2021年の統計データを次のように掘り下げて示している。

図2:2021年におけるBackblazeのSSDの年間平均故障率(AFR)(出典:Backblaze)

 Backblazeはこの表について、次のように説明している。

 この表は、前述したように、Crucialの「CT250MX500SSD1」とSeagateの「ZA2000CM10002」については、Backblazeの環境における信頼性に関する判断を下すには、現状よりはるかに多くのデータが必要なことを示している。

 妥当な信頼区間(Confidence Interval)は1.0%未満であり、Backblazeにとって最適な信頼区間は0.6%以下だが、この基準を満たしているのは、Seagateの「ZA250CM10002」のみとなっている。

 ドライブが、期待されるレベルで動作していると確信できる十分なデータを蓄積するには、明らかに時間がかかる。Backblazeは、1〜2%のAFRを期待しており、まだデータが不足しているとはいえ、こうしたモデルのAFRがこれを上回っている場合は、要注意だ。そこでAFRの監視が重要になるが、その方法の一つが次のように、四半期ごとの統計を追跡することだ。

SSDの年間平均故障率の四半期ごとの推移

 四半期ごとのデータの見方には、個別期間(四半期、年など)単位のデータの推移を見る方法と、2018年以降などの累計データの推移を見る方法の2種類がある。個々の四半期単位で算出されるデータは、変動が大きくなる可能性があるが、変化に対して迅速に反応する。累計データは、より長期的な傾向を示すが、急速な変化に反応しにくい。

 以下では、BackblazeのSSDについて、2019年第1四半期以降の四半期単位のデータと累計データの推移を示す。最初に全てのSSDに関するグラフを示し、次に3つのモデルに関するグラフと表を示す。

図3:BackblazeのSSDの四半期単位のAFRと累計AFRの推移(提供:Backblaze)

 四半期単位のデータを見ると、複数の四半期でAFRのしきい値である2%を上回り、3%またはそれに近い水準となっている。だが、累計データは一貫して2%を下回っている。SSDはまだデータが少ないことを踏まえると、現状に安心することはできないものの、それほど悲観的になる必要もない。

 いずれにしても、SSDが古くなるほど、寿命の観点からAFRを注視する必要があるため、比較的使用期間が長いSeagateの3つのモデルについて、累計データの推移を次に示す。

図4:BackblazeのSSD 3モデルの累計AFRの推移(提供:Backblaze)

 Backblazeはこのグラフと表について、次のように説明している。

 2021年を通じて、3モデルは全て累計AFRが1%を下回っている。赤い線で示したモデル(ZA250CM10002)は、典型的なバスタブ曲線を描いているようだ。導入初期に故障が発生した後、AFRは低下し、1%を下回って落ち着いている。

 これに対し、他の2モデルは初期不良の兆候が見られず、最近になって故障が発生し始めた。バスタブ曲線に当てはまらないこうした故障パターンは、BackblazeのHDDにも見られる。

Copyright © ITmedia, Inc. All Rights Reserved.

スポンサーからのお知らせPR

注目のテーマ

Microsoft & Windows最前線2025
AI for エンジニアリング
ローコード/ノーコード セントラル by @IT - ITエンジニアがビジネスの中心で活躍する組織へ
Cloud Native Central by @IT - スケーラブルな能力を組織に
システム開発ノウハウ 【発注ナビ】PR
あなたにおすすめの記事PR

RSSについて

アイティメディアIDについて

メールマガジン登録

@ITのメールマガジンは、 もちろん、すべて無料です。ぜひメールマガジンをご購読ください。