Backblazeは、2024年第3四半期の自社データセンターにおけるデータドライブの統計レポートを発表した。
この記事は会員限定です。会員登録(無料)すると全てご覧いただけます。
クラウドストレージやクラウドバックアップサービスを提供するBackblazeは2024年11月12日(米国時間)、2024年第3四半期の自社データセンターにおけるデータドライブの統計レポートを発表した。レポートでは、四半期ごとの年換算故障率(AFR)の上昇や2四半期連続で故障ゼロだったHDDの機種などが報告されている。Backblazeは以下のように説明している。
2024年第3四半期末時点で、Backblazeは世界中のデータセンターで29万2647台の起動ドライブ(HDDおよびSSD)を監視していた。今回の分析からは、ブートドライブとして使用されている3344台のSSDと756台のHDD、計4100台を除外した。この結果、管理対象としてレポートに含まれるHDDの総数は28万8547台となった。本レポートでは、2024年第3四半期のAFRおよび対象となるドライブモデルの生涯AFRを検討する。
2024年第3四半期の四半期分析では、以下の条件に該当するドライブを除外している。
これらの除外対象は合計471台に上り、最終的に2024年第3四半期の分析対象として残ったのは、29のドライブモデルに分類された28万8076台のドライブだ。
以下の表には、これらのドライブモデルにおけるAFRおよび関連データが記載されている。表は、ドライブ容量の昇順、その中でAFRの昇順でソートされている。
※Avg. Age(months):平均使用期間(月数)、Drive Days:総稼働日数、Drive Failures:故障件数
四半期ごとのAFRは2024年第2四半期の1.71%から2024年第3四半期には1.89%へと緩やかに上昇している。この上昇は、4TBドライブの老朽化によるものではない。CVT(継続的ドライブ移行)システムによる交換が進んでいるため、残存する4TBドライブのAFRは第3四半期では0.26%にとどまった。上昇の主な原因は、平均使用年数が7年を超えた8TBドライブ群にある。このグループのAFRは、第2四半期の2.31%から第3四半期には3.04%に上昇している。BackblazeのCVTチームは今後数カ月以内に8TBドライブの移行開始を予定している。
4TBのSeagate製ドライブ(型番:ST4000DM000)が表から消えた。このドライブを含む全ての「Backblaze Vault」(Backblazeのクラウドストレージサービス)で使われていたドライブが交換されたため、残存するのは2台のみとなった。そのため集計台数が不足し、四半期統計には掲載されなくなった。
2024年第3四半期に20TBの東芝製ドライブ(モデル: MG10ACA20TE)が大量に導入され、3つのBackblaze Vaultにそれぞれ1200台のドライブが収容された。過去数カ月間、ドライブ認定チームがこの20TBモデルの性能をテストし、基準をクリアした結果、導入可能なドライブモデルリストに加わった。
2四半期連続で、14TBのSeagate製ドライブ(モデル:ST16000NM00J)が故障ゼロを記録している。このモデルは2024年11月時点では185台が稼働中で、将来的には大きな変動が生じる可能性があるが、今のところ順調に稼働している。
10年以上使用されているデータドライブは存在しないが、9年以上使用されているドライブが39台ある。これらは全て4TBのHGST製ドライブ(モデル:HMS5C4040ALE640)で、5つのBackblaze Vaultと2つの異なるデータセンターにある31のStorage Podに分散している。これらのドライブは、10年目まで使用できる可能性は低いだろう。5つのVaultのうち4つはCVT移行が既に開始されており、年内までに使用終了となる予定だ。残る1つのBackblaze Vaultについては移行予定時期がまだ設定されていないが、全ての4TBドライブが完全に引退するのは時間の問題だ。
Backblazeは、2024年第3四半期末に顧客データの保存に使用していたHDDのうち、以下の基準を満たす25モデルの28万6892台について、2013年4月から2024年第3四半期末までの生涯AFRを次のようにまとめた。
2024年第2四半期、ドライブの生涯AFRは1.47%だったが、第3四半期には1.31%に低下した。生涯AFRが1四半期で大きく減少した。この減少は、同期間の四半期ごとのAFRの増加とも矛盾する。一見すると、四半期ごとのAFRが増加しているなら生涯AFRも増加するはずだが、今回のデータはそうではなかった。この一見矛盾するデータには、2つの関連する要因が存在する。以下で詳しく紹介する。
まずは、第2四半期と第3四半期の生涯統計の違いをまとめた以下の表を確認する。
生涯AFRのデータセットを作成する際には、以下の2つの基準が適用される。
これらの基準により、提示されるデータが関連性を保つようにしている。つまり、各ドライブモデルについて十分な台数とデータポイントが確保されていることを保証している。
上記の表から分かるように、第2四半期から第3四半期にかけてドライブ台数は増加したものの、ドライブ日数および故障数は大幅に減少している。この現象は、第2四半期と第3四半期の生涯AFR表に記載されたドライブモデルを下記のように比較することで説明できる。
4TBのSeagate製ドライブを除外した結果、第3四半期の生涯AFR計算からは8040万65ドライブ日数と5789件の生涯故障数が除外された。4TBのSeagateドライブデータを第3四半期の生涯統計に含めていた場合、生涯AFRは1.50%になっていたと予想される。
ドライブ台数の基準を設ける理由は何か? 生涯AFRを計算する際に、これまで使用してきた全てのドライブモデルを、累計で10万ドライブ日数を超えているものは全て含めるべきではないのか? 仮に、そのように計算するなら、生涯AFRを計算するドライブモデルリストには、数年前に使用が終了したモデルが含まれることになる。その結果、リストには約100種類の古いドライブモデルが含まれ、大半が時代遅れで、現在や将来にわたる価値がないデータで埋め尽くされることになる。要するに、ドライブ台数を基準に含めることで、生涯AFRの表が関連性を保ち、理解しやすいものになる。
Copyright © ITmedia, Inc. All Rights Reserved.
Server & Storage 險倅コ九Λ繝ウ繧ュ繝ウ繧ー