前回に引き続き、今回も米Google社が公開した論文を題材にしたいと思います。その論文とは、前回タイトルだけ紹介した「Flash Reliability in Production: The Expected and the Unexpected (現場環境でのフラッシュメモリの信頼性: 予想通りだったものと予想外であったもの)」です。同社がデータセンターで利用している大量のSSDで発生した障害データから、SSDの信頼性について検証し、考察した結果を記したもの。2016年2月に開催されたストレージ関係の国際会議「USENIX FAST’ 16」で初めて公開されました注1)

注1)USENIX FASTを主催するのは「USENIX」という団体。同団体の起源は、1975年に設立された「Unix User Group」というユーザーグループ。

 タイトルにあるように、Google社にとって、「予想外」であった結果はまとめると下記となります。

・使い始めてから4年間で、(モデル別で)20~63%のSSDが少なくとも1つの訂正不能なエラーを発生させる。
・Uncorrectable Bit Error Rate (UBER†)は、信頼性を測る尺度として適切ではない。
・書き換え回数が増えるほど、Raw Bit Error Rate(RBER†)と訂正不能エラー(Uncorrectable Error)数が増加するものの、予想していたよりも、その増加のペースは遅い。製品仕様で定められた「書き換え可能回数」を超えても、エラーは急激には増えなかった。
・製造から年数が経過するほど、SSDの信頼性は低下する。
・設計ルールが微細なNAND素子を搭載したSSDほどRBERが高まる。だが、訂正不能なエラー数にはほとんど影響がない。
・HDDに比べるとSSDの故障率は低い。だが、訂正不能なエラーの発生率は高い。
・NAND素子に「SLC(single level cell)」を用いたSSDのほうが、「MLC(multi-level cell)」を用いたSSDよりも信頼性が高いという証拠はない。
†UBER=Uncorrectable Bit Error Rate。訂正回路による訂正処理後も残った不正ビット数を、転送したデータの総ビット数で割った確率を指す。
†RBER=Raw Bit Error Rate。訂正回路で誤りを訂正する前の不正ビット数(破損や間違えたデータのビット数)を、転送したデータの総ビット数で割った確率を指す。

 これらの結果は、Google社にとって予想外であっても、筆者からしてみると、「SSDの常識」とも言えることです。ただし、最後の「NAND素子にSLCを用いたSSDのほうが、MLCを用いたSSDよりも信頼性が高いという証拠はない」、つまりSSDの信頼性はNAND素子の種類に関係ないというのは、ある特定の条件でのみで成立することです。今回はそれについて解説します。