SSDの代表的な不具合事例が三つある。OS起動用に利用しているSSDでのデータ破損や消失、MLC(multi-level cell)のNANDフラッシュ・メモリを採用したSSDのパラドックスによるもの、そしてRAID技術への過信によるものである。

 このうち、最近特に多く見られるのが、OS起動用に利用しているSSD内のデータ破損や消失である。ある日突然、WindowsやLinuxなどのOSを起動すると、「OSが見つからない」と警告が出る場合がある。その後すぐにフォーマットしてインストールすれば再び利用できるが、しばらくすると同じ不具合が生じる。

 この不具合は、24時間連続で稼働するシステムで発生する場合が多い。数カ月間、連続で動作させた後、年末年始の休みでシステムを停止し、再び休み明けに起動するとこの種の不具合が起こる。同時期に導入したSSDを搭載したシステムで一斉に発生する場合が多いので、分かりやすい。

 こうした不具合が生じても、販売代理店からは、「製品故障ではありません」という回答しか得られない。原因は、「Data Retention(データ保持性能)」が低いことと、「Read Disturb(読み出し妨害)」にある。

 そこで、SSDのデータ保持性能を吟味した上で、読み出し妨害への対策を講じる必要がある。結論から言えば、「DWPD(drive write per day)」と呼ばれるデータ保持性能を示す指標を判断材料にして、さらに読み出し妨害対策として、「リフレッシュ処理」と呼ばれる機能を備えたSSDを利用した上で、SSDを利用したシステムの運用方法を工夫するとよい。その理由を順に解説する。

TBWは容量によって値が変わる

 SSDのデータ保持性能の指標として一般的なのが、TBW(tera byte written)である。TBWとは、業界で標準化が進められている耐久性能を示す基準であり、対象となるSSD製品が保証期間中に保存(上書き)できるファイル容量を数値化している。定義された試験環境の下、所定の方法で試験し、SSDが製品寿命満了までに何Tバイトのデータを書き込めるかを数値で表している。100TBWは、製品寿命が尽きるまでに100Tバイトのデータを保存できることを意味する(図1)。JEDECではこのTBWを基にして、SSDの寿命仕様を2010年9月に公開した(JESD218)注1)

注1)同仕様では、SSDをサーバー用途の「Enterpriseクラス」と、パソコン用途の「Clientクラス」の二つに分類し、異なる試験合格条件を設定している。

図1 TBWの算出方法
TBWは、SSDの製品寿命が終わるまでに何Tバイトのデータを保存できるかどうかを示す。記憶容量(ユーザー領域)に比例するので、データ容量が大きいSSDほどTBWが大きくなる。
[画像のクリックで拡大表示]

 TBWが製品仕様書やカタログに明記してあったとしても、以下の点について注意を払う必要がある。まず、二つのクラスのうち、どちらのクラスを前提に設計・製造されているか把握しなくてはならない。次に、SSDのデータ容量である。容量が大きいほど、TBWが大きくなる。同一モデルであれば、例えば容量が2倍になれば、TBWも2倍になる。

 続いて、JESD218には、ベンチマークで使用するファイル・サイズに関しての規定がないことである。ファイル・サイズなどは、別規格の「JESD219」で規定している。

 ファイル・サイズを等しくしなければ、TBWを厳密に比較するのは難しい。ベンチマークで使用するファイル・サイズが、測定対象のSSD(NAND)の「ページ(Page)・サイズ」に一致すると、TBWが大きくなる。加えて、ファイル・サイズが「ブロック(Block)・サイズ」と等しいと、TBWはさらに大きくなり、長寿命という結果が出る。

ページ・サイズ=ページはNANDチップで書き込みや読み出しを行う単位の一つで、NANDの記憶素子が複数個集まったワード線の1本分をページと呼ぶ。ページ・サイズはその容量を指す。
ブロック・サイズ=ブロックは複数のワード線から成る。ブロック・サイズはその容量を指す。