SSDの代表的な不具合事例が三つある。OS起動用に利用しているSSDでのデータ破損や消失、MLC(multi-level cell)のNANDフラッシュ・メモリを採用したSSDのパラドックスによるもの、そしてRAID技術への過信によるものである。
このうち、最近特に多く見られるのが、OS起動用に利用しているSSD内のデータ破損や消失である。ある日突然、WindowsやLinuxなどのOSを起動すると、「OSが見つからない」と警告が出る場合がある。その後すぐにフォーマットしてインストールすれば再び利用できるが、しばらくすると同じ不具合が生じる。
この不具合は、24時間連続で稼働するシステムで発生する場合が多い。数カ月間、連続で動作させた後、年末年始の休みでシステムを停止し、再び休み明けに起動するとこの種の不具合が起こる。同時期に導入したSSDを搭載したシステムで一斉に発生する場合が多いので、分かりやすい。
こうした不具合が生じても、販売代理店からは、「製品故障ではありません」という回答しか得られない。原因は、「Data Retention(データ保持性能)」が低いことと、「Read Disturb(読み出し妨害)」にある。
そこで、SSDのデータ保持性能を吟味した上で、読み出し妨害への対策を講じる必要がある。結論から言えば、「DWPD(drive write per day)」と呼ばれるデータ保持性能を示す指標を判断材料にして、さらに読み出し妨害対策として、「リフレッシュ処理」と呼ばれる機能を備えたSSDを利用した上で、SSDを利用したシステムの運用方法を工夫するとよい。その理由を順に解説する。
TBWは容量によって値が変わる
SSDのデータ保持性能の指標として一般的なのが、TBW(tera byte written)である。TBWとは、業界で標準化が進められている耐久性能を示す基準であり、対象となるSSD製品が保証期間中に保存(上書き)できるファイル容量を数値化している。定義された試験環境の下、所定の方法で試験し、SSDが製品寿命満了までに何Tバイトのデータを書き込めるかを数値で表している。100TBWは、製品寿命が尽きるまでに100Tバイトのデータを保存できることを意味する(図1)。JEDECではこのTBWを基にして、SSDの寿命仕様を2010年9月に公開した(JESD218)注1)。
注1)同仕様では、SSDをサーバー用途の「Enterpriseクラス」と、パソコン用途の「Clientクラス」の二つに分類し、異なる試験合格条件を設定している。
TBWが製品仕様書やカタログに明記してあったとしても、以下の点について注意を払う必要がある。まず、二つのクラスのうち、どちらのクラスを前提に設計・製造されているか把握しなくてはならない。次に、SSDのデータ容量である。容量が大きいほど、TBWが大きくなる。同一モデルであれば、例えば容量が2倍になれば、TBWも2倍になる。
続いて、JESD218には、ベンチマークで使用するファイル・サイズに関しての規定がないことである。ファイル・サイズなどは、別規格の「JESD219」で規定している。
ファイル・サイズを等しくしなければ、TBWを厳密に比較するのは難しい。ベンチマークで使用するファイル・サイズが、測定対象のSSD(NAND)の「ページ(Page)・サイズ†」に一致すると、TBWが大きくなる。加えて、ファイル・サイズが「ブロック(Block)・サイズ†」と等しいと、TBWはさらに大きくなり、長寿命という結果が出る。