X

記憶域プール/記憶域スペースのディスク障害検知能力の弱さを運用でカバーしてデータの消失を未然に防ぐ

Windowsの記憶域プール/記憶域スペースでは、物理ディスクに障害が発生した場合、自動的に物理ディスクの障害が検知されて通知されるはずなのですが、SMART情報など低レイヤでの障害検出機能が弱く、OSではディスクを正常と認識しているのに、記憶域プールが正常に動作しなくなったり、本来耐えられるはずの台数の物理ディスクに障害が発生した場合であっても、他の潜在的な障害ディスクの存在により修復が出来なくなる虞があります。

NASなどで利用されているRAIDや、SAN、記憶域プール/記憶域スペースなどのブロックレベルストレージでは、一部のディスクの障害が全てのデータ消失にも繋がりかねないため、物理ディスクは消耗品の認識に立ちできる限り早期に障害を検出してディスクを早めに交換していくことがますます求められます。

そして、残念ながらこの障害検出は現在のところまだまだ記憶域プール/記憶域ストレージは未成熟な状態で、恐らく複数ディスクの障害に起因すると思われる、記憶域の修復が不可能となった事例の報告が国内外で散見されるため、ディスク障害の早期検出については利用者の運用対処が求められます。

この点、ファイルレベルストレージであれば、対象のHDDに保存していたデータだけに影響が限定されるため、まだ諦めもつくというものなのですが。DriveExtenderの秀逸さは、ファイルレベルストレージでかつデータの冗長性を担保できたという点にありました。

ホームユースや中小規模の利用では、まだまだオレガ社のVVAULTや、DrivePool、DriveBenderなどのDE代替ソリューションの活躍余地が高いと思います。

障害検出の方法

記憶域スペース/記憶域プールの障害に対する備えと修復手順記憶域スペース/記憶域プールの正常性をメールで監視するに記載したイベントビューアーを活用する以外にも、以下のような方法があります。

PowerShellでストレージの信頼性カウンターを確認する

Get-StorageReliabilityCounter コマンドでは、物理ディスクの信頼性に関するパラメーターを確認することができます。

Get-physicaldisk -FriendlyName FriendlyName | Get-StorageReliabilityCounter | FL

この中に、読み込みエラーや書き込みエラーのカウンター値が保存されています。この値が高いディスクは早期に交換を行いましょう。

たとえば、以下のようなコマンドを実行すると、複数の物理ディスクの読み取りエラーカウンター値をまとめて表示することが出来ます。

Get-physicaldisk | Get-StorageReliabilityCounter | SELECT DeviceID,readerrorscorrected,readerrorstotal,readerrorsuncorrected

 

表示出来る情報量は限られますが、全ての物理ディスクについて読み取り、書き込みエラーのカウンターを確認出来るため、重宝するコマンドです。

CristalDiskInfoなどのツールを利用する

SMART情報を表示できるフリーソフト、CristalDiskInfoなどを利用すると、詳細なSMART情報を確認することができると思われます(未確認ですが、接続IFによっては表示出来ない場合もあるかもしれません)。

ださっち: