目次
特に来て欲しくないサーバーレポート
サーバー監視を導入すると、サーバー監視者にレポートが届くように設定できます。
レポートは、サーバーの健康診断書のようなもので、監視対象のサーバーチェックが行われた際のチェック結果・サーバーの状況・情報が記されています。
ほとんどの場合、サーバーに異常が無い、正常にサーバーチェックが終了したことを知らせるレポートですが、まれに来て欲しいと思わないレポートが届くことがあります。
それが「ディスクの故障」につながるレポートです。
※図 ディスク故障
ディスクの故障は、重要なデータの損失、システムが起動しないなど、長時間サービスが停止する可能性がある障害につながりやすく、また、ディスクのメンテナンスにも多大なコストと手間がかかります。そのため、管理者であれば、特に来ないで欲しいと思うのも当然でしょう。
定期的なログ監視を習慣に
サーバーはクライアントPCと違い、主にネットワーク経由の利用が多くなるため、ディスクの故障に、あまり気が付かない傾向にあります。しかし、ディスクの故障には前兆があることが多く、エラーによってデータの読み書きがいつもより遅いなど、何かしらの兆候を発している可能性があります。
そのため、日頃から、注意深く監視することで、重篤なサーバー障害に繋がるディスクの故障を予防したり、場合によっては防げる可能性が高くなります。
加えて、システムログの定期的な監視はとてもおすすめです。
通常、サーバーはRAIDを組み、例えばミラーリングと呼ばれる機能によって、ディスクが1台壊れてもサービスが継続できるような仕組みを作っている場合が一般的です。しかし、そのRAIDが壊れたという情報はサーバーのランプやブザーを除けば、ログにしか載りません。
2台目、3台目が壊れて重篤な障害に発展する前に速やかに交換をするためにも、ログを定期的に監視することをおすすめします。
エラーの確認と対処法
ベンダ各社のホワイトペーパーではアクセスが著しく増加したり、リソースを多く消費する傾向が増えてくると故障につながりやすくなるとも言われています。例えば、システムの再起動程度で回復する症状なら実害が少なく、サービス停止時間も短くて済みますが、ディスクの交換、ボードの交換の場合は、かなりの停止時間を要することもありえます。
ログ監視などでエラーを見つけたり、何らかの故障の兆候が見つかった場合、まずはディスク診断ツールなどを使用し、本当に交換が必要になるのかどうかの切り分けを行っていきましょう。
※図 ログ監視
近年、システムの運用はセルフマネジメントが占める割合が上昇傾向になっていると感じます。その場合、増え続けるリスクと、それにかかるコストの削減が課題とになりますが、監視ソフトを使うことによって、小規模・大規模問わず動作・性能判断できます。
基幹システムの自己管理、サーバーや、ネットワーク機器の診断も行えるので、早期発見と早期対策につながるでしょう。