ダウンタイム発生を防ぐ!死活監視の重要性とは

03_S_10

 

システム管理者は、常にシステムの稼働状況を把握していなければなりません。
機器の状態を常に把握して、機器の故障などが起きた際には、迅速に復旧作業を行える対策をしておく必要があります。

死活監視とは

機器の状態を常に把握するためには、死活監視を行う必要があります。
死活監視とは、サーバ監視を行い、サービスが正常稼働しているかを監視することをいいます。
サーバ監視の方法は、システム管理者による目視確認でも可能ですが、常時稼働を要求されるシステムでは、死活監視システムの導入が必要となります。

死活監視システムを導入するには、いくつかの方法があります。

Ping送信が到達するかどうかを調べる

定期的にping実行とメール送信を実行してするというのが、基本的な方法です。
簡単なものであれば、自作でも可能です。
自作で対応するメリットは、コストをかけずに構築できること。
デメリットは、問題が起こった場合は、システム管理者が自ら対応しなければならないことです。

ソフトウェアを導入する

フリーソフトウェア「Nagios」。
死活監視の基本的な機能を備えたフリーソフトです。
豊富なプラグインも提供されており、機能の追加を行うことも可能です。
メリットは、コストをかけずに導入できることです。
デメリットは、設定が比較的難しく、フリーソフトであるためサポートが受けられないことです。

フリーソフトウェア「Hinemos」。

NTTデータが開発。
死活監視に加えて、リソース監視機能なども備えた統合型オープンソースソフトウェアです。
特徴は、複数のコンピュータをグループ化して、グループ単位で管理できる機能を備えおり、企業など大規模なシステムにも対応できます。
死活監視システムでは代表的なものの1つです。

死活監視システムの運用

導入するソフトウェアなど、サーバ監視の手法が決まったら、具体的に、死活監視システムを運用するハードウェアを検討する必要があります。

具体的には、
既存のサーバで運用するのか、
専用サーバで運用するのか、という問題です。

たとえば、1つのハードウェアで複数のサービスを稼働させている場合は、物理的トラブルで複数のサービスが停止してしまうことに配慮が必要です。

同じハードウェアで死活監視システムも稼働させている場合は、死活監視システムそのものも止まってしまうことになり、サーバ監視システムの意味がなくなってしまいます。

そこで、死活監視システムを専用サーバでの運用を検討する必要があります。

専用サーバを設けて、サーバ監視を行う場合、自らサーバにソフトをインストールする方法もありますが、市販のアプライアンスを購入する方法もあります。

市販アプライアンスを活用することで、ソフトウェアのインストールの手間をかけずに、スムーズに死活監視システムを導入し、サーバ監視を行うことができます。

最後に

導入が終わっても、死活監視システムそのものが正常稼働していなければ意味がありません。
システム管理者は、システム構築時に堅牢性を確保するとともに、定期的なメンテナンスを行い、サーバ監視を行わなければなりません。
また、障害発生時に備えての対応方法について、あらかじめ対策をしておくことも重要です。