一言にサーバーを監視すると言っても、方法は多岐にわたります。サーバーが停止する可能性は一つではなく、その分だけサーバーを監視する必要があるからです。そのためには「サーバーの何を監視するのか」を決め、「どのように監視するのか」を明確にしておくことが重要でしょう。
ここでは具体的なサーバー監視の例を知っていきましょう。
目次
外部ホストによるpingコマンド応答確認
サーバーの死活監視と言われています。Pingコマンドによって応答があるかないか調べる基本的なコマンドですが、サーバーが応答できない状況になっているか、いないかを把握することができます。
最近では、インターネット経由で死活監視を提供している会社も増え、手軽にサーバーの死活をチェックできるようになりました。
traceroute コマンドによる通信経路の確認
tracerouteコマンドも、pingコマンドと同様に、ネットワークトラブルの際によく使われる定番のコマンドです。Pingコマンドではサーバーが稼働しているか、否かしか探れないため、もう少し詳しい切り分けが必要になる際に使用されるのがtraceroute。
各ルーターとの往復時間が分かるので、回線の混み具合を判断でき、経路情報や、ホスト自身、ルーターのルーティング設定が正しいかどうかも確認することが可能です。
ウイルス定義ファイルの更新状態確認
サーバーは情報量や、接続するクライアントの数が多いので、たびたびウイルスによる攻撃や、不正アクセスを狙われたりします。ウイルス定義ファイルの更新を怠らないようにし、最新の状態に保つ必要があるでしょう。
ウイルス定義ファイルだけでなく、Windowsサーバーの場合は、特にシステムのセキュリティホールを狙われ、侵入されてしまうことにもつながるので、システムアップデートもチェックする必要があります。
意図したサービスを提供できているか確認
サーバーや、データーベースが稼働していても、正しい意図した動作をしていなければ、システムがうまく動いているとはいえません。例えば、サーバーはデータベースと接続しているので、正常にデータベースとアクセスできているかは重要な確認項目です。
データベースはOracle、MySQLなど種類がさまざまなので、監視用のツールではなるべく多くのデータベースに対応している監視ツールを選択することが望ましいでしょう。
サーバーからのレスポンス時間を確認
サーバーは正しく意図したとおりに動いているだけでは、正常とは言えない場合があります。それがレスポンス時間です。多大な負荷がかかってしまっている場合や、メモリが足らない、メモリの故障などが原因で、意図するサービス応答時間を提供できていないことがあり得るのです。
そのため、サービスのレスポンス時間を計測し、確認する必要があります。著しく応答時間が落ちてしまっている場合は、「怪しい」と睨みをきかせ、障害に発展する前に手を打つことが可能です。
安定したサービスを提供し続けるためにはなくてはならない監視でしょう。
サーバーを運用するためには監視が必須
サーバーを運用するためには監視が必須ですが、全て手動で行っていると人員も必要で、手間も時間もかかってしまいます。監視ツールを導入すれば、あまりコストをかけず、自動的かつ、効率的に監視を行うことができるようになります。
上記5つの監視を自動的に行ってくれ、細かな設定も行うことができる監視ツールを導入すれば、保守コストの削減、質の良い監視を行うことができるでしょう。