会社の規模別監視システム 1−1:サーバー監視とは


構築当初は正常に動作していたシステムでも、サーバーの状況・仕様など、さまざまな要因でトラブルが発生する恐れが高まる場合があります。

サーバーの管理者は、サーバーやネットワークの動作を正常に保つ義務があり、ネットワーク上で特に重要なメールサーバー、Webサーバーなどはそれぞれ冗長化して用意することが必須となっています。
しかし、それでも、提供するサービスが停止したり、不意に反応が遅くなったりすれば、企業システムの重要性から考えると、業務全体の流れが停滞すると考えても過言ではないでしょう。

業務の停滞を回避するために、未然に防ぐ対策をし、万が一障害が発生したとしても、すぐに検知し、復旧できるようにしておくこと。そこで重要となるのが「サーバー監視」なのです。

サーバー監視で重要な点は、何を「監視対象」とするのか、それらを確認するには「どのようなツールを利用」するべきなのかです。

サーバー監視において重要なチェックポイントと目的

サーバーを監視する際は、どのような観点や値から監視するか、チェックポイントごとに設計をしていきます。それぞれの監視項目で注意するポイントと目的を抑えていきましょう。

セキュリティ監視

運用しているサーバーで、脆弱性が発見された場合、「システムアップデートが正しく行えているか」、ウイルスの感染を防ぐために、「アンチウイルスソフトのパターンファイルが正しく更新されているか」、このような観点の監視を「セキュリティ監視」と呼びます。

セキュリティホールが発見されれば、サーバーに侵入するためのクラックツールが作成され、ツールが拡散すれば、管理しているサーバーが攻撃される危険性が増大します。

このような不正アクセスの被害を軽減するために、日々、システムに脆弱性がないか、セキュリティ監視でチェックをすることが推奨されます。

ネットワーク監視

システムのインフラとして、まず、ネットワークが正常に稼働していなければ、サーバーは通信を行うことができません。ネットワークのトラブルによるシステムダウンは業務への影響範囲が大きくなる傾向があるため、特にこまめにチェックすることが求められます。

具体的には、サーバーに向かって定期的にpingコマンドや、tracerouteコマンドを実行することで、サーバーが停止していないか、経路が途中で遮断されていないかを確認することができます。

これを自動化したものを「ネットワーク監視」(死活監視)と呼び、日々、ネットワークが正常に稼働しているかを確認する監視項目です。

また、例えば、急激なアクセス数の増加で、通信量が大幅に増加した場合、その影響でレスポンス速度低下を招くケースがあります。そのようなトラブルが続くと、サービスの質の低下につながりかねません。

この事態を未然に防ぐためには、回線容量がどの程度必要なのかを正確に見極める必要があります。通信量を常に監視し、いつアクセスが多いのかを把握することも重要でしょう。

パフォーマンス監視

アクセス過多などでサーバーのシステムリソースが不足すると、仮にネットワークが正常であったとしても、通信障害が発生する可能性があります。

ひとつのサーバーに大量のアクセスが集中するなど、サーバーで処理する負荷が大きすぎてしまうと、サーバーの重要なプログラムが動作しなくなる恐れがあります。
これをいち早く検知するためには、サーバーのアクセス数、通信量を監視する他に、メモリの限界を超えてしまわないか監視する必要があります。

これが「パフォーマンス監視」です。定期的にパフォーマンス監視を行うことで、障害を未然に防いだり、障害発生時に原因を特定しやすくなります。

ログ監視

サーバーやネットワークなどのシステムは常にログを残しています。ログとは、起こった出来事について記録・蓄積したデータのことで、ログがあることにより重大な障害があった際に、その原因究明の鍵とすることができます。

クラッカーの攻撃活動や、ハードウェアの異常、設定ミスによるエラーはログを監視することで把握しやすくなります。「ログ監視」は、それらを監視するための監視項目です。

サービス監視

ウェブサービスの場合、ネットワークが正常でも、例えば、データベースのサービスにもしも不具合があり、正しく接続できなければ、ウェブサービスは正常に動作することができません。

データベースが正しく動作しているかどうか、それをサービスレベルで監視するものが「サービス監視」です。このような障害の場合、ネットワーク自体は正常に稼働しているので、エラーは発見しにくいですが、上手に監視を行うことで発見が容易になります。定期的に「サービス監視」を行うことで、状態を確認しておくことは役立ちます。

サーバー監視を行う上での重要なポイントは「サーバーがサービスを提供できない期間をいかに短くすることができるか」です。サーバーの監視項目を増やす場合には、手間や費用がかかってしまうケースもありますが、重要な監視項目はできるだけ多く監視を行うことが望ましい結果につながります。

最低限のコストで、「トラブルを未然に防げるか」、そして「いかにリスクを小さくできるか」を考えられるかを意識しましょう。予算とのバランスを考え、「サービス停止」などリスクの高い障害から効率よく対策を行うと良いでしょう。

会社の規模別監視システム 1−2:サーバー監視を効率的に行うために必要な統合監視ソフトでできることとは? 

シリーズ一覧

[catlist tags=”会社の規模別監視システム” orderby=title order=asc numberposts=-1]