企業などで稼働するサーバーはビジネス運用に非常に重要な役割を果たしています。そのため、サービス停止が発生してしまうと大きな経営的損失を招くこととなりかねません。
そのため、サーバー障害時には早期発見し、出来る限り迅速にサービス復旧させ、その損失を最小限に減らす必要があります。そこで、必要なのがサーバーの運用監視です。
サーバー監視には、各サーバーをそれぞれ監視する「個別監視」とインフラシステム全体として監視する「統合監視」がありますが、「個別監視」では、大きなシステムになるほど管理が煩雑になり、導入による大きな効果は望めません。そこで、お勧めするのが「統合監視ソフトウェア」による「統合監視」です。
統合監視ソフトは、一つのソフトウェアでサーバーやネットワークなどインフラ全体を統合的に監視・管理できるため、サーバー管理者の手間を大幅に軽減でき、業務効率の大幅な向上を実現します。
今回は統合監視ソフトをサーバー監視に活かすポイントについて見ていきましょう。
目次
統合監視ソフトの機能について
統合監視ソフトには、IBM Tivoliや日立 JP1などいくつか有名な製品がありますが、どれもシステム全体を統合的に監視・管理するもので、大きく以下のような機能を持っています。
情報収集機能
監視対象のサーバーや、ネットワーク機器の情報を収集し、データベースへと蓄積する機能です。具体的には以下のような種類があります。
・CPU、メモリ、ディスクなどの使用状況、空き状況を調べる「リソース監視」
・サーバーやネットワーク機器の稼働状態を通信の疎通で確認する「ネットワーク監視」
・SNMPを利用したポーリング・トラップ監視を行う「SNMP監視」
情報表示機能
収集した情報を基に、データ、グラフなどで表示する機能。
監視対象や、監視項目ごとに結果をフィルターして表示することや、データ表示期間を選択して表示することなどが行えます。
グラフ化することにより、時系列のデータが参照でき、変化を把握しやすくなります。
しきい値設定機能
収集した情報から、監視対象が正常か、異常の判断をする機能。
しきい値を監視対象のシステムに適した独自の設定にすることで、より早期に不具合を発見でき、障害を未然に防ぐことや、障害の際の復旧を迅速に開始することが出来ます。
ネットワークに流れる通信量を監視する「トラフィック監視」も、ネットワーク負荷増大や、不正アクセスの検知に一役買っています。
通知機能
異常が発生した場合、メールやポップアップなどの方法で、サーバー管理者へ通知を行う機能。
障害の復旧で最も大切なことは、「いかに早く検知し、いかに早く対応を開始するか」、ということです。
障害発生時に適切な通知を行うことで、素早い復旧対応を行うことが出来ます。
その他
主にシステムを効率的に管理する機能。
決められた手順に沿って、サーバーを再起動したり、ログを解析したりするなど、サーバー管理者が運用業務を行うために便利な機能がまとまっています。
統合監視ソフトを活かすポイント
トラブルの原因をはっきりさせるために、統合監視ソフトが使われます。サーバー管理者は、トラブルが起きた際に慌ててしまうのではなく、どこにトラブルの原因があるのか、障害を切り分けなければなりません。
例えば、アクセス速度が遅いというトラブルの場合、ネットワーク回線が問題かもしれませんし、ネットワーク機器や、サーバ機器など様々な要因が考えられます。監視ソフトなどからの情報をもとに迅速かつ適切に原因を切り分ける必要があります。
サーバー管理者が、統合監視ソフトを活かす大きなポイントは以下の2つです。
レポートを時系列で見比べ、トラブルの種を摘み取る
日々、レポートが配信されているので、トラブルが発生した場合だけでなく、トラブルにつながる予兆を発見し、実際のトラブルに繋がる前に対策を行うことができます。
サーバーに加え、ネットワークに強い管理者であること
システムはサーバーとネットワークなど全体を総括的に見ていく必要があります。
障害の際もサーバーだけが原因となることは少なく、ネットワーク含め複合的な原因であることが多いため、システム管理者は様々な知識を持ち、幅広い視点で物事を判断できる必要があります。
システム監視に、各サーバーやネットワークごとに個別の監視を行うのではなく、統合監視としてシステム全体の監視を行うことで、コスト削減を実現すると同時により安定した運用が実現できることでしょう。
《 会社の規模別監視システム 1−2:サーバー監視を効率的に行うために必要な統合監視ソフトでできることとは?
会社の規模別監視システム 2−1:ビッグデータには親サーバー、子サーバーを用意し、適切なサーバー監視を 》
シリーズ一覧
[catlist tags=”会社の規模別監視システム” orderby=title order=asc numberposts=-1]