VMware環境における監視運用

仮想化環境におけるサーバー・インフラ監視運用

ITサービスの提供基盤であるサーバー・インフラ環境に障害が発生していないかどうかを監視することは、
仮想化環境でのサービス提供においても当然必須の業務です。

ここで注目すべきなのは、仮想化環境という新たな層が増えたことで、
サーバーの技術環境が変化しており、サーバー監視に新たな視点や手法が必要となったことです。

今回は、仮想化環境における仮想化マシン・インフラの監視について、
従来の物理サーバー環境との違いと監視手法を紹介します。

仮想化マシン・インフラ環境の監視をする際の視点

VMwareなどの仮想化マシン・インフラ環境の監視を考える上で、
まずは従来の物理サーバー環境を監視する際、どのような要件が求められていたか、
また、それぞれの要件について従来の運用管理システムでは、どのような手法が用いられていたかを整理します。

１. ハードウエアで障害が発生していないかを監視する
ほとんどの場合、サーバー機器のベンダーが提供している、特定のハードウエアに特化した専用の管理ソフトを用います。
異常が発生した場合、SNMPトラップなどで異常を検知し、メールやログなどでメッセージを出力し、
ログ監視機能を用いて管理するのが代表的な手法です。

２. サーバーの死活監視をする（ネットワークの疎通、OSへのアクセス可否など）
ネットワークで接続された監視マネージャから、SNMPで定期的にポーリングを実施することで応答の有無をチェックし、
以上があれば通知を行うケースが多いです。

３. プロセスやサービスが正常に動作しているか監視する
４. ログ出力されるメッセージを監視する
５. ハードウエア・リソースの性能や使用状況を監視する
監視対象のサーバーOS内にエージェント（監視専用のプログラム）を仕込んでおき、
リモートから定期的に問い合わせを行い、エージェントから通知を受け取る手法が一般的です。

仮想化マシン・インフラ環境の監視をする際の手法

次に、VMwareなどの仮想化マシン・インフラ環境の監視をするにあたって、
従来の物理サーバー環境の監視に用いていた手法を流用できるのでしょうか。

上記の１〜４については、監視対象のハードウエアやOSから取得できる情報に違いはないので、
従来の手法や監視ツールを使っての監視が行えるため、流用は可能です。

しかし、５のリソース監視の手法については再考が必要です。

なぜなら仮想化マシンに対しては物理リソースを論理的に割り当てられており、
従来の監視方法ではCPUやメモリのリソースを“使用率”で見ているからです。

なぜ“使用率”で見ていては不十分なのかと言うと、
仮想化マシン上には以下のような“使用率”の計算根拠を動的に変化させる機能があるからです。
これらの機能が作用し、リソースの最大値が不正確な情報になってしまい、正確な監視が行えない可能性があります。

【“使用率”を動的に変化させる機能例】

・複数の仮想化マシンへ物理リソースを動的に分配する機能
・リソースのオーバー・コミット機能
・独自のメモリ・スワップ制御の挙動
・ハイパーバイザ層を経由してリソース制御することによるオーバーヘッド

仮想化環境のサーバー・インフラ監視について

仮想化環境におけるサーバー・インフラ監視運用においては、
従来の物理サーバー環境に比べてサーバーの技術環境が変化しており、
今回紹介したような新たな視点と手法が必要となります。
仮想化環境特有の変化に対応した管理手法や機能を理解し、活用していきましょう。

ここが知りたい！シスログとクライアントログの違い「ログ」とはなんでしょうか？ Wikipediaでは「ログ」とはデータログの略であり、「履歴、情報を記録に残すこと。また、その記録自体を指す。」「元々は航海日誌の意味 […]
サーバー監視が不十分な場合に起こりうる危険とはサーバーを監視すると一口に言っても、その方法は一つではありません。サーバーが、サービスを提供できない状況になるのは、さまざまな可能性が考えられるからです。まず、サ […]
ロボシュタインを使って「Microsoft Teams」でツール連携してみた（前編）「Windows」を開発しているMicrosoft社が提供する「Microsoft […]