そのサーバー、常夏になってませんか?SNMPによる温度監視の重要性

04-S-10

パトロールクラリスで、SNMPを活用したシステム・サーバー監視

商用の高価な監視製品のは高性能ですが、保守や継続更新はコスト高です。

現在、ネットワークやシステムを管理をSNMPベース行われていますか?
また、統合監視の検討や、MIBインポートや独自MIB利用可能な監視ソフト導入する際、熱量監視は監視項目に含まれているでしょうか。

本記事で紹介するSNMPを活用したサーバーの熱量監視は、性能を損なわずコスト削減できる可能性があります。

パトロールクラリスで、システムの「疲労度」を知る

大規模なグリッド型ウェブサービスを安定稼働させるには、システムの疲労具合を把握しておくことは非常に重要です。
サーバー監視にシステムの疲労具合の監視を加える必要があると言えるでしょう。

では、具体的な危険の予兆を掴む要素として、どのような手法・変化があるでしょうか?

システムが疲労する、もしくは疲労してきた時、有効な数値として検出できるのは、熱量です。人間と変わらず、通常と異なる稼働を行った際、サーバー内のCPU熱量(温度)は変化が起きます。
この温度変化を把握・監視することで、システム疲労への対応を実現します。

また、大規模であればあるほど、対応時に備えて、個々のサーバーが発する熱量を確認しておく必要があると言えます。

パトロールクラリスで、システムの「温度」を監視

パトロールクラリスでは、SNMPというプロトコルを活用して、各サーバーのファン(送風機)の回転数の監視を実現しています。
SNMPプロトコルは大変簡素なプロトコルですが、活用範囲は大変広範囲に及びます。
このSNMP機能でサーバーファンの回転数の監視を行うことによって、サーバー内の発生温度の検知を可能にしました。

設定温度を超えた場合にはアラートが上がるので、
サーバー本体、サーバーが設置されている環境を調査し、状況把握が実施できます。