会社の規模別監視システム 3−1: Linuxサーバーについて

 Linuxサーバーの監視とは?

黒い画面に白い文字…あるいは白い画面に黒い文字。シンプルといえば聞こえは良いですが、素っ気ないLinuxのコンソールを前に首をかしげているあなたはソフトウェア開発者でしょうか?それとも、ウェブデベロッパーでしょうか?もしかしたら、ウェブデザイナーかもしれません。いずれにせよ、あなたは連休明けの火曜日に、上司から大切なLinuxサーバーを監視するように仰せつかってしまいました。

Linux…ウェブサーバーやデータベースサーバーを動かしているOSのこと。

それくらいは、僕もあなたももちろん知っています。
ITプロフェッショナルとしてスキルを積んできた勉強家のあなたですから、Linuxがオープンソースプロジェクトの成功例として、世界中のさまざまなシステムで使われていることも知っています。ただ…Linuxを監視することはサーバー管理者の仕事ではなかっただろうか…どうして、私が…と、あなたは面食らってしまっている、そういうことです。

監視…監視…サーバーが停止していないことを監視する。システムが不用意に停止してしまえば大きな混乱を起こしてしまいます。

銀行、鉄道、航空、株の売買や取引も。つい先日も、ずっとファンをしているバンドのライブチケットを買おうとしたらチケット屋のサーバーが落ちていました。マイナーなバンドだけれど、ツイッターはファン仲間の泣き叫ぶツイートで阿鼻叫喚でした。

まずはサーバーが停止していないこと。それは何をおいても重要なことのように思えます。

 死活監視 ー サーバーの停止を監視する

検索エンジンとしばし向き合った後に、あなたは「死活監視」とノートに書き留めました。

死活監視とは、サーバーが「落ちていない」つまり停止していないことを確認する監視のようです。ICMPやPingと呼ばれる、死活監視用の通信(プロトコルと呼ぶらしい)をつかうため、よほど酷い状態にならなければサーバーは応答してくれるようです。

逆に…死活監視にサーバーが応答しないときは、電源が落ちてしまったり、ネットワークが壊れてしまったり、とても利用に耐えられないくらい重くなってしまったとき…らしい。

「サーバーがとても重いと死活監視すらエラーになる」…あまり考えたくない事態です。ペン先も重くなってしまいます。

 性能監視 ー サーバーの重さを監視する

サーバーが重い…。時折、サーバーエンジニアが嘆いていることがありますが、どういうことでしょう。どうやら、サーバーに処理が溜まってしまってアクセスもままならなくなってしまうことを「重い」と呼ぶそうです。

ウェブサーバーであればユーザーのアクセスをさばききれなくなること。さばききれなくなったアクセスはしばらく待たされて切れてしまう(タイムアウトというらしい)か、もっとひどいとアクセスが即拒否されてしまう(リジェクトというらしい)ようです。

こうなってしまうと、Linuxのコマンドを実行する画面(コンソールというらしい)にアクセスすることもままならなくなってしまうようです。

なんとかアクセスして、サーバーの負荷をみたり、メモリの空き容量をチェックしたり、時々、まさかのディスクがいっぱいという事態もあるからディスクの空き容量をチェックしたり…今この瞬間接続できなくなるかもしれないから、できるだけ素早くサーバーの調子を見るんだ、とサーバーエンジニアが教えてくれました。

そんなにぱっぱと対応できるだろうかと悩んでいると、「サーバーのリソース不足なのか、ネットワークが重いのか、データベースが重いのか…まずはこのあたりであたりをつけるといいよ」とアドバイスももらいました。
悩みと不安は尽きませんでしたが、「日々の性能監視が大事」とメモを書きました。

 Linuxサーバーのリソース不足?

「サーバーだってパソコンと同じようなもの」

と、それはそうなんだけど…というお言葉を頂いて席に戻ってきました。
…なんとなく監視すべきポイントがわかってきた気がしますが、そもそも、Linuxのコマンドをあまり知らないあなた。ネットワークは色々な機器が関係しそうですし、データベースはさらにコマンドが多そうです。

楽そう…というと怒られてしまうかもしれませんが、まずはサーバーのリソースのチェックに挑戦することにしましょう。LinuxもWindowsもそこまで違うわけでは無さそうです。CPUの使用率、メモリの空き容量、ディスクの状態を確認することができれば、おおまかにサーバーの監視ができるように思えます。問題は、LinuxにはWindowsのような「画面」も「マウス」もないということですが…。

今日の会社帰りに、Linuxの本を買って帰ろうと決意するあなたでした。

《 会社の規模別監視システム 2−3:自動化を取り入れ業務の効率化を図る

会社の規模別監視システム 3−2:Linuxサーバーのコマンドと監視 》

シリーズ一覧

[catlist tags=”会社の規模別監視システム” orderby=title order=asc numberposts=-1]