turned on laptop computer

近年、システム障害が急増しており、2020年に入って以降も東証やドコモ、ゆうちょなどを筆頭に、あらゆる企業でシステム障害が多発しております。
実際、以下のデータをからも分かるように、システム障害は2016年以降毎年増加しており、特に2018年から2019年にかけては、件数が「約二倍」にも跳ね上がっています。

このように年々システム障害が増加する背景として、AWSに代表される各種クラウドサービスの普及によるシステム監視・運用の多様化、複雑化の結果、システム障害の原因が多種多様化し、発生率がこれまで以上に高まってきていることが考えられます。

さて、システム障害が急増している中、一体どのように防ぎ、解決すればよいのでしょうか?
東証システム障害を例に、システム障害の根本的原因・解決策をご紹介致します。

目次

「最悪の停止」と呼ばれたシステム障害

数あるシステム障害の中でも、「最悪の停止」と呼ばれた東証システム障害はご存知でしょうか?
東証システム障害とは、2020年10月1日に、東京証券取引所の株式売買システムで発生した障害のことで、被害額は「約三兆円」にも昇ると言われております。

このシステム障害の「原因」とは一体何だったのでしょうか?

「約三兆円」もの損失をもたらした東証システム障害の原因は、「ハードウェア」に障害が発生した際に、作動するはずであった「障害対応プロセス」が正常に作動しなかったことです。
より具体的に言うと、一号機の記憶装置に障害が起きた場合に、死活監視機能が反応し、その後自動的に二号機の記憶装置へと切り替わるはずであった「障害対応プロセス」が正常に作動せず、結果として「最悪の停止」をもたらしました。

もし、安定したシステム監視をしっかり行っていれば、「約三兆円」もの損失を防ぐことができていたんです。

一度のシステム障害が多大なる損失をもたらしたこの事例から、事前にシステム監視を行うことで、「最悪の停止」を防止する、またはすぐに対処する仕組み作りを行う必要性を感じられたことかと思います。

ではシステム障害による「損失」を防ぐためにはどうすればよいのでしょうか?
これからシステム障害への取り組み方についてご紹介いたします。

システム障害の「4点」の根本原因

a man holds his head while sitting on a sofa

まず、そもそものシステム障害が起こる根本原因とは何なのでしょうか?
システム障害が起きる根本的原因は主に、

  1. ソフトウェアの問題
  2. ハードウェアの問題
  3. 人為的ミス
  4. 不慮の事故

の四点に集約されます。

システム障害を防ぐには、上記に記した「4点の根本的原因」を事前に防ぐこと、または迅速に対処することが必要となります。

4点の根本的原因の中でも、「不慮の事故」「人為的ミス」によるシステム障害は安定した解決法はないのですが、「ソフトウェア」「ハードウェア」の問題によるシステム障害はシステム監視ツールで事前に防ぐ、または対処することができます。

しかし近年、クラウドサービスの普及により多様化、複雑化した現代のシステム障害を、幅広くカバーする、または迅速に対処できるシステム監視ツールはそれほど多くはありません。


パトロールクラリスは15年の販売実績の中で4,000社以上のお客様にご利用いただき、運用のプロフェッショナルの方々のフィードバックと時代背景をもとにバージョンアップを重ねてきました。
「68種類もの監視項目」「自動化機能」を持つパトロールクラリスなら、現代の多様化、または複雑化したシステム障害を幅広くカバーし、かつ迅速な対処を可能にします。

パトロールクラリスとは

パトロールクラリスとは、国内4000社以上の情報システム部門を支えるエージェントレス型サーバ監視・ネットワーク統合監視ソフトウェアです。

パトロールクラリス特徴

エージェントのインストール作業やバージョンアップ等のメンテナンスが不要!稼働中のシステムを止めずに導入が可能です。

複数製品でカバーしていたサーバ監視・ネットワーク監視を一本化!運用の効率化にこだわった機能がオールインワン!無駄なアラート通知も柔軟にコントロール!

死活監視は無料!無制限!その他「68種類」の監視機能も設定数に応じて購入が可能!不要な監視機能にはコストがかかりません。

パトロールクラリスの詳細はこちら

パトロールクラリスがどうやって解決するのか?

監視ソフトウェアは大きく分けるとPingによる応答監視、プロセスの起動監視、ポートの応答監視などの「死活監視」、CPU、メモリ、ディスク、ネットワークなど、OSやハードウエアのリソース使用状況を収集する「リソース監視」2つの監視が中心でした。しかしクラウドサービスの普及により監視の対象が、web系のアプリケーションやURL監視など多岐にわたる監視へと移行した現代の多様化、複雑化したシステム障害を防ぐためには、よりマルチでハイブリッドな監視ができるツールが必要となります。

パトロールクラリスでは、死活監視、リソース監視だけでなく、クラウド系の監視も年々強化しており、AWSやAzureなどマルチcloudへも対応した計「68種類」もの監視項目を保持しております。その上、自動化オプションが選択可能で、実際にGUI上でフローチャート形式による障害対応の「自動化フロー」を作成することができます。

つまりパトロールクラリスは、多種多様化してきているシステム障害に対し、より広義な監視を可能にすることで、他の監視ツールより「幅広く」システム障害を防止し、また自動化機能により、緊急度の高い障害から「迅速な対応」も行うことで、多様化、複雑化した現代の「ソフトウェア」「ハードウェア」によるシステム障害を解決致します。

しかし、有償のシステム監視ツールには、
手が出しにくいですよね?

無料のシステム監視ツール「パトロールクラリスフリー」

現在、4000社以上もの情報システム部門を支えている有償のシステム監視ツール「パトロールクラリス」を元にした「パトロールクラリスフリー」を無料でご提供しております。

パトロールクラリスフリー特徴

▼3ステップで簡単登録、無料で監視を開始▼

▼監視結果を「レポート」として出力可能▼

▼実績のあるパトロールクラリスを元に作成しているため「安心」▼

パトロールクラリスフリーは、3STEPで登録でき、いますぐにPing、URL、簡易web改ざん監視の計3種類の監視を行うことができます。
誰でも無料で簡単に監視を可能にすることで、セキュリティ意識の向上を目指しています。是非、この機会にご利用なさってください。

また、上記3種類以外の監視を行いたい際はパトロールクラリス製品版のご案内をしておりますが、画面はパトロールクラリスフリーと同様なため、パトロールクラリスフリーに慣れていただければ、その運用ノウハウで製品版を扱うことも可能となります。

パトロールクラリスフリーの詳細はこちら

さらに、近年ではクラウドの台頭により運用はより複雑化しています。
乱立するクラウドに運用が追い付かず、クラウドにおける監視運用が手薄になっていることもあります。
そんなリソース不足のご担当者様向けに、24時365日、監視運用業務を代行してくれる「ロボティックマネージドサービス」もご紹介致します。

監視運用業務において、以下のような悩みございませんか?

・業務が圧迫しており、常にリソースが足りない
・コストをかけずに作業工数を減らしたい

ロボティックマネージドサービスはこのようなお悩みを解決致します。

1.監視・通報・インスタンス再起動などを代行することで、「90%」近くの工数を削減
2.初期費用なしで、1ノード¥3000/月、もしくは1ノード¥5000/月でご利用可能
3.休日・夜間問わず、「24時間365日」ロボットが監視運用業務を代行

ロボティックマネージドサービス
詳しくはこちら

関連記事