目次
通信キャリアとしての顔も持つコムスクエア
2005年より15年以上にわたってネットワークソリューション(NWS)事業を展開してきた株式会社コムスクエア。
本メディアでもたびたびご紹介している「パトロールクラリス」や「ロボシュタイン」を提供しているのがこのNWS事業部ですが、実はテレフォニーソリューション(CTI)事業部はさらに長い歴史を有しています。
1989年の創業以来、約30年におよぶその歴史の中で、国際電話サービスや電話効果測定ソリューション「コールトラッカー」などのCTIサービスを世に送り出してきました。
そんなコムスクエアですが、実は総務省の認可を受けた通信キャリアでもあるのです。
今回は、通信キャリアでもあるコムスクエアがサービス品質維持の為に、自社CTIサービスや回線設備の監視をどのように行っているのか、ご紹介していきます。
弊社独自で行っている監視の取り組みもご紹介していますので、同業の通信キャリア様は是非、参考にしていただければ幸いです。
CTIサービス・設備の監視ってなに?
まずは監視の手段についてですが、もちろん自社製のサーバ・ネットワーク監視ツール「パトロールクラリス」を利用しています。
テックスクエア掲載の記事でも数多くご紹介してきたパトロールクラリス。
いまでこそ、ご利用企業数が4,000社を超える製品となっておりますが、はじまりは自社内のデータセンターを監視する目的で開発されたものでした。
自社内での監視運用をいかに効率的に行うかを考えながら開発を進めていたため、「運用者目線」で嬉しい機能が搭載されているのも特徴のひとつです。
それでは、実際にCTI事業部においてパトロールクラリスを用いてどのような監視運用がされているのか、いくつか例を見てみましょう。
オンプレミス・クラウドを問わない統合監視
なにをやっているの?
CTIサービス及びキャリアサービスを提供するため、コムスクエアではオンプレミス・クラウド合わせて数百台のサーバ・ネットワーク機器を運用しています。
その中でも、冒頭でも触れたCTIサービス「コールトラッカー」は、Amazonが提供するクラウドサービス「AWS」上で構築されています。
AWSの監視には基本的にAmazonのCloud Watchという監視ツールを用いるのが一般的です。
しかし、最低限の監視しかできないCloud Watchでは、コールトラッキングサービスを安定して提供していく上では監視性能不足という不安が残ります。
また、コールトラッカーのサービスサーバーは複数のAWSアカウントに分散しているため、アカウント毎の監視状況は把握できてもコールトラッカー全体の監視状況を統合的に把握することが出来ません。
上記二つの課題を解決するためにコムスクエアの監視チームが活用しているのが、パトロールクラリスによるAWS監視です。
パトロールクラリスのAWS監視は、AWSクラウドサービス(EC2、ELB、RDSなど)の各種メトリクスやログを取得し可視化、さらに複数インスタンスの詳細な状態管理や異常検知の一元管理が可能です。
つまり、Cloud Watchと比べ、
AWS上の各監視対象機器の監視や状態管理を、より詳細かつ一元的に実行できる
AWS上の機器とオンプレミスで稼働している機器を統合管理できる
といった優位性を持っています。
複数のAWSアカウントに分散するコールトラッカーのようなCTIサービスや、サービス設備がクラウド上とオンプレミスに分散しているケースにおいても、パトロールクラリスを活用すれば統合的に監視・管理できるため、個別の監視体制を構築する手間を削減することが出来るのです。
どんなメリットがあるの?
パトロールクラリスによる統合監視の具体的なメリットとしては、自社設備のリソース管理、障害発生時の状況把握という二つが挙げられます。
新規サービスを開始したり、新規顧客による大規模なサービス利用が始まった際は、サービス提供に利用しているサーバのリソースを大きく消費しがちです。
リソースの枯渇はサービス停止につながってしまいますが、パトロールクラリスは社内設備全体のリソース使用状況を出力する機能を搭載しているため、前述のようなケースにおけるリスクを回避することができます。
パトロールクラリス ver.5.0のレポート出力画面。
レポート出力したい監視対象や期間、監視項目を選択し、監視レポートを作成することができる。
実際に出力された監視レポートの統計サマリとグラフ。
統計サマリでは、監視項目ごとに指定期間内における監視実行回数のうち、正常稼働の回数、アラートが発砲された回数などを確認することができる。
各監視項目ごとに表示されるグラフは、指定期間内における値の変化を視覚的に捉えることが可能。
コムスクエアでは、このレポート機能を積極的に使ってサービス設備全体のリソースを統合的に管理し、安定したCTIサービスの提供を行っています。
また、統合監視は障害発生後の復旧作業を効率化する上でも役立ちます。
2019年にAWSのTokyo Regionで大規模障害が発生した際には、AWSを利用する企業全体に影響が及びました。
コムスクエアでも多数のサーバーがダウンし、大量のアラートメールが発砲されたため、一つひとつのメールを確認する余裕がありませんでした。
しかし、パトロールクラリス上でCTIサービス全体の監視状況を把握できたため、各インシデントの復旧/未復旧を俯瞰して確認することができたのです。
パトロールクラリスを用いた社内設備・CTIサービスの統合監視は、正常動作時・障害発生時の両方において、監視運用の効率化に貢献しています。
自社回線の音声品質を監視
どんなことをやっているの?
次にご紹介するのは、音声サービスの「通話品質」を監視するという弊社独自の監視手法「発信監視」についてです。
発信監視とは、監視対象となる電話番号に架電を行い、0~9までの数字をプッシュした際に鳴るDTMF音(ピポパ音)からノイズなどの障害要素を検出する監視方法です。
コムスクエアでは、検出したDTMF音をデータベースに蓄積した上でパトロールクラリスによる監視を行い、サービスで利用している回線で発生する音声品質の低下の検知に役立てています。
どんなメリットがあるの?
パトロールクラリスを使った発信監視が役立った一例として、コムスクエアではこんな出来事がありました。
ある時、CTIサービスを監視していたパトロールクラリスからアラート通知が入ったため、運用者がDTMF音を直接確認したところ、ノイズが混じっていました。
運用者がキャリアに問い合わせたところ、まだ先方でも把握していない障害であること、キャリア側設備に起因する障害であることが判明したのです。
この件では、キャリア側でも感知していなかった障害をパトロールクラリスが検知し、障害によって顧客に影響が及ぶことを未然に防ぐことができました。
本メディア内では主にサーバ・ネットワーク機器のリソースやログなどの監視として取り上げているパトロールクラリスですが、「音声品質の監視」といった独自性の高い監視でも高い監視レベルを発揮してくれることを象徴するような出来事でした。
パトロールクラリスとITツールを駆使した迅速な障害対応
どんなことをやっているの?
CTIサービスや電話回線の監視に活用されているパトロールクラリスですが、実際にパトロールクラリスが障害を検知した際には、担当者に対して複数経路でアラート通知が入ります。
コムスクエアでは、メールでの通知に加えて、ビジネス向けチャットサービス「slack」を介したアラート通知を設定しています。パトロールクラリスの管理画面で事前に通知設定をすることで、アラート通知を誰に、どのチャネルで、何回送るのか、といった設定をカスタマイズすることが可能です。
監視運用チームはパトロールクラリスから受け取ったアラート情報を確認し、一次切り分けの後、障害であることが判明すると営業・サポートチームに対して障害報告を行います。
営業・サポートチームはこの報告に基づいてCTIサービスや回線を利用している顧客へのメール告知を実施します。障害の影響を受ける可能性のある顧客の洗い出しからメール告知までを担うのが、営業・サポートチームということになります。
障害報告を受けた営業・サポートチームは、Web会議サービス「Zoom」を活用して対応チームの招集と対応方針の策定を行います。
その後は、業務アプリ作成サービス「kintone」上で管理している顧客リストをもとに通知を行う顧客企業の選定を行い、通知メールのテンプレートを保存したスプレッドシートで一斉に障害通知を行います。
どんなメリットがあるの?
コムスクエアが実践する障害対応を特徴づけるのが、障害検知から顧客通知までのスピード感です。
複数チャネルを利用しているおかげでパトロールクラリスからのアラート通知の確認漏れのリスクを減らし、Slackによる通知で即時性を担保しています。さらにZoomやスプレッドシート、kintoneなどの外部ITツールを連携させ活用することによって、対応メンバーの招集と顧客通知に向けた作業を短時間で行えることが、素早い障害対応を可能にしています。
障害の種類や程度にも依存しますが、監視チームがアラート通知を受け取ってから営業・サポートチームが顧客に対して障害告知を行うまで、早ければ30分かからずで完了するケースもあります。
おわりに
今回は、新たにキャリアサービス・CTIサービスを提供するコムスクエアが実践する、自社製の監視ツールを用いた自社サービス/設備の監視運用についてご紹介してきました。
コムスクエア社内におけるサービス/設備の監視には、高い監視レベルや統合監視、迅速な障害対応といった特徴がありますが、これらを可能にしているのは、数十年にわたって展開してきたCTI事業で得た、テレフォニーサービス事業者としての圧倒的な経験値です。
創業当時に提供していた国際電話サービスの品質管理にルーツを持つ発信監視のように、今日コムスクエアで行われている監視運用は、長年社内に蓄積してきた知見の結晶です。
さらに、コムスクエアにおける監視運用は日々ブラッシュアップされ続けています。これまでに得た知見を監視運用に活かしつつ、新たに見つかった課題を解決していくことで、監視運用における社内ナレッジがアップデートされていくのです。
本記事でご紹介したサーバー・ネットワーク監視ツール「パトロールクラリス」に興味をもっていただけた方、自社キャリア回線の「発信監視」に関心をお持ちのキャリア事業者様は、ぜひ以下のリンクより弊社製品ページ及び弊社問い合わせフォームをご訪問下さい!
国内4,000社以上が導入したサーバー・ネットワーク監視ツール「パトロールクラリス」
詳しくはこちら!
弊社ソリューションやキャリア回線の発信監視に関するご質問は
株式会社コムスクエア 問い合わせフォーム