New Relic Alerts

New Relic Alertsは、サードパーティのプラグインを含むNew Relicプラットフォームを俯瞰した統合的なアラート機能を提供します。フロントエンドからサーバサイド、そしてビジネスデータまで、様々なメトリクスやイベントデータの組み合わせでアラートポリシの設定が可能となり、アラートが統合されることで、不要アラートや重複アラートを軽減できます。またメールやチャット、ページャーなど様々な通知チャネルを統合し、アラートポリシに応じた通知チャネルの使い分けにより、適確なアラート通知が可能となります。

 

インシデント管理

適切なアラートとは、システムの状態変化について、その責任を持つ担当者やチームに適確に通知することです。 New Relic Alertsを使用すると、担当者やチームが初期の警告から最終的なクローズまでのアラートを一連のインシデントとして追跡し、そのパターンを把握および対処できるようにすることで、以後のアラート通知の発生を回避できるようにします。New Relic Alertsは、進行中のインシデントの詳細な管理画面を提供し、またインシデントがオープンした際とクローズした際に、イベントログとして確認できます。

New Relic Alerts インシデント一覧

インシデントの起票

メトリクスがアラートポリシー条件のクリティカル閾値に違反すると、New Relic Alertsは、アラートに効率的に対応できるように詳細情報を含むインシデントレコードを生成します。インシデントは一連の違反アラートのコレクションとなり、違反アラート毎のオープンタイムスタンプとクローズタイムスタンプおよびチャートのスナップショットも含まれています。各インシデント内には、クリティカル閾値違反に関連するワーニング違反についても含まれます。
また、個々のシステム要件に応じて、生成するインシデントを、アラートポリシー単位、アラートポリシー内のアラート条件単位、さらに監視対象となるエンティティ単位に設定することもできます。

New Relic Alerts インシデント内容

インシデントの承認

New Relic Alertsでインシデントが起票されると、各インシデントに責任を負っているメンバーへインシデントを通知します。そのアラートポリシーへ割当られているユーザは、オーナー、管理者、一般ユーザ、制限ユーザといった権限に関係なく、そのインシデントを承認できます。インシデントを承認することによって、承認者にフラグを立て、他のメンバーに通知が行われます。インシデントの承認後に他のメンバーが同じインシデントを確認しようとすると、インシデント一覧のページが表示され、インシデントが承認済みであることが示されます。

Runbook URL

アラート内に運用手順書へのURLリンクを付加することもでき、インシデントが通知された担当者は、そのインシデントを処理するための運用手順書へ直接アクセスすることができます。 インシデントページと電子メール通知にRunbook URLが適用されます。また、担当者が地理的に異なる場所にいる場合は、インシデントのUTC時間を参照して簡易にコミュニケーションするか、または自身のタイムゾーンへ切り替えて表示することができます。

インシデントのクローズ

アラートポリシーへ割当られているメンバーは、オーナー、管理者、一般ユーザ、制限ユーザといった権限に関係なく、そのインシデントを手動でクローズできます。多くの違反アラートをかかえたまま数日が経過すると、New Relic Alertsは自動的にインシデントをクローズします。インシデントが起票され、承認され、またはクローズされた場合にのみメンバーへ通知がなされ、同一インシデントで違反アラートがさらに発生しても通知は行われません。追加発生した違反アラートは起票済みのインシデントへ追記されます。

インシデント一覧

インシデントは、違反イベントがいつ開かれたか、いつクローズされたかなど、違反アラートの集まりです。New Relic Alertsには、状態抽出条件によって2つのインシデント・インデックスがあります。

  • オープンインシデント(進行中のインシデント)
  • すべてのインシデント(システム内のすべてのオープンおよびクローズドインシデント)

これにより、パターンをスキミングしたり、個々のインシデントを調べたりするのに役立ちます。 インシデント履歴の詳細を確認して、インシデント全体でイベントチェーンとタイムラインをより簡単に分析することもできます。

アラート詳細

違反アラートページでは、インシデント内のすべての閾値違反の概要を表示したり、個々の違反アラートを選択したり、各違反時のパフォーマンスを詳細に示すチャートを調べたりすることができます。

New Relic Alerts アラート違反詳細

イベントログ詳細

イベントログページでは、アラート条件の個々の閾値に違反したときのチャートと対応する通知を送信したインシデントの履歴を確認できます。

New Relic Alerts イベントログ詳細

 

アラートポリシー

New Relic Alertsの直感的なユーザインタフェースは、New Relicの各プロダクト内の様々なリソース情報を必要数のアラートポリシーおよびアラート条件に容易に関連付けることができます。イベントが指定した閾値に違反した際の通知に必要な諸条件を定義します。New Relic Alertsは、システムのコンポーネント数の大小にかかわらず、アラート設定可能なソリューションを提供します。環境内の特定の部位からアラート設定を開始し、対応組織の拡大に合わせて容易にアラート範囲を最適化することができます。各プロダクト間のイベントをレビューすることで、潜在的な問題パターンを容易に特定でき、それに応じてアラートポリシーを最適化することで、アラート設定の冗長およびアラート通知数を容易に減らすことができます。1つのアラートポリシーには最大100のアラート条件を設定でき、いつでも条件の追加や修正が可能です。また、アラートプリファレンスを設定することで、アラートポリシーやアラート条件に応じて、インシデントへ違反したイベント群を集約して、担当者が受信するアラートの通知数を制御できます。アラートへ単一のクリティカルレベルを設定するか、ワーニングとクリティカルの二段階の閾値を設定するかを選択することもできます。New Relic APMやBrowser等のレスポンスタイムやApdexスコア、New Relic Infrastructureのリソース状況に応じた固定的な閾値による一般的なアラート条件の定義だけでなく、NRQLアラートやベースライン・アラートなど統合的で先進的なアラート条件がサポートされています。

New Relic Alerts アラートポリシー

NRQLアラート

New Relic InsightsのNRQLの返り値をベースにアラート条件を作成できます。1分単位のクエリ間隔でデータを抽出し、抽出したデータをベースに任意のタイムウィンドウでアラート条件を定義できます。各New Relicプロダクトのデータの他、カスタムデータに対するアラート設定が可能となります。

ベースライン・アラート

ベースライン・アラートを使用すると、固定的な閾値ではなく、曜日や季節などパターンが変化するデータや傾向に動的に適応可能なアラート条件を作成できます。 ベースライン・アラートは、運用知見の乏しい新規サービスやシステムの監視や異常なデータのみを検知したい場合にも役立ちます。 この機能は、New Relic APMおよびNew Relic Browserに対して適用できます。
ベースライン・アラートは、そのデータの過去の値を使用して、近未来の値を動的に予測します。この予測値がベースラインとなり、アラート条件の感度を制御する閾値(下図の灰色の帯)を調整します。ベースライン寄りに閾値を近づけると、アラートはより敏感になり、クリティカル(チャートの外側のライトグレーの帯)とワーニング(内側のダークグレーの帯)の二段階の閾値を設定できます。データが予測された閾値範囲から逸脱するとアラートの通知が送信されます。

New Relic Alerts ベースラインアラート

特定Javaインスタンスの異常検知

Javaアプリケーションの個々のインスタンスで条件違反が発生した際にトリガする閾値を設定できます。アプリケーション・インスタンスにアラート条件をスコープすることで、特定のアプリインスタンスのサブセット内でのみ発生する異常を検出するのに役立ちます。多数のインスタンスにわたって分散するアプリケーションでは、この種の異常は簡単に見逃されてしまいがちです。個々のインスタンスをスコープすることで、潜在的な問題の発生源をより迅速に特定するのに役立ちます。

JVMヘルスメトリクス・アラート

個々のJVMのヒープサイズもしくはスレッド数、CPUタイム等が予想外の範囲にある場合にトリガする閾値を設定できます。

パーセンタイル・アラート

New Relic APMのWebアプリケーションのレスポンスタイム・データのアラート閾値条件としてパーセンタイルを定義するオプションがあります。例えば、平均レスポンスタイムではなく、トランザクション応答時間に関するパーセンタイルによる外れ値の発生を警告したい場合などに便利です。Webアプリケーション・レスポンスタイム以外の閾値条件としてパーセンタイルを使用したい場合は、NRQLアラート機能を使用します。

ラベルベース・アラートポリシー条件適用

アプリケーションにラベルを適用することで、対象エンティティをアラートポリシー条件に自動的にリンクできます。 これにより、動的環境内でのアプリケーション管理が容易になります。 アラートポリシー条件に対して最大10個のラベルを追加、編集、または削除できます。

非レポート(可用性)アラート

複数ホストからなるホストグループに対してアラートポリシー条件を適用し、定義した期間(5~60分)を越えて対象ホストのNew Relic Infrastructureエージェント全てからの通信が途絶えた場合にアラートを通知します。動的環境におけるインフラの可用性の監視に役立ちます。

 

通知チャネル統合管理

アラートポリシーは、New Relicで監視するリソース群に対する稼働条件をパッケージ化し、アラートチャネルを介して条件に違反したときに通知すべき担当者やチームを定義します。アラートポリシーを設計する際は、アラートに対応する担当者がシステムアーキテクチャのどの部分に責任を負っているかを考慮する必要があります。通知を必要とするのは誰で、アラートを監視もしくは解決する責任を持つのは誰か。例えば、ソフトウェア開発者は、Webページの応答時間やページ読み込みJavaScriptエラーなど、フロントエンドとバックエンドの両方のパフォーマンスに関するアラートの通知を必要としていますし、運用担当者は、サーバのメモリやロードアベレージなど、バックエンドのパフォーマンスが低下した際にアラートの通知を必要としています。またプロダクトオーナーは、ユーザ数の増加時におけるApdexスコアやNew Relic Insightsで監視しているARRレベルなど、フロントエンドのパフォーマンスについてアラートの通知を必要とします。運用チームのSlackチャネルを一般的なアラートレベルとして設定し、PagerDutyを時間外もしくはエスカレーション先の担当者のアラートレベルとして使用するといったこともできます。要件に応じて、Webhookでカスタマイズされたメッセージを作成することもできます。

New Relic Alerts 通知チャネル管理

通知チャネル

New Relic Alertsは、アラート条件に応じて、以下の通知チャネルを複合的に使い分けることができます。 New Relic Alertsは、登録したすべてのユーザとその電子メールアドレスを自動的に読み込みます。また、ユーザがモバイルデバイスでNew Relicアプリを使用してNew Relicにログインすると、そのデバイスが登録され、そのデバイスにプッシュ通知することができます。

  • Email
  • Mobileプッシュ通知
  • Slack
  • Campfire
  • HipChat
  • OpsGenie
  • PagerDuty
  • VictorOps
  • xMatters
  • Webhooks

 

PROプランのすべての機能を
30日間無料でお試し

新規無料登録いただくとPROプランのすべての機能を
30日間無料でお試しいただけます。
クレジットカードなど決済情報の登録は不要です。

各プランの詳細はこちらからご確認ください。