IDC の Worldwide CIO Agenda 2019 Predictions では、2021年までに CIO(最高情報責任者)の 70% が機械学習とデータサイエンス技術に投資し、IT 運用管理の俊敏性と革新性を高めると予測しています。AI を活用した未来において、企業は、問題認識、インパクト分析、異常検知、根本原因分析、インシデント解決など、さまざまな IT 運用のユースケースに対応するために、高度なアナリティクスへの依存度を高めることになるでしょう。
消費者は、Amazon で本を購入したり、Netflix で映画を見たり、Spotify でバンドを聴いたりする際に、目に見えないアルゴリズムに頼ることがありますが、AI ベースの推奨の透明性、説明責任、有効性については、広く懸念されています。OpsRamp が最近発表した「AIOps の実態調査」レポートによると、「回答者の 67% が、AIOps ツールが提供するインサイトの関連性と信頼性に懸念を抱いている」 ことが明らかになりました。
マシン・インテリジェンスが IT オペレーション機能全体で重要な役割を担うようになると、技術担当の責任者は、IT パフォーマンス管理のための分析アプローチに対する信頼と自信を早急に構築する必要があります。機械学習に基づく推奨は不透明で理解が難しいことが多いため、IT 実務者はどのようにしてアルゴリズムへの嫌悪感を克服し、AIOps のインサイトの説明可能性を確保するのでしょうか?
OpsRamp のサービス中心の AIOps プラットフォームは、ビジネスクリティカルなエンタープライズサービスの信頼性と可用性を確保することがすべてです。今回、2019年夏リリースで OpsQ Observed Mode を導入し、IT イベント相関の機械学習機能の導入を加速し、DevOps チームが AIOps ツールがどのようにして特定の因果関係分析結果に到達するかを学習できるようにします。
OpsQ は、OpsRamp のインテリジェントなイベント管理、アラート相関、修復のソリューションです。OpsQ Observed Mode は、シャドーモードでアラートの推論をシミュレートすることで、IT チームがイベントボリューム削減の可能性を理解するのに役立ちます。OpsQ Observed Mode を使用することで、IT チームは実際の推論を作成することなく、最新のワークロードとレガシーワークロードにまたがる機械学習を利用したイベント相関の包括的な保証モデルを構築することができます。
図1 - OpsQ Observed Mode を使用すると、シャドーモードで AIOps の推奨を確認できます
セットアップ時にトグルを切り替えるだけで、OpsQ Observed Modeを有効にし、ライブ・アラート・ストリームのイベント相関パターンを示すシャドー推論を表示できます。Observed Mode により、本番環境で AIOps を有効にする前に、OpsQ のアラート推論モデル(アルゴリズムおよび共起)の有効性をプレビューできます。
OpsQ Observed Mode は、既存のインシデント管理ワークフローに影響を与えることなく、迅速に AIOps 導入を開始し、試験的に導入するための手段と考えてください。OpsQ Observed Mode を使用することで、アラートの相関関係のためのアルゴリズムの推奨事項を検討するだけでなく、運用上のニーズに合わせて OpsQ エンジンを最適化することができます。
OpsRamp のサービス中心の AIOps プラットフォームは、さまざまな IT 管理ツールから多種多様なネイティブおよびサードパーティのイベントを消費し、データレイク内のアラートを正規化および分析して有意義なパターン認識を行い、オンコール・スケジュールを使用してマルチチャネルのアラート通知をエスカレーションします。Observed Mode は、OpsQ エンジンを実際にオンにしなくても、インテリジェントなイベントの相関関係をアクションで確認できるようにします。IT チームは OpsQ Observed Mode を使用して、AIOps プラットフォームがダイナミックワークロード全体の異常を効果的に検出し、どのビジネスクリティカルなサービスが停止しているかを把握し、未解決のインシデントに根本原因を割り当てることができるかを評価することができます。
図2 - OpsQ Observed Mode を使用して、クリティカルで劣化したネットワーク・メッシュ・パフォーマンスを特定
Written by Prasad Dronamraju
本記事は、OpsRamp の Web サイトにて公開されたブログを翻訳して掲載しています。