OpsRamp Blog

OpsRamp によるサーバー監視

何十年もの間、コンピューターやサーバーインフラストラクチャはITの世界のバックボーンでした。 コンピューターはオンプレミスのハードウェアからソフトウェアコンテナの形でプログラム可能なコンピューターへと徐々に進化してきました。 IT 管理者は、Windows、Linux、およびコンテナーインフラストラクチャのパフォーマンスを常に監視して、ワークロードの需要に合わせてコンピューティング環境を最適化できるようにする必要があります。

OpsRamp のサーバー監視機能には、分析と修復のためのパフォーマンスの洞察を提供するためのエージェントベースの手法とエージェントレスの手法の両方があります。 このブログでは、Windows、Linux、およびコンテナー全体のサーバーモニタリングのユースケースについて、メトリック、アラート、インシデント、レポート、およびダッシュボードの詳細とともに取り上げています。

Windows

サービス監視

Windows オペレーティングシステム(OS)の機能を開始、無効化、および停止するために、さまざまなサービスが使用されます。 サービス監視は、Windows OS サービスを検出し、サービスが機能を停止したときにアラートを送信し、Runbook の自動化を使用してサービスを再開します。 ユーザーは、既存のアクセス権限に基づいて、OpsRampUI から Windows OS サービスを開始および停止することもできます。

サービス監視

イベントログの監視

イベントログは、Windows Server 環境のカスタムアプリケーション、オペレーティングシステム、およびインフラストラクチャのパフォーマンスを追跡します。 イベントログの監視には、事前定義されたソースと、イベントログのソースを定義するオプション、および監視用のイベント ID とメッセージを含めたり除外したりする機能があります。

イベントログの監視

Linux

プロセス監視

Linux プロセスは、ビジネスクリティカルなワークロードと基盤となるコンピューティングインスタンスのパフォーマンスを管理します。 プロセスアクティビティの監視は、CPU とメモリの使用率のメトリックを集約して、CPU を集中的に使用するプロセスに関する動的な洞察を提供します。

イベントログの監視

Syslog モニタリング

OpsRamp は、システムレベルのログエラーを監視します。このモニターにより、管理者がパフォーマンスのボトルネックを処理し、Linux サーバー全体のシステムの脆弱性に対応できるようになります。

イベントログの監視

コンテナモニタリング

OpsRamp は、オンプレミス環境とマルチクラウド環境全体で個々の Docker ホストと Kubernetes クラスターを監視できます。 ネイティブ Linux エージェントと K8s エージェントは、クラスター、ポッド、イメージ、名前、ホスト DNS、デーモンセット、レプリカセット、およびサービス全体のホストのパフォーマンスを検出および監視します。

コンテナモニタリング

メトリック

IT チームは、すぐに使用できるモニターを使用して、Windows および Linux オペレーティングシステムのさまざまなバージョンおよびディストリビューションにわたるパフォーマンスメトリックを監視してグラフ化できます。 OpsRamp が Windows および Linux ディストリビューション全体で監視する標準の OS メトリックの一部を次に示します。

メトリック

アラート

アラートは、コンピューティングインフラストラクチャ全体のしきい値違反またはパフォーマンスの低下をITオペレーターに通知するのに役立ちます。 監視ポリシーは、1分間隔でパフォーマンスデータをサンプリングし、履歴分析とリアルタイム分析に基づいてアラートを生成します。

インシデント/通知

IT チームは、電子メールを使用してアラートをインシデントまたは通知にエスカレーションできるため、オンコールの技術者は問題のトラブルシューティングと解決を迅速に行うことができます。

レポート

OpsRamp は、可用性、正常性、およびパフォーマンスのデータを分析して、アプリケーションの所有者、インフラストラクチャオペレーター、およびエグゼクティブチーム向けのスケジュールされたオンデマンドレポートを生成します。 レポートは、コンピューティング環境の容量使用率に関する洞察をもたらし、IT チームが季節的および周期的な傾向をより適切に計画するのに役立ちます。

ダッシュボード

OpsRamp は、IT 運用チームがサーバー環境がどのように機能しているかをよりよく理解するのに役立つ複数のダッシュボードとウィジェットを提供します。

ダッシュボード

OpsRamp は、オンプレミスとクラウド全体のサーバーインフラストラクチャの重要な可用性とパフォーマンスのメトリックをキャプチャ、集約、および表示します。 メトリック、アラート、インシデント、レポート、およびダッシュボードは、IT 運用チームがテクノロジーサービスと基盤となるコンピューティングインスタンスの状態を1か所で分析するのに役立ちます。

Written by Prasad Dronamraju
本記事は、OpsRamp の Web サイトにて公開されたブログを翻訳して掲載しています。