むじんブログ ”3歩進んで2歩下がる”

37歳未経験からのエンジニア転職を目指す営業部長

学習のアウトプット(システム運用の監視)

【監視システム】

サービスが正常に動いているかどうかを自動で確認してくれるシステム。

サービスの提供において最も重要な「サービスが正常に動くこと」を、人の力を使わずに行うことができる。

(人が行うと、膨大な労力が必要かつミスなども起こりやすい)

 

監視には大きく3つの種類がある。

 

・正常にサービスを利用できるための監視

・問題を予防するための監視

・発生した問題の原因特定のための監視

 

【Webシナリオ監視】

結合テストのような工程を本番環境で行なってくれる監視システム。

サービスに正常にアクセスができ、利用できる状態であることを自動で確認してくれる。

 

【インフラ監視】

アプリケーションそのものではなく、裏側のサーバーなどを監視するシステム。

障害の予測・予防を行なってくれる。

例)2つのサーバーのうち1つがダウンしたことで、もう1つのサーバーに

負荷がかかっており、いつサービス停止してもおかしくない状況を

メールやSlackなどで知らせる

 

【原因特定のための監視】

これもインフラ監視の仕事の1つ。

システムは、小さなシステム同士のつながりによって成立している。

そのため、1つのシステムだけではなく、各システム間の連携なども併せて監視をすることで、障害の原因などを迅速に特定することができる。

インフラ監視は、システムのつながりも含めた全体を確認し、原因特定にも寄与してくれる。