ZabbixでCPU等のデータが取得できなくなった場合の対処法

Zabbixで監視をしているサーバーにおいて,ある時から突然,CPUやメモリの使用率などの情報が取れなくなってしまうことがあります。

ストレージの健全性など,取得で来ているデータもあるため,再起動などのタイミングでそのうち解消するだろうと思って放置していても,一向に解消する気配がありません。

Zabbixでサーバーのパフォーマンス情報が取れなくなってしまう時には,どのような原因が考えられるのでしょうか。そしてどのような対処策があるでしょうか。

続きを読む

【保存版】ITモニタリング(統合監視)おすすめ入門書籍3選

社内のIT機器や提供しているサービスを監視することは,どの組織でも必須でしょう。しかし,何をどのように監視するかに関する最適解を見つけることは簡単ではありません。

とりあえず,Zabbixなど有名なサービスを導入して,アラートをメールで知らせるということを行っている組織もあるでしょう。

しかし,それですべての障害に首尾よく対処できていると満足している組織はそう多くないのではないでしょうか。

もし現状のモニタリングに満足できていないとしたら,もしかすると,モニタリングとは何をすべきなのかを体系的に学んでいないことからくる認識のずれなのかもしれません。

それで,これからIT機器やサービスのモニタリングを行おうと思っておられる方や,その方法を改善したいと思っておられる方にとって,おすすめの書籍を3冊ご紹介したいと思います。

どれも良書ですので,モニタリングを組織的に行っていくのであれば,ぜひ読んでおきたい書籍です。
続きを読む