ZabbixでCPU等のデータが取得できなくなった場合の対処法

Zabbixで監視をしているサーバーにおいて,ある時から突然,CPUやメモリの使用率などの情報が取れなくなってしまうことがあります。

ストレージの健全性など,取得で来ているデータもあるため,再起動などのタイミングでそのうち解消するだろうと思って放置していても,一向に解消する気配がありません。

Zabbixでサーバーのパフォーマンス情報が取れなくなってしまう時には,どのような原因が考えられるのでしょうか。そしてどのような対処策があるでしょうか。

パフォーマンスカウンタに異常が生じている

この場合は恐らく,Windows Serverのパフォーマンスカウンタの機能に異常が生じている可能性が高いです。

それで,パフォーマンスカウンタを再構築する以下のコマンドを流してみましょう。

cd c:\Windows\System32
lodctr/R
cd c:\windows\SysWOW64
lodctr/R

そして,WMIを持つカウンターを再同期させるための以下のコマンドを実行します。

winmgmt.exe /resyncperf

そののち,Zabbixのサービスを再起動しましょう。

これで,10分程度待ってみて,カウンターの値がZabbixから取得可能になったかどうかを確認してみてください。

lodctr/Rコマンドでエラーが出る場合

lodctr/Rコマンドを実行すると以下のようなエラーが出る場合があります。

Error: Unable to rebuild performance counter setting from system backup store, error code is 2

そのような場合には,もう一度同じlodctr/Rコマンドを流してみてください。
すると,成功することがあります。

Info: Successfully rebuilt performance counter setting from system backup store
Error: Unable to rebuild performance counter setting from system backup store, error code is 2

Error: Unable to rebuild performance counter setting from system backup store, error code is 2

以上,ZabbixでCPUやメモリ等のデータが取得できなくなった場合の対処法でした。

コメント