[問題] 想做服務監控自動重啟

作者: chabaterii09 (小豆子)   2017-11-15 10:48:34
板上的大大們好
小弟我最近要做系統服務的死活監控
監控的項目包含
httpd snmp named nginx redis-server node mysqld mongod PM2 memcached
服務都有加上enable自動啟動
為了保險
寫了一隻script 確認運作期間的狀態
systemctl status $line | grep running && echo "$line OK" || echo "$line error
!"
但是考慮到服務hang住
或是重啟一直失敗之類的狀況
想請教除了我這種使用systemctl及service status的方式
或是telnet確認port狀態 , wget針對網頁服務測試
還有沒有別的方式呢?
作者: kenduest (小州)   2017-11-15 12:33:00
nagios ? 你大概需要這種監視服務只是老實說稍微複雜,不是非常易用的軟體
作者: lantw44 (#######################)   2017-11-15 13:23:00
systemd service 檔案有個 Restart= 選項可以自動服務可以先用 man systemd.service 看看這功能是否適合使用再用 systemctl edit 把 Restart= 參數加上去是正常的,因為 systemctl edit 的作法是在/etc/systemd/system 底下建一個資料夾在裡面寫 .conf 檔這樣就不會直接動到 service 檔,更新時才不會被覆寫掉改完可以用 systemctl cat 看到一個服務有多少這種檔案
作者: kojj (我先想想)   2017-11-15 15:05:00
Ubuntu 有一個monit 的套件,預設就可以監控httpd等常用服務範例說明 goo.gl/WEkmyMcentos 也有這套件 goo.gl/qd8js8
作者: chang505 (眼線)   2017-11-15 23:23:00
svscannagios 裝起來一堆寫好的 plugin 隨插即用 哪裡困難阿
作者: soem (流水)   2017-11-16 01:25:00
munin + monit
作者: laputaflutin (很恐怖,不要問)   2017-11-16 23:09:00
supervisord...怎麼沒人提呢?跟systems 是同類的東西,如果只是要重啟夠用了,有web gui跟導log的功能,不過你這麼多服務,學個經典的nagios啊,介面是有點陽春,但是你提到的那些全部都有現成的plugin,上手後隨插即用
作者: mmis1000 (秋月戀楓)   2017-11-18 20:00:00
mongod異常退出的話,是無法直接重啟的,因為會被lock file卡住,要先下完 --repair 才有辦法重新打開
作者: suaw (suaw)   2017-11-28 04:37:00
keepalived 運用在NGINX httpd應該是沒問題,其他服務沒試過,給您參考

Links booklink

Contact Us: admin [ a t ] ucptt.com