基于python的Linux系统指定进程性能监控思路详解

栏目：代码类时间：2019-09-12 11:02

监控Linux服务器的工具、组件和程序网上有很多，但是一台服务器上会有很多进程同时运行，特别是做性能测试的时候，可能一台服务器上部署多个服务，如果只监控整个服务器的CPU和内存，当某个服务出现性能问题时，并不能有效准确的定位出（当然通过其他工具也可以实现），因此，很有必要只监控指定的进程。需求明确了，于是动手撸了一个性能监控脚本。

一、整体思路

1、为了方便的启动监控和停止监控，在想查看监控结果的时候随时查看监控结果，用flask开启了一个服务，通过发送get请求可以随时启停监控和查看监控结果。
2、针对控制是否监控cpu、内存、IO，开启多线程监控。
3、为了减少对其他组件的依赖，将监控结果写到日志中。
4、为了方便查看监控结果，直接将结果以html方式返回。

在这里插入图片描述

二、配置文件

config.py

IP = '127.0.0.1'PORT = '5555'LEVEL = 'INFO' # log levelBACKUP_COUNT = 9 # log backup counterLOG_PATH = 'logs' # log pathINTERVAL = 1 # interval, run command interval.SLEEPTIME = 3 # interval, when stopping monitor, polling to start monitor when satisfying condition.ERROR_TIMES = 5 # times, number of running command. When equal, automatically stopped monitor.IS_JVM_ALERT = True # Whether to alert when the frequency of Full GC is too high.IS_MONITOR_SYSTEM = True # Whether to monitor system's CPU and Memory.IS_MEM_ALERT = True # Whether to alert when memory is too low. Alert by sending email.MIN_MEM = 2  # Minxium memory, uint: G# 0: don't clear cache, 1: clear page caches, 2: clear dentries and inodes caches, 3: include 1 and 2;# echo 1 >/proc/sys/vm/drop_cachesECHO = 0SMTP_SERVER = 'smtp.sina.com' # SMTP serverSENDER_NAME = '张三'  # sender nameSENDER_EMAIL = 'zhangsan@qq.com' # sender's emailPASSWORD = 'UjBWYVJFZE9RbFpIV1QwOVBUMDlQUT09' # email password, base64 encode.RECEIVER_NAME = 'baidu_all' # receiver nameRECEIVER_EMAIL = ['zhangsan@qq.com', 'zhangsi@qq.com'] # receiver's emailDISK = 'device1' # Which disk your application runsSTART_TIME = 'startTime.txt' # Store the time of start monitoring.FGC_TIMES = 'FullGC.txt' # Store the time of every FullGC time.# htmlHTML = '<html><body>{}</body><html>'ERROR = '<p style="color:red">{}</p>'HEADER = '<div id="header"><h2 align="center">Performance Monitor (pid={})</h2></div>'ANALYSIS = '<div id="container" style="width:730px; margin:0 auto">{}</div>'

IP和PORT：开启服务的服务器IP和端口，必须和所监控的服务在同一台服务器上；
BACKUP_COUNT：默认为9，即只保留最近9天监控结果；
INTERVAL：两次监控的时间间隔，默认为1s，主要用于cpu和内存监控，当同时监控多个端口或进程时，请将该值设小一点；
ERROR_TIMES：命令执行失败次数，当大于该次数时，则会自动停止监控；主要用于监控指定的进程，如果进程被杀掉，则必须自动停止监控，且必须手动触发再次开始监控；如果监控指定的端口，当端口的进程被杀掉后，也会停止监控，如果端口被重新启动，则自动开始监控；
IS_JVM_ALERT：仅针对java应用，如果频繁FullGC，则邮件提醒；一般性能测试，FullGC的频率不得小于3600秒；
IS_MONITOR_SYSTEM ：是否监控系统总CPU使用率和剩余内存；

上一篇：Josephus环的四种解法(约瑟夫环)基于java详解

下一篇：Spring Cloud Alibaba教程之Sentinel的使用

立即下载 - IIS7 站长工具包