Linux系统的服务器巡检怎么做?一个服务器的快速巡检思路,经典 |
如何不使用监控软件来完成一个每天一次的Linux服务器巡检工作(服务器的版本为红帽6.4),在这里把我的巡检过程和巡检脚本放送给大家做一参考。 具体的巡检内容如下 1、 CPU占用率 检查脚本:top shift+m c 这里需要记录的参数是?%us,建议稍等几秒看下动态变化再记录。 2、内存使用率 检查脚本:free-m /free -g 这里重点需要看的是swap内存是否被使用了,需要记录的是第二行的第二个,它和总内存量的比值就是内存的使用率。具体使用-m还是-g,就看服务器内存大小了 3、硬盘使用率 检查脚本:df 磁盘使用率看的就是磁盘使用率本身了,这里如果服务器下的应用单独使用了挂载的磁盘,还需要单独查看挂载磁盘的使用率 4、 I/O空闲 检查脚本:iostat -xm 需要记录的值就是图中红色框住的,?%idle,这个就是I/O空闲 。这里可以使用iostat -xm 1,动态查看多个值了之后取一个比较平均的。 5、应用运行状况 查看应用的页面是否正常,用户是否使用正常。 6、应用服务状态 检查脚本:./应用服务 status 查看是否服务状态为running。 7、应用服务运行日志是否有报错 检查脚本:cat 应用服务运行日志| grep ERR 直观查看应用服务运行的日志中是否有报错,这里也可以直接打开查看: vim 应用服务运行日志 然后用“/ERR”查看报错 8、应用内容记录日志是否有报错 检查脚本:cat 应用内容记录日志 grep ERR 9、数据文件大小 首先,打开应用数据文件所在的目录,然后运行:du -sh * 这里可以看到此目录下所有文件的大小。 10、归档文件状态 这个是我负责的应用的一个特殊功能,可以归档,所有有这个需求,大家可以忽略。 11、备份执行情况 在备份目录下查看备份最新的日期是否最近。 以上内容为日常的数据库巡检全部内容,希望对大家的工作有用! |