欢迎大家来到IT世界,在知识的湖畔探索吧!
相较于其他网络设备,如交换机、电脑终端等,服务器发生故障的概率较小,但对企业的影响是很大的。一般像无法访问时,大多都是服务器出了问题。作为服务器工程师除了要有服务器基础知识以外,还需要具备服务器故障的诊断思路,这样才能最快速的解决问题也可以减少故障停机时间。
处理报错方法如下:
1. 服务异常的处理流程
2. 负载
2.1 查看机器 cpu 的负载
top -b -n 1 |grep java|awk ‘{print “VIRT:”$5,”RES:”$6,”cpu:”$9″%”,”mem:”$10″%”}’
2.2 查找 cpu 占用率高的线程
top -p 25603 -H
printf 0x%x 25842
jstack 25603 | grep 0x64f2
cat /proc/interrupts
(1)CPU
(2)Memory
(3)IO
(4)Network
可以从以下几个方面监控CPU的信息:
(1)中断;
(2)上下文切换;
(3)可运行队列;
(4)CPU 利用率。
3. 内存
3.1 系统内存
free 命令
[root@server ~]# free
total used free shared buffers cached
Mem: 10000 0
-/+ buffers/cache: 47000
Swap: 80160
这里的默认显示单位是 kb。
各项指标解释
total:总计物理内存的大小。
used:已使用多大。
free:可用有多少。
Shared:多个进程共享的内存总额。
buffers: 磁盘缓存的大小。
cache:磁盘缓存的大小。
-/+ buffers/cached): used:已使用多大,free:可用有多少。
已用内存 = 系统used memory – buffers – cached
(47000 = –)
可用内存 = 系统free memory + buffers + cached
( = 10000++)
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://itzsg.com/81680.html