linux性能问题（CPU，内存，磁盘I/O，网络）( 转载）

浏览数：19 / 时间：2015年06月20日

一. CPU性能评估

1.vmstat [-V] [-n] [depay [count]]

-V ：打印出版本信息，可选参数

-n ：在周期性循环输出时，头部信息仅显示一次

delay ：两次输出之间的时间间隔

count ：按照delay指定的时间间隔统计的次数。默认是1

如：vmstat 1 3

user1@user1-desktop:~$ vmstat 1 3 procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu---- r b swpd free buff cache si so bi bo in cs us sy id wa 0 0 0 1051676 139504 477028 0 0 46 31 130 493 3 1 95 2 0 0 0 1051668 139508 477028 0 0 0 4 377 1792 3 1 95 0 0 0 0 1051668 139508 477028 0 0 0 0 327 1741 3 1 95 0

r ：运行和等待CPU时间片的进程数（若长期大于CPU的个数，说明CPU不足，需要增加CPU）【注意】

b ：在等待资源的进程数（如等待I/O或者内存交换等）

swpd ：切换到内存交换区的内存数量，单位kB

free ：当前空闲物理内存，单位kB

buff ： buffers cache的内存数量，一般对块设备的读写才需要缓存

cache ： page cached的内存数量，一般作为文件系统cached，频繁访问的文件都会被cached

si ：由磁盘调入内存，即内存进入内存交换区的数量

so ：内存调入磁盘，内存交换区进入内存的数量

bi ：从块设备读入数据的总量，即读磁盘，单位kB/s

bo ：写入到块设备的数据总量，即写磁盘，单位kB/s

in ：某一时间间隔中观测到的每秒设备中断数

cs ：每秒产生的上下文切换次数

us ：用户进程消耗的CPU时间百分比【注意】

sy ：内核进程消耗CPU时间百分比【注意】

id ： CPU处在空闲状态的时间百分比【注意】

wa ：IO等待所占用的CPU时间百分比

如果si、so的值长期不为0，表示系统内从不足，需要增加系统内存

bi+bo参考值为1000，若超过1000，且wa较大，表示系统IO有问题，应该提高磁盘的读写性能

in与cs越大，内核消耗的CPU时间就越多

us+sy参考值为80%，如果大于80%，说明可能存在CPU资源不足的情况

综上所述，CPU性能评估中重点注意r、us、sy和id列的值。

2. sar [options] [-o filename] [interval [count] ]

options：

-A ：显示系统所有资源设备(CPU、内存、磁盘)的运行状态

-u ：显示系统所有CPU在采样时间内的负载状态

-P ：显示指定CPU的使用情况（CPU计数从0开始）

-d ：显示所有硬盘设备在采样时间内的使用状况

-r ：显示内存在采样时间内的使用状况

-b ：显示缓冲区在采样时间内的使用情况

-v ：显示进程、文件、I节点和锁表状态

-n ：显示网络运行状态。参数后跟DEV（网络接口）、EDEV（网络错误统计）、SOCK（套接字）、FULL（显示其它3个参数所有）。可单独或一起使用

-q ：显示运行队列的大小，与系统当时的平均负载相同

-R ：显示进程在采样时间内的活动情况

-y ：显示终端设备在采样时间内的活动情况

-w ：显示系统交换活动在采样时间内的状态

-o ：将命令结果以二进制格式存放在指定的文件中

interval ：采样间隔时间，必须有的参数

count ：采样次数，默认1

如：sar -u 1 3

user1@user1-desktop:~$ sar -u 1 3 Linux 2.6.35-27-generic (user1-desktop) 2011年03月05日 _i686_ (2 CPU)
09时27分18秒 CPU %user %nice %system %iowait %steal %idle 09时27分19秒 all 1.99 0.00 0.50 5.97 0.00 91.54 09时27分20秒 all 3.90 0.00 2.93 5.85 0.00 87.32 09时27分21秒 all 2.93 0.00 1.46 4.39 0.00 91.22 平均时间: all 2.95 0.00 1.64 5.40 0.00 90.02

%user ：用户进程消耗CPU时间百分比

%nice ：运行正常进程消耗CPU时间百分比 %system ：系统进程消耗CPU时间百分比

%iowait ： IO等待多占用CPU时间百分比

%steal ：内存在相对紧张坏经下pagein强制对不同页面进行的steal操作

%idle ： CPU处在空闲状态的时间百分比

3. iostat [-c | -d] [-k] [-t] [-x [device]] [interval [count]]

-c ：显示CPU使用情况

-d ：显示磁盘使用情况

-k ：每秒以k bytes为单位显示数据

-t ：打印出统计信息开始执行的时间

-x device ：指定要统计的磁盘设备名称，默认为所有磁盘设备

interval ：制定两次统计时间间隔

count ：统计次数

如： iostat -c

user1@user1-desktop:~$ iostat -c Linux 2.6.35-27-generic (user1-desktop) 2011年03月05日 _i686_ (2 CPU)
avg-cpu: %user %nice %system %iowait %steal %idle 2.51 0.02 1.27 1.40 0.00 94.81

(每项代表的含义与sar相同)

4. uptime ，如：

user1@user1-desktop:~$ uptime 10:13:30 up 1:15, 2 users, load average: 0.00, 0.07, 0.11

显示的分别是：系统当前时间，系统上次开机到现在运行了多长时间，目前登录用户个数，系统在1分钟内、5分钟内、15分钟内的平均负载

注意：load average的三个值一般不能大于系统CPU的个数，否则说明CPU很繁忙

二 . 内存性能评估

1. free

2. watch 与 free 相结合，在watch后面跟上需要运行的命令，watch就会自动重复去运行这个命令，默认是2秒执行一次，如：

Every 2.0s: free Sat Mar 5 10:30:17 2011
total used free shared buffers cached Mem: 2060496 1130188 930308 0 261284 483072 -/+ buffers/cache: 385832 1674664 Swap: 3000316 0 3000316

(-n指定重复执行的时间，-d表示高亮显示变动)

3.使用vmstat，关注swpd、si和so

4. sar -r，如：

user1@user1-desktop:~$ sar -r 2 3 Linux 2.6.35-27-generic (user1-desktop) 2011年03月05日 _i686_ (2 CPU)
10时34分11秒 kbmemfree kbmemused %memused kbbuffers kbcached kbcommit %commit 10时34分13秒 923548 1136948 55.18 265456 487156 1347736 26.63 10时34分15秒 923548 1136948 55.18 265464 487148 1347736 26.63 10时34分17秒 923548 1136948 55.18 265464 487156 1347736 26.63 平均时间: 923548 1136948 55.18 265461 487153 1347736 26.63

kbmemfree ：空闲物理内存

kbmemused ：已使用物理内存

%memused ：已使用内存占总内存百分比

kbbuffers ： Buffer Cache大小

kbcached ： Page Cache大小

kbcommit ：应用程序当前使用内存大小

%commit ：应用程序使用内存百分比

三 . 磁盘I/O性能评估

1. sar -d ，如：

user1@user1-desktop:~$ sar -d 1 3 Linux 2.6.35-27-generic (user1-desktop) 2011年03月05日 _i686_ (2 CPU)
10时42分27秒 DEV tps rd_sec/s wr_sec/s avgrq-sz avgqu-sz await svctm %util 10时42分28秒 dev8-0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
10时42分28秒 DEV tps rd_sec/s wr_sec/s avgrq-sz avgqu-sz await svctm %util 10时42分29秒 dev8-0 2.00 0.00 64.00 32.00 0.02 8.00 8.00 1.60
10时42分29秒 DEV tps rd_sec/s wr_sec/s avgrq-sz avgqu-sz await svctm %util 10时42分30秒 dev8-0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
平均时间: DEV tps rd_sec/s wr_sec/s avgrq-sz avgqu-sz await svctm %util 平均时间: dev8-0 0.67 0.00 21.33 32.00 0.01 8.00 8.00 0.53

DEV ：磁盘设备名称

tps ：每秒到物理磁盘的传送数，即每秒的I/O流量。一个传送就是一个I/O请求，多个逻辑请求可以被合并为一个物理I/O请求

rc_sec/s：每秒从设备读入的扇区数（1扇区=512字节）

wr_sec/s ：每秒写入设备的扇区数目

avgrq-sz ：平均每次设备I/O操作的数据大小（以扇区为单位）

avgqu-sz ：平均I/O队列的长度

await ：平均每次设备I/O操作的等待时间（毫秒）

svctm ：平均每次设备I/O 操作的服务时间（毫秒）

%util ：一秒中有百分之几的时间用用于I/O操作

正常情况下svctm应该小于await，而svctm的大小和磁盘性能有关，CPU、内存的负荷也会对svctm值造成影响，过多的请求也会简介导致svctm值的增加。

await的大小一般取决与svctm的值和I/O队列长度以及I/O请求模式。如果svctm与await很接近，表示几乎没有I/O等待，磁盘性能很好；如果await的值远高于svctm的值，表示I/O队列等待太长，系统上运行的应用程序将变慢，此时可以通过更换更快的硬盘来解决问题。

%util若接近100%，表示磁盘产生I/O请求太多，I/O系统已经满负荷地在工作，该磁盘可能存在瓶颈。长期下去，势必影响系统的性能，可通过优化程序或者通过更换更高、更快的磁盘来解决此问题。

2. iostat -d

user1@user1-desktop:~$ iostat -d 2 3 Linux 2.6.35-27-generic (user1-desktop) 2011年03月05日 _i686_ (2 CPU)
Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn sda 5.89 148.87 57.77 1325028 514144
Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn sda 0.00 0.00 0.00 0 0

Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn sda 0.00 0.00 0.00 0 0 Blk_read/s ：每秒读取的数据块数

Blk_wrtn/s ：每秒写入的数据块数

Blk_read ：读取的所有块数

Blk_wrtn ：写入的所有块数

如果Blk_read/s很大，表示磁盘直接读取操作很多，可以将读取的数据写入内存中进行操作；如果Blk_wrtn/s很大，表示磁盘的写操作很频繁，可以考虑优化磁盘或者优化程序。这两个选项没有一个固定的大小，不同的操作系统值也不同，但长期的超大的数据读写，肯定是不正常的，一定会影响系统的性能。

3. iostat -x /dev/sda 2 3 ，对指定磁盘的单独统计

4. vmstat -d

四 . 网络性能评估

1. ping

time值显示了两台主机之间的网络延时情况，若很大，表示网络的延时很大。packets loss表示网络丢包率，越小表示网络的质量越高。

2. netstat -i ，如：

user1@user1-desktop:~$ netstat -i Kernel Interface table Iface MTU Met RX-OK RX-ERR RX-DRP RX-OVR TX-OK TX-ERR TX-DRP TX-OVR Flg eth0 1500 0 6043239 0 0 0 87311 0 0 0 BMRU lo 16436 0 2941 0 0 0 2941 0 0 0 LRU

Iface ：网络设备的接口名称

MTU ：最大传输单元，单位字节

RX-OK / TX-OK ：准确无误地接收 / 发送了多少数据包

RX-ERR / TX-ERR ：接收 / 发送数据包时产生了多少错误

RX-DRP / TX-DRP ：接收 / 发送数据包时丢弃了多少数据包

RX-OVR / TX-OVR ：由于误差而遗失了多少数据包

Flg ：接口标记，其中：

L ：该接口是个回环设备

B ：设置了广播地址

M ：接收所有的数据包

R ：接口正在运行

U ：接口处于活动状态

O ：在该接口上禁用arp

P ：表示一个点到点的连接

正常情况下，RX-ERR，RX-DRP，RX-OVR，TX-ERR，TX-DRP，TX-OVR都应该为0，若不为0且很大，那么网络质量肯定有问题，网络传输性能也一定会下降。

当网络传输存在问题时，可以检测网卡设备是否存在故障，还可以检查网络部署环境是否合理。

3. netstat -r （default行对应的值表示系统的默认路由）

4. sar -n ，n后为DEV（网络接口信息）、EDEV（网络错误统计信息）、SOCK（套接字信息）、和FULL（显示所有）

wangxin@wangxin-desktop:~$ sar -n DEV 2 3 Linux 2.6.35-27-generic (wangxin-desktop) 2011年03月05日 _i686_ (2 CPU)
11时55分32秒 IFACE rxpck/s txpck/s rxkB/s txkB/s rxcmp/s txcmp/s rxmcst/s 11时55分34秒 lo 2.00 2.00 0.12 0.12 0.00 0.00 0.00 11时55分34秒 eth0 2.50 0.50 0.31 0.03 0.00 0.00 0.00
11时55分34秒 IFACE rxpck/s txpck/s rxkB/s txkB/s rxcmp/s txcmp/s rxmcst/s 11时55分36秒 lo 0.00 0.00 0.00 0.00 0.00 0.00 0.00 11时55分36秒 eth0 1.50 0.00 0.10 0.00 0.00 0.00 0.00
11时55分36秒 IFACE rxpck/s txpck/s rxkB/s txkB/s rxcmp/s txcmp/s rxmcst/s 11时55分38秒 lo 0.00 0.00 0.00 0.00 0.00 0.00 0.00 11时55分38秒 eth0 14.50 0.00 0.88 0.00 0.00 0.00 0.00
平均时间: IFACE rxpck/s txpck/s rxkB/s txkB/s rxcmp/s txcmp/s rxmcst/s 平均时间: lo 0.67 0.67 0.04 0.04 0.00 0.00 0.00 平均时间: eth0 6.17 0.17 0.43 0.01 0.00 0.00 0.00