天天看点

linux 系统性能分析工具,Linux 系统性能分析工具 sar

sar(System Activity Reporter系统活动情况报告)是目前 Linux 上最为全面的系统性能分析工具之一,可以

从多方面对系统的活动进行报告,包括:文件的读写情况、系统调用的使用情况、磁盘I/O、CPU效率、内存使用状况、

进程活动及IPC有关的活动等。本文主要以CentOS 6.3 x64系统为例,介绍sar命令。

格式

sar [options] [-A] [-o file] t [n]

参数

说明

t

为采样间隔,默认是秒

n

为采样次数,默认是1

-o

file 表示将命令结果以二进制格式存放在文件中,file是文件名

-A

所有报告的总和

-u

输出CPU使用情况的统计信息

-v

输出inode,文件和其他内核表的统计信息

-d

输出每一个块设备的活动信息

-r

输出内存和交换空间的统计信息

-b

显示I/O和传送速率的统计信息

-a

文件读写情况

-c

输出进程统计信息,每秒创建的进程数

-R

输出内存页面的统计信息

-y

终端设备活动情况

-w

输出系统交换活动信息

CPU 资源监控

sar -u -o test 8 4

Linux 2.6.32-358.el6.x86_64 (nagios_s1) 11/12/15 _x86_64_ (1 CPU)

16:07:18 CPU %user %nice %system %iowait %steal %idle

16:07:26 all 0.00 0.00 0.00 0.00 0.00 100.00

16:07:34 all 0.00 0.00 0.00 0.00 0.00 100.00

16:07:42 all 0.00 0.00 0.00 0.00 0.00 100.00

16:07:50 all 0.00 0.00 0.00 0.00 0.00 100.00

Average: all 0.00 0.00 0.00 0.00 0.00 100.00

%user : 显示在用户级别(application)运行使用CPU总时间的百分比。

%nice : 显示在用户级别,用于nice操作(进程优先级切换),所占用CPU总时间的百分比

%system : 在核心级别(kernel) 运行所使用CPU总时间的百分比。

%iowait : 显示用于等待I/O操作占用CPU总时间的百分比。

%steal : 管理程序(hypervisor)为另一虚拟进程提供服务而等待虚拟CPU的百分比。

%idle : 显示CPU空闲时间占用CPU总时间的百分比。

1.若 %iowait 的值过高,表示硬盘存在I/O瓶颈

2.若 %idle 高但是系统响应慢时,可能是CPU等待分配内存,此时应加大内存容量

3.若 %idle 的值持续低于1,则系统的CPU处理能力相对较低,表明系统中最需要解决的资源是CPU。

如果要查看二进制文件 test 中的内容,需键入如下sar命令:

sar -u -f test

监控inode、文件和其他内核表

sar -v 8 4

Linux 2.6.32-358.el6.x86_64 (nagios_s1) 11/12/15 _x86_64_ (1 CPU)

16:32:40 dentunusd file-nr inode-nr pty-nr

16:32:48 5296 288 7672 2

16:32:56 5296 288 7672 2

16:33:04 5296 288 7672 2

16:33:12 5296 288 7672 2

Average: 5296 288 7672 2

dentunusd : 目录高速缓存中未被使用的条目数量

file-nr : 文件句柄(file handle) 的使用数量

inode-nr : 索引节点句柄(inode handle) 的使用数量

pty-nr : 使用的pty数量

监控内存和交换空间

sar -r 8 4

Linux 2.6.32-358.el6.x86_64 (nagios_s1) 11/12/15 _x86_64_ (1 CPU)

16:41:15 kbmemfree kbmemused %memused kbbuffers kbcached kbcommit %commit

16:41:23 301116 200320 39.95 10688 147824 56648 2.77

16:41:31 301116 200320 39.95 10688 147824 56648 2.77

16:41:39 301116 200320 39.95 10688 147824 56648 2.77

16:41:47 301116 200320 39.95 10688 147824 56648 2.77

Average: 301116 200320 39.95 10688 147824 56648 2.77

-r Report memory utilization statistics. The following values are displayed:

kbmemfree : 这个值和free命令中的free值基本一致,所以它不包括buffer和cache的空间.

kbmemused : 这个值和free命令中的free值基本一致,所以它不包括buffer和cache的空间.

%memused : 这个值是kbmemused和内存总量(不包括swap)的一个百分比.

kbbuffers :这个值就是free命令中的buffer.

kbcached :这个值就是free命令中的cache.

kbcommit :保证当前系统所需要的内存,即为了确保不溢出而需要的内存(RAM+swap).

%commit :这个值是kbcommit与内存总量(包括swap)的一个百分比.

内存分页监控

sar -B 8 4

Linux 2.6.32-358.el6.x86_64 (nagios_s1) 11/13/15 _x86_64_ (1 CPU)

11:08:48 pgpgin/s pgpgout/s fault/s majflt/s pgfree/s pgscank/s pgscand/s pgsteal/s %vmeff

11:08:56 0.00 0.00 4.25 0.00 9.25 0.00 0.00 0.00 0.00

11:09:04 0.00 0.00 5.25 0.00 10.75 0.00 0.00 0.00 0.00

11:09:12 0.00 0.00 3.75 0.00 8.89 0.00 0.00 0.00 0.00

11:09:20 0.00 0.00 3.75 0.00 10.11 0.00 0.00 0.00 0.00

Average: 0.00 0.00 4.25 0.00 9.75 0.00 0.00 0.00 0.00

Report paging statistics. The following values are displayed:

pgpgin/s: 表示每秒从磁盘或SWAP置换到内存的字节数(KB)

pgpgout/s: 表示每秒从内存置换到磁盘或SWAP的字节数(KB)

fault/s: 每秒钟系统产生的缺页数,即主缺页与次缺页之和(major + minor)

majflts/s: 每秒钟产生的主缺页数

pgfree/s: 每秒被放入空闲队列中的页个数

pgscank/s: 每秒被kswapd扫描的页个数

pgscand/s: 每秒直接被扫描的页个数

pgsteal/s: 每秒钟从cache中被清除来满足内存需要的页个数

%vmeff: 每秒清除的页(pgsteal)占总扫描页(pgscank+pgscand)的百分比

什么是缺页

当CPU请求一个不在RAM中的内存页时,会发生缺页,比如我们从内存读取/写入数据,而数据未在内存,此时都会发生缺页.

major表示主缺页,主缺页是要求输入/输出到磁盘的缺页.

minor表示次缺页,次缺页是任何其它的缺页.

I/O和传送速率监控

sar -b 8 4

Linux 2.6.18-308.el5xen (tlsgzsit01) 11/13/2015

12:04:30 PM tps rtps wtps bread/s bwrtn/s

12:04:38 PM 10.92 0.00 10.92 0.00 116.44

12:04:46 PM 1.75 0.00 1.75 0.00 53.13

12:04:54 PM 2.23 0.00 2.23 0.00 61.46

12:05:02 PM 1.25 0.00 1.25 0.00 24.94

Average: 4.03 0.00 4.03 0.00 63.92

tps : 每秒钟物理设备的 I/O 传输总量

rtps : 每秒钟从物理设备读入的数据总量

wtps : 每秒钟向物理设备写入的数据总量

bread/s : 每秒中从物理设备读入的数据量,单位为 块/s

bwrtn/s : 每秒中从物理设备写入的数据量,单位为 块/s

查看运行队列中的进程数、系统上的进程大小、平均负载等

sar 与其它命令相比,它能查看各项指标随时间变化的情况;

sar -q

Linux 3.10.0-123.el7.x86_64 (localhost.localdomain) 11/02/2017 _x86_64_ (2 CPU)

12:00:01 AM runq-sz plist-sz ldavg-1 ldavg-5 ldavg-15 blocked

12:10:01 AM 0 150 0.00 0.01 0.05 0

12:20:01 AM 0 150 0.00 0.01 0.05 0

12:30:01 AM 2 150 0.00 0.01 0.05 0

12:40:01 AM 0 150 0.00 0.01 0.05 0

12:50:01 AM 0 150 0.00 0.01 0.05 0

01:00:01 AM 1 150 0.00 0.01 0.05 0

01:10:01 AM 1 150 0.00 0.01 0.05 0

01:20:01 AM 0 150 0.00 0.01 0.05 0

01:30:01 AM 0 150 0.00 0.01 0.05 0

01:40:01 AM 1 150 0.00 0.01 0.05 0

01:50:01 AM 1 150 0.00 0.01 0.05 0

02:00:01 AM 0 150 0.00 0.01 0.05 0

02:10:01 AM 0 150 0.00 0.01 0.05 0

02:20:01 AM 0 150 0.00 0.01 0.05 0

02:30:01 AM 0 150 0.00 0.01 0.05 0

runq-sz:运行队列的长度(等待运行的进程数)

plist-sz:进程列表中进程(processes)和线程(threads)的数量

ldavg-1:最后1分钟的系统平均负载

ldavg-5:过去5分钟的系统平均负载

ldavg-15:过去15分钟的系统平均负载