Solaris内存监控 & solaris查看内存使用情况

Solaris内存主要用在以下几个方面:核心,进程,文件系统缓存。如下是监控内存使用的方法。

可用系统物理内存 

分配给Solaris核心的内存数量 

文件系统缓存使用的内存数量 

进程使用的内存数量 

系统剩余的内存数量

Total Physical Memory

使用prtconf命令,察看系统物理内存数量。

prtconf | head -2

System Configuration: Sun Microsystems sun4u

Memory size: 49152 Megabytes

Kernel Memory

使用sar –k察看系统核心占用的内存,如下3个内存池之和即是,单位byte

sar -k 1 1

SunOS lonespappb33 5.8 Generic_117350-13 sun4u 11/28/05

05:39:26 sml_mem alloc fail lg_mem alloc fail ovsz_alloc fail

05:39:28 483386752 202156800 0 4400701440 2886180864 0 656105472 0

File System Caching Memory

文件系统缓存使用系统可用的剩余内存缓存文件。在Solaris上,可用的剩余内存(free memory)大部分情况下总是接近0;Solaris8之前,vmstat 显示的free列表示可用的剩余内存,往往在系统启动(booted)的时候很高,随着系统运行慢慢降低为0,这是正常的,因为文件系统缓存的设计目的就是最大化利用系统可用内存来缓存最经常访问的文件。

在Solaris8中,vmstat 显示的free是系统可用的剩余内存(free memory)和可pageable的文件系统缓存(file system cache memory),man的解释:free size of the free list (Kbytes) 。文件系统缓存也挂在内存Free List上。

vmstat 1 5

procs memory page disk faults cpu

r b w swap free re mf pi po fr de sr s0 s1 s2 s3 in sy cs us sy id

0 1 0 62618064 33156520 5220 0 1144 0 0 0 0 0 1 0 0 8093 47291 1895 9 7 85

如上Solaris 8,vmstat 结果表示,文件系统缓存占用了将近33156520k内存。

Free Memory

由于文件系统缓存总是尽量利用可用的剩余内存缓存文件,因此大部分情况下Free memory总是接近0.

Memory Shortage Detection

系统运行时会不断的page in page out;繁忙的paging操作,可导致Page Scaner运行频繁,因此伴随有较高的scan-rage(sr)和page-out(po);这可以作为系统繁忙paging 的表示。

如果有进程被swap(w>0),则通常表示内存短缺,这时候往往swap设备的IO比较繁忙。

Swap Space

Solaris 交换空间(swap space)有2个重要的状态:保留(swap reservation)和分配(physical swap allocation). 

保留(swap reservation)是指Process创建segment的时候,系统分配给Process虚拟的内存地址空间(virtual memory address space),同时为了保证该segment以后可以被page out到swap,分配给Process与该segment同样大小的虚拟交换空间(virtual swap space). 

例如,process创建一个100M的segment,系统会分配给该process100M的virtual memory address space,但不会分配给process物理内存(physical memory);同时在Swap space中预先保留(reservation)100M虚拟交换空间(virtual swap space). 

分配(physical swap allocation)是指segment driver给process segment分配物理内存时,预先为swap reservation区分配同样大小的物理交换空间(physical swap space),用来page-out.

例如,process在已有100M的virtual memory address space基础上,通过trap/page-fault/zero-fill-on-demand分配到10M的物理内存;同时会为预先保留(reservation)的100M虚拟交换空间(virtual swap space)分配10M物理swap space.

Virtual Swap Space

系统虚拟交换空间的数量为物理磁盘交换空间大小(disk swap space)+Solaris在内存中分配的交换空间大小(memory swap space).使用swap –s察看虚拟交换空间信息。

$ swap -s

total: 929688k bytes allocated + 57408k reserved = 987096k used, 17715000k available

Physical Swap Space

系统物理交换空间的数量为/etc/vfstab中配置的磁盘交换空间大小。使用swap –l察看。

$ swap -l

swapfile dev swaplo blocks free

/dev/vx/dsk/swapvol 230,6 16 25165808 25165808

必须确保swap –s和swap –l 的available & free 非0,否则将无法分配虚拟交换内存或者物理交换内存;

此时,Oracle通常会遇见ORA-4030和ORA-12500错误。

可计算memory swap space: 987,096k+17,715,000k-25165808/2k=6,119,192k

Process Memory Usage , ps, and pmap

进程的内存也可分为2种,虚拟内存使用和物理内存使用。进程虚拟内存是指已经分配给进程的虚拟地址空间(virtual address space);物理内存是指分配给进程的真实的物理内存(real physical memory pages)数量。

Ps的vsz表示虚拟内存,rss表示物理内存

$ ps -opid,vsz,rss,args

PID VSZ RSS COMMAND

27495 1912 1016 –ksh
 
 
 
 
=======================================================================
 
solaris查看内存使用情况命令
 
1>ps -efo pmem,uid,pid,ppid,pcpu,comm | sort -r
用PS命令的-o选项来实现,这些选项有:user ruser group rgroup uid ruid gid rgid pid ppid pgid sid taskid ctid pri opri pcpu pmem vsz rss osz nice class time etime stime zone zoneid f s c lwp nlwp psr tty addr wchan fname comm args projid project pset
具体的意思可以man ps来查看。
 
查看solaris内存使用情况,按占用内存大小排序 
ps -efo pmem,uid,pid,ppid,pcpu,comm | sort -r
 
pmem   The ratio of the process's resident  set size  to  the  physical  memory  on 
       the machine, expressed as a percentage.
 
如果你不知道这个命令都带有什么选项, ps help即可。
 
2> # prtconf -vp | grep Mem
prtconf 命令在/usr/sbin下,这个命令可以得到总内存。其实也不用这么麻烦,top命令看到的信息更多。
 
3> echo ::memstat | mdb -k
例如:
# echo ::memstat | mdb -k
Page Summary                Pages                MB  %Tot
------------     ----------------  ----------------  ----
Kernel                      75297               588    7%
Anon                       888409              6940   86%
Exec and libs               28196               220    3%
Page cache                  15958               124    2%
Free (cachelist)            17993               140    2%
Free (freelist)              3162                24    0%
Total                     1029015              8039
Physical                  1026087              8016
 
具体解释:
Kernel: Kernel pages
Anon: anonymous pages (such as stack, heap, shared mem etc)
Exec and libs: executables and libraries 
Page cache:  file cache
Free (cachelist) + Free (freelist) = freemem(vmstat 中的free值)
这个命令运行起来时间比较长。
 
4>prstat -a
 *PID      :进程的进程 ID。
 *USERNAME :真实用户(登录)名称或真实用户 ID。
 *SIZE     :进程的总虚拟内存大小,以 K、M 或 G 为单位。
 *RSS      :进程的驻留集大小 (RSS),以 K、M 或 G 为单位。(RSS是进程驻留内存的大小,SIZE是进
             程总共的大小。一般SIZE要大于RSS,至于SIZE大于RSS的部分就放到了SWAP区里了)
 *STATE    :进程的状态 (cpuN/sleep/wait/run/zombie/stop)。
 *PRI      :进程的优先级。数字更大表示优先级更高。
 *NICE     :优先级计算中使用的 nice 值。只有特定调度类中的进程才有 nice 值。
 *TIME     :进程的累计执行时间。
 *CPU      :进程使用的当前 CPU 时间的百分比。如果在非全局域中执行并且池设备是活动的,百分比将
             zone绑定的池所使用的处理器集合中处理器的百分比。
 *PROCESS  :进程的名称(执行文件的名称)。
 *NLWP     :进程中 lwps 的数量
 
中间还有个参数:系统平均负载(Load average)在Linux系统中,uptime、w、top等命令都会有系统平均负载load average的输出.
命令输出的最后内容表示在过去的1、5、15分钟内运行队列中的平均进程数量。 只要每个CPU的当前活动进程数不大于3那么系统的性能就是良好的,如果每个CPU的任务数大于5,那么就表示这台机器的性能有严重问题。load average/cpu_num< 3 就是性能不错的。
顺便提一下,多个CPU状态查看命令:mpstat
 
5>vmstat 3 4
看vmstat的输出时,从第2行开始看,如果sr列数值比较大,就表明内存紧张。

 
6>top
 
7>sar -r 5 5 
sar -r标示的freemem显示的是空闲的页面数,而不是用k来衡量的,它表示的数值与vmstat差不多。
它们显示的free memory都还包括高速文件缓存占用的的内存,并不是真正没有使用的内存。

比如:vmstat显示的内存有152528k,sar -r显示的是18933个pages,一个page大约8k,用18933乘以8,还是差不多150M.但实际上呢,真正意义上空闲的内存只有6个M(用专门的memtool测量的),而不是152M。
posted @ 2012-10-09 17:18  vigarbuaa  阅读(1028)  评论(0编辑  收藏  举报