ps命令,性能监控,grep命令

Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照,就是执行ps命令的那个时刻的那些进程,如果想要动态的显示进程信息,就可以使用top命令。

要对进程进行监测和控制,首先必须要了解当前进程的情况,也就是需要查看当前进程,而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行和运行的状态、进程是否结束、进程有没有僵死、哪些进程占用了过多的资源等等。总之大部分信息都是可以通过执行该命令得到的。

ps 为我们提供了进程的一次性的查看,它所提供的查看结果并不动态连续的;如果想对进程时间监控,应该用 top 工具。

kill 命令用于杀死进程。

 

linux上进程有5种状态: 

1. 运行(正在运行或在运行队列中等待) 

2. 中断(休眠中, 受阻, 在等待某个条件的形成或接受到信号) 

3. 不可中断(收到信号不唤醒和不可运行, 进程必须等待直到有中断发生) 

4. 僵死(进程已终止, 但进程描述符存在, 直到父进程调用wait4()系统调用后释放) 

5. 停止(进程收到SIGSTOP, SIGSTP, SIGTIN, SIGTOU信号后停止运行运行) 

 

ps工具标识进程的5种状态码: 

D 不可中断 uninterruptible sleep (usually IO) 

R 运行 runnable (on run queue) 

S 中断 sleeping 

T 停止 traced or stopped 

Z 僵死 a defunct (”zombie”) process 

 

其他状态码:

  • P 等待交换页
  • W 无驻留页 has no resident pages 没有足够的记忆体分页可分配。
  • X 死掉的进程
  • < 高优先级进程 高优先序的进程
  • N 低优先 级进程 低优先序的进程
  • L 内存锁页 Lock 有记忆体分页分配并缩在记忆体内
  • s 进程的领导者(在它之下有子进程);
  • l 多进程的(使用 CLONE_THREAD, 类似 NPTL pthreads)
  • 。位于后台的进程组

1.命令格式:

ps[参数]

2.命令功能:

用来显示当前进程的状态

3.命令参数:

具体命令解释如下: 

-a 显示所有进程
-c  显示进程的真实名称
-N 反向选择
-e 等于“-a”
-f  显示程序间的关系
-H 显示树状结构
-r  显示当前终端的进程
-T 显示当前终端的所有程序
-u 以用户为主的格式来显示程序状况
-x 显示所有程序,不以终端机来区分
-C<命令> 列出指定命令的状况
--lines<行数> 每页显示的行数
--width<字符数> 每页显示的字符数
--sort <keywords> 指定排序方式

最常用的方法是ps -aux,然后再利用一个管道符号导向到grep去查找特定的进程,然后再对特定的进程进行操作。

4.使用场景

ps 可用参数非常多,下面列举几个常用的。

场景1:不加参数运行

[ciadmin@2-103test_app ~]$ ps
  PID TTY          TIME CMD
 6208 pts/11   00:00:00 ps
16464 pts/11   00:00:00 bash
[ciadmin@2-103test_app ~]$ 

如上所示,如果不加参数运行,只会显示本控制台启动的程序,显示信息很少,所以基本不会这么用。

场景2:显示所有进程

命令如下:

$ ps -aux 或 ps -ef

以上命令也是最常用的命令,ps aux 和 ps -ef 都是用来显示当前运行的进程,但是, 
ps aux 是用BSD的格式来显示进程,显示的项目有:

USER , PID , %CPU , %MEM , VSZ , RSS , TTY , STAT , START , TIME , COMMAND

ps -ef 是用标准的格式显示进程,显示的项目有:

UID , PID , PPID , C , STIME , TTY , TIME , CMD

两者的输出结果差别不大,但展示风格不同。aux是BSD风格,-ef是System V风格。这是次要的区别,一个影响使用的区别是aux会截断command列,而-ef不会。当结合grep时这种区别会影响到结果。

以上命令输出结果很多,为了便于查看一般会结合分页命令(less、more、pg等)和管道一同使用,如下:

$ ps -aux | less
USER       PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
root         1  0.0  0.0 193624  5480 ?        Ss    2017   0:09 /usr/lib/systemd/systemd --switched-root --system --deserialize 21
root         2  0.0  0.0      0     0 ?        S     2017   0:00 [kthreadd]
root         3  0.0  0.0      0     0 ?        S     2017   0:01 [ksoftirqd/0]
root         5  0.0  0.0      0     0 ?        S<    2017   0:00 [kworker/0:0H]
root         7  0.0  0.0      0     0 ?        S     2017   0:00 [migration/0]

上文命令头的释义如下:

USER:该 process 属于那个使用者账号的 
PID :该 process 的号码 
%CPU:该 process 使用掉的 CPU 资源百分比 
%MEM:该 process 所占用的物理内存百分比 
VSZ :该 process 使用掉的虚拟内存量 (Kbytes) 
RSS :该 process 占用的固定的内存量 (Kbytes) 
TTY :该 process 是在那个终端机上面运作,若与终端机无关,则显示 ?,另外, tty1-tty6 是本机上面的登入者程序,若为 pts/0 等等的,则表示为由网络连接进主机的程序。 
STAT:该程序目前的状态,主要的状态有 
START:该 process 被触发启动的时间 
TIME :该 process 实际使用 CPU 运作的时间 
COMMAND:该程序的实际指令

状态码的含义可以参考文首部分。

场景3:查找特定进程

上文场景2中已经可以获取所有进程信息,那么查找特定进程只要参考我们前面的文章《每天一个Linux命令:grep》即可找到方法。

使用方法如下:

$ ps -aux | grep service
root      9206  2.8  0.3 5626060 52112 ?       Ssl   2017 494:10 python rest_api_service.py restart
root     12846  0.0  0.0 112648   968 pts/11   R+   11:13   0:00 grep --color=auto service

场景4:通过cpu和内存使用来过滤进程

默认的结果集是未排好序的。可以通过 –sort命令来排序。 
内存增序

ps aux --sort rss

内存减序

ps aux --sort -rss

cpu增序

ps auxw --sort=%cpu

cpu减序

ps auxw --sort=-%cpu

 

排序键值很多,常用如下:

       KEY   LONG         DESCRIPTION
       c     cmd          simple name of executable
       C     pcpu         cpu utilization
       g     pgrp         process group ID
       j     cutime       cumulative user time
       J     cstime       cumulative system time
       k     utime        user time
       p     pid          process ID
       P     ppid         parent process ID
       u     user         user name

扩展

前期已经讲过通过 top 命令动态监控进程信息,本文不再重复。

(1)pstree

pstree命令将所有行程以树状图显示,树状图将会以 pid (如果有指定) 或是以 init 这个基本行程为根 (root),如果有指定使用者 id,则树状图会只显示该使用者所拥有的行程。 
主要选项如下:

-a  显示每个程序的完整指令,包含路径,参数或是常驻服务的标示。
-c  不使用精简标示法。
-G  使用VT100终端机的列绘图字符。
-h  列出树状图时,特别标明现在执行的程序。
-H <程序识别码>  此参数的效果和指定”-h”参数类似,但特别标明指定的程序。
-l  采用长列格式显示树状图。
-n  用程序识别码排序。预设是以程序名称来排序。
-p  显示程序识别码。
-u  显示用户名称。
-U  使用UTF-8列绘图字符。
-V  显示版本信息。

示例:

$ pstree
systemd─┬─NetworkManager───2*[{NetworkManager}]
        ├─agetty
        ├─auditd───{auditd}
        ├─crond
        ├─dbus-daemon───{dbus-daemon}
        ├─ipmievd
        ├─irqbalance
        ├─master─┬─pickup
        │        └─qmgr
        ├─mysqld───27*[{mysqld}]
        ├─polkitd───5*[{polkitd}]
        ├─python───1080*[{python}]
        ├─python───151*[{python}]
        ├─python───11*[{python}]
        ├─rsyslogd───2*[{rsyslogd}]
        ├─2*[screen───bash───python───{python}]
        ├─screen───bash───python
        ├─screen─┬─2*[bash]
        │        └─bash───python───8*[{python}]
        ├─sshd─┬─2*[sshd───bash───tmux]
        │      └─2*[sshd───sftp-server]
        ├─systemd-journal
        ├─systemd-logind
        ├─systemd-udevd
        ├─tmux─┬─3*[bash]
        │      ├─bash───tail
        │      ├─6*[bash───ssh]
        │      ├─bash───python───python
        │      └─bash───pstree
        └─tuned───4*[{tuned}]

(2)pstack

pstack命令可显示每个进程的栈跟踪。pstack 命令必须由相应进程的属主或 root 运行。可以使用 pstack 来确定进程挂起的位置。此命令允许使用的唯一选项是要检查的进程的 PID。

这个命令很多系统软件仓库并没有,需要自己搜索相关源下载安装,所以这里只提示一下,感兴趣的同学可以自己研究。

我更常用的命令是:strace。当一个程序运行出错,而我们又没有程序源码时,strace 是调试利器。

strace命令是一个集诊断、调试、统计与一体的工具,我们可以使用strace对应用的系统调用和信号传递的跟踪结果来对应用进行分析,以达到解决问题或者是了解应用工作过程的目的。

strace常用来跟踪进程执行时的系统调用和所接收的信号。 在Linux世界,进程不能直接访问硬件设备,当进程需要访问硬件设备(比如读取磁盘文件,接收网络数据等等)时,必须由用户态模式切换至内核态模式,通 过系统调用访问硬件设备。strace可以跟踪到一个进程产生的系统调用,包括参数,返回值,执行消耗的时间。

grep相关参考《linux grep命令

实例5:将目前属于您自己这次登入的 PID 与相关信息列示出来

命令:

ps -l

输出:

[root@localhost test6]# ps -l

F S   UID   PID  PPID  C PRI  NI ADDR SZ WCHAN  TTY          TIME CMD

4 S     0 17398 17394  0  75   0 - 16543 wait   pts/0    00:00:00 bash

4 R     0 17469 17398  0  77   0 - 15877 -      pts/0    00:00:00 ps

 

说明:

各相关信息的意义:

F 代表这个程序的旗标 (flag), 4 代表使用者为 super user
S 代表这个程序的状态 (STAT),关于各 STAT 的意义将在内文介绍
UID 程序被该 UID 所拥有
PID 就是这个程序的 ID !
PPID 则是其上级父程序的ID
C CPU 使用的资源百分比
PRI 这个是 Priority (优先执行序) 的缩写,详细后面介绍
NI 这个是 Nice 值,在下一小节我们会持续介绍
ADDR 这个是 kernel function,指出该程序在内存的那个部分。如果是个 running的程序,一般就是 "-"
SZ 使用掉的内存大小
WCHAN 目前这个程序是否正在运作当中,若为 - 表示正在运作
TTY 登入者的终端机位置
TIME 使用掉的 CPU 时间。
CMD 所下达的指令为何

在预设的情况下, ps 仅会列出与目前所在的 bash shell 有关的 PID 而已,所以, 当我使用 ps -l 的时候,只有三个 PID。

实例8:找出与 cron 与 syslog 这两个服务有关的 PID 号码

[root@localhost test6]# ps aux | egrep '(cron|syslog)'

root      2682  0.0  0.0  83384  2000 ?        Sl   Nov02   0:00 /sbin/rsyslogd -i /var/run/syslogd.pid -c 5

root      2735  0.0  0.0  74812  1140 ?        Ss   Nov02   0:00 crond

root     17475  0.0  0.0  61180   832 pts/0    S+   16:27   0:00 egrep (cron|syslog)

[root@localhost test6]#

说明:

其他实例:

1. 可以用 | 管道和 more 连接起来分页查看

命令:

ps -aux |more

2. 把所有进程显示出来,并输出到ps001.txt文件

命令:

ps -aux > ps001.txt

3. 输出指定的字段

命令:

 ps -o pid,ppid,pgrp,session,tpgid,comm

输出:

[root@localhost test6]# ps -o pid,ppid,pgrp,session,tpgid,comm

  PID  PPID  PGRP  SESS TPGID COMMAND

17398 17394 17398 17398 17478 bash

17478 17398 17478 17398 17478 ps

[root@localhost test6]#

 

ps   -eo   pid   pcpu   pmem   rss   

参数说明:

  • pcpu是CPU利用率
  • pmem是内存利用率,这两个都是用百分比表示 
  • rss是实际驻留内存的大小,单位是K

==================================

[appdeploy@CNSZ22PL0088:/home/appdeploy]$ps -eo user,sz,rss,minflt,majflt,pcpu,args
USER SZ RSS MINFLT MAJFLT %CPU COMMAND
root 4839 1540 3033 9 0.0 /sbin/init
root 0 0 0 0 0.0 [kthreadd]
607 8591051 52956 22218 0 0.0 ./redis-server *:6378
607 58068 12596 6232981 0 0.0 redis-server *:6381
607 2165451 100220 10186165 0 0.0 ./src/redis-server *:6376
607 3319991 3267160 2085851 0 0.2 /home/appdeploy/jdk1.8.0_25/bin/java -Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.ssl=false -Xms5g -Xmx5g -Djetty.logs=/ho
ntp 9263 1696 445 0 0.0 ntpd -x -u ntp:ntp -p /var/run/ntpd.pid
root 26582 1556 3579 0 0.0 /bin/sh /usr/bin/mysqld_safe --datadir=/var/lib/mysql --socket=/var/lib/mysql/mysql.sock --pid-file=/var/run/mysqld/mysqld.pid --basedir=/u
mysql 1305553 1647064 922044 0 0.7 /usr/sbin/mysqld --basedir=/usr --datadir=/var/lib/mysql --plugin-dir=/usr/lib64/mysql/plugin --user=mysql --log-error=/var/log/mysqld.log
607 5270984 2242012 891644 0 10.1 /home/appdeploy/jdk1.8.0_25/bin/java -Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.ssl=false -Xms1g -Xmx2g -Djetty.logs=/ho
607 2492475 1434756 3075748 0 0.1 /home/appdeploy/jdk1.8.0_25/bin/java -Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.ssl=false -Xms1g -Xmx2g -Djetty.logs=/ho
607 41675 38684 33886 0 0.6 ./redis-sentinel *:28888 [sentinel]
root 24924 3756 1299 0 0.0 sshd: appdeploy [priv]
607 24924 1812 302 0 0.0 sshd: appdeploy@pts/2
607 28720 2108 1401 0 0.0 -bash
607 34516 8788 2185554 0 0.4 redis-server *:6379
607 29163 1252 416 0 5.0 ps -eo user,sz,rss,minflt,majflt,pcpu,args
root 409597 19860 45771920 1 0.3 /opt/exagent/exagent/bin/python/bin/python /opt/exagent/exagent/bin/Agent.py 6861
[appdeploy@CNSZ22PL0088:/home/appdeploy]$

 

==============================

 

posted on 2015-12-07 14:52  duanxz  阅读(1676)  评论(0编辑  收藏  举报