标签 linux 下的文章

定制bash环境

定义bash环境之前,首先需要明白bash配置文件加载的顺序

执行顺序为: /etc/profile -> (~/.bash_profile | ~/.bash_login | ~/.profile) -> ~/.bashrc -> /etc/bashrc -> ~/.bash_logout

各个文件的作用域

(1) /etc/profile: 此文件为系统的每个用户设置环境信息,当用户第一次登录时,该文件被执行. 并从/etc/profile.d目录的配置文件中搜集shell的设置。

(2) /etc/bashrc: 为每一个运行bash shell的用户执行此文件.当bash shell被打开时,该文件被读取(即每次新开一个终端,都会执行bashrc)。

(3) ~/.bash_profile: 每个用户都可使用该文件输入专用于自己使用的shell信息,当用户登录时,该文件仅仅执行一次。默认情况下,设置一些环境变量,执行用户的.bashrc文件。

(4) ~/.bashrc: 该文件包含专用于你的bash shell的bash信息,当登录时以及每次打开新的shell时,该该文件被读取。

(5) ~/.bash_logout: 当每次退出系统(退出bash shell)时,执行该文件. 另外,/etc/profile中设定的变量(全局)的可以作用于任何用户,而~/.bashrc等中设定的变量(局部)只能继承 /etc/profile中的变量,他们是"父子"关系。

(6) ~/.bash_profile: 是交互式、login 方式进入 bash 运行的~/.bashrc 是交互式 non-login 方式进入 bash 运行的通常二者设置大致相同,所以通常前者会调用后者。

定制PATH变量,PATH变量是在执行命令的时候系统所会去搜寻的目录,在上面的配置文件中加上对PATH变量的设置,注意,不要被覆盖
例子:

export PATH=$PATH:$HOME/mybin

定制PS1,这个变量为命令行前的提示符
......省略

定制linux库文件的所有的位置
LD_LIBRARY_PATH

使用 ln 给命令创建软连接

ln -s source target

使用alias给命令取别名

[root@iZ23e5fkkhxZ ~]# alias supervi=vim

对服务器中的进程进行管理

查看当前在后台执行的命令

[root@iZ23e5fkkhxZ ~]# jobs 
[1]+  Stopped                 vim aaa

让任务在后台运行

[root@iZ23e5fkkhxZ ~]# bg %1
[1]+ vim aaa &

把后台的任务拿到前台来运行

[root@iZ23e5fkkhxZ ~]# bg %1
[1]+ vim aaa &

把命令放到后台执行,可以使用&符号,但是单纯使用这个命令的话,在当前会话链接结束之后,这个命令的执行也会结束

[root@iZ23e5fkkhxZ ~]# ls &
[1] 30847

在命令执行的时候Ctrl + z可以把命令的执行放在后台,但是任务是停止的状态

nohup 命令和 & 符号的结合使用可以使命令在后台执行,并且不会受当前回话断开的影响

[root@iZ23e5fkkhxZ ~]# nohup grep -lr jin /home/xx.xxx.xxx/public_html &
[1] 30969
[root@iZ23e5fkkhxZ ~]# nohup: ignoring input and appending output to `nohup.out'

使用screen命令,screen命令需要单独安装

# 输入screen命令进入screen
[root@iZ23e5fkkhxZ ~]# screen
# 执行需要的命令
[root@iZ23e5fkkhxZ ~]# grep -lr jin /home/xx.xxx.xxx/public_html &
# Ctrl + a 然后加d,就可以保存当前的screen
[detached]
# 查看后台的screen的信息
[root@iZ23e5fkkhxZ ~]# screen -ls
There is a screen on:
    31371.pts-3.iZ23e5fkkhxZ    (Detached)
1 Socket in /var/run/screen/S-jtcm.
# 回到screen
[root@iZ23e5fkkhxZ ~]# screen -r 31371

linux检测服务运行状态

查看硬盘使用情况

查看所有的磁盘的信息

block用完和inode用完都会导致系统出现问题

[root@jin ~]# fdisk -l

Disk /dev/sda: 136.4 GB, 136365211648 bytes
255 heads, 63 sectors/track, 16578 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disk identifier: 0x000d203d

   Device Boot      Start         End      Blocks   Id  System
/dev/sda1   *           1          26      204800   83  Linux
Partition 1 does not end on cylinder boundary.
/dev/sda2              26        6400    51200000   83  Linux
/dev/sda3            6400       12774    51200000   83  Linux
/dev/sda4           12774       16579    30563328    5  Extended
/dev/sda5           12774       13029     2048000   82  Linux swap / Solaris
/dev/sda6           13030       16579    28513280   83  Linux
查看已mount的磁盘
显示block使用情况
[root@jin ~]# df
Filesystem     1K-blocks    Used Available Use% Mounted on
/dev/sda2       50264772 3597620  44107152   8% /
tmpfs            1957328       0   1957328   0% /dev/shm
/dev/sda1         194241   49660    134341  27% /boot
/dev/sda3       50264772   53088  47651684   1% /home
/dev/sda6       27934740  329028  26180048   2% /var
以1024为单位,显示block使用情况
[root@jin ~]# df -h
Filesystem      Size  Used Avail Use% Mounted on
/dev/sda2        48G  3.5G   43G   8% /
tmpfs           1.9G     0  1.9G   0% /dev/shm
/dev/sda1       190M   49M  132M  27% /boot
/dev/sda3        48G   52M   46G   1% /home
/dev/sda6        27G  322M   25G   2% /var
以1000为单位,显示block使用情况
[root@jin ~]# df -H
Filesystem      Size  Used Avail Use% Mounted on
/dev/sda2        52G  3.7G   46G   8% /
tmpfs           2.1G     0  2.1G   0% /dev/shm
/dev/sda1       199M   51M  138M  27% /boot
/dev/sda3        52G   55M   49G   1% /home
/dev/sda6        29G  337M   27G   2% /var
显示inode使用情况
[root@jin ~]# df -i
Filesystem      Inodes  IUsed   IFree IUse% Mounted on
/dev/sda2      3203072 113580 3089492    4% /
tmpfs           489332      1  489331    1% /dev/shm
/dev/sda1        51200     44   51156    1% /boot
/dev/sda3      3203072     17 3203055    1% /home
/dev/sda6      1782368   2033 1780335    1% /var

查看服务器的CPU使用率,内存使用,虚拟内存交换情况,IO读写情况

找出对系统的瓶颈是因为哪一部份产生的

vmstat命令
[root@jin ~]# vmstat 1 2#每一秒采集一次服务器状态,采集2次
procs -----------memory---------- ---swap-- -----io---- --system-- -----cpu-----
 r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
 1  0      0 2877720  65744 240040    0    0     0     0   18   17  0  0 100  0  0  
 0  0      0 2877688  65744 240040    0    0     0     0  106   68  0  0 100  0  0
r 表示运行队列(就是说多少个进程真的分配到CPU),我测试的服务器目前CPU比较空闲,没什么程序在跑,当这个值超过了CPU数目,就会出现CPU瓶颈了。这个也和top的负载有关系,一般负载超过了3就比较高,超过了5就高,超过了10就不正常了,服务器的状态很危险。top的负载类似每秒的运行队列。如果运行队列过大,表示你的CPU很繁忙,一般会造成CPU使用率很高。
b 表示阻塞的进程,这个不多说,进程阻塞,大家懂的。
swpd 虚拟内存已使用的大小,如果大于0,表示你的机器物理内存不足了,如果不是程序内存泄露的原因,那么你该升级内存了或者把耗内存的任务迁移到其他机器。
free 空闲的物理内存的大小,我的机器内存总共8G,剩余3415M。
buff Linux/Unix系统是用来存储,目录里面有什么内容,权限等的缓存,我本机大概占用300多M
cache cache直接用来记忆我们打开的文件,给文件做缓冲,我本机大概占用300多M(这里是Linux/Unix的聪明之处,把空闲的物理内存的一部分拿来做文件和目录的缓存,是为了提高 程序执行的性能,当程序使用内存时,buffer/cached会很快地被使用。)
si 每秒从磁盘读入虚拟内存的大小,如果这个值大于0,表示物理内存不够用或者内存泄露了,要查找耗内存进程解决掉。我的机器内存充裕,一切正常。
so 每秒虚拟内存写入磁盘的大小,如果这个值大于0,同上。
bi 块设备每秒接收的块数量,这里的块设备是指系统上所有的磁盘和其他块设备,默认块大小是1024byte,我本机上没什么IO操作,所以一直是0,但是我曾在处理拷贝大量数据(2-3T)的机器上看过可以达到140000/s,磁盘写入速度差不多140M每秒
bo 块设备每秒发送的块数量,例如我们读取文件,bo就要大于0。bi和bo一般都要接近0,不然就是IO过于频繁,需要调整。
in 每秒CPU的中断次数,包括时间中断
cs 每秒上下文切换次数,例如我们调用系统函数,就要进行上下文切换,线程的切换,也要进程上下文切换,这个值要越小越好,太大了,要考虑调低线程或者进程的数目,例如在apache和nginx这种web服务器中,我们一般做性能测试时会进行几千并发甚至几万并发的测试,选择web服务器的进程可以由进程或者线程的峰值一直下调,压测,直到cs到一个比较小的值,这个进程和线程数就是比较合适的值了。系统调用也是,每次调用系统函数,我们的代码就会进入内核空间,导致上下文切换,这个是很耗资源,也要尽量避免频繁调用系统函数。上下文切换次数过多表示你的CPU大部分浪费在上下文切换,导致CPU干正经事的时间少了,CPU没有充分利用,是不可取的。
us 用户CPU时间,我曾经在一个做加密解密很频繁的服务器上,可以看到us接近100,r运行队列达到80(机器在做压力测试,性能表现不佳)。
sy 系统CPU时间,如果太高,表示系统调用时间长,例如是IO操作频繁。
id 空闲 CPU时间,一般来说,id + us + sy = 100,一般我认为id是空闲CPU使用率,us是用户CPU使用率,sy是系统CPU使用率。
wt 等待IO CPU时间。
free命令查看内存使用
[root@jin ~]# free
             total       used       free     shared    buffers     cached
Mem:       3914656    1036920    2877736        196      65744     240040
-/+ buffers/cache:     731136    3183520
Swap:      2047996          0    2047996
[root@jin ~]# free -h
             total       used       free     shared    buffers     cached
Mem:          3.7G       1.0G       2.7G       196K        64M       234M
-/+ buffers/cache:       714M       3.0G
Swap:         2.0G         0B       2.0G
在文件/proc/meminfo中查看
[root@jin ~]# cat /proc/meminfo
top命令查看系统状态

参考 http://jinblog.com/archives/722.html

查看系统程序

找出占用过多资源的程序
使用ps命令,参考 http://jinblog.com/archives/728.html

查看网络

查看是否机器有过多的网络连接
使用netstat命令查看

[root@jin ~]# netstat -atlunp
Active Internet connections (servers and established)
Proto Recv-Q Send-Q Local Address               Foreign Address             State       PID/Program name   
tcp        0      0 127.0.0.1:9000              0.0.0.0:*                   LISTEN      1811/php-fpm        
tcp        0      0 0.0.0.0:80                  0.0.0.0:*                   LISTEN      3428/nginx          
tcp        0      0 0.0.0.0:22                  0.0.0.0:*                   LISTEN      1202/sshd           
tcp        0      0 127.0.0.1:9000              127.0.0.1:36446             TIME_WAIT   -                   
tcp        0      0 192.168.1.99:80             192.168.1.62:56513          ESTABLISHED 3429/nginx          
tcp        0      0 192.168.1.99:80             192.168.1.62:56514          ESTABLISHED 3429/nginx          
tcp        0      0 192.168.1.99:80             192.168.1.62:56515          ESTABLISHED 3429/nginx          
tcp        0      0 127.0.0.1:9000              127.0.0.1:36452             TIME_WAIT   -                   
tcp        0      0 192.168.1.99:80             192.168.1.62:56512          ESTABLISHED 3429/nginx          
tcp        0      0 127.0.0.1:9000              127.0.0.1:36448             TIME_WAIT   -                   
tcp        0      0 127.0.0.1:9000              127.0.0.1:36442             TIME_WAIT   -                   
tcp        0      0 127.0.0.1:9000              127.0.0.1:36468             TIME_WAIT   -                   
tcp        0      0 192.168.1.99:80             192.168.1.62:56516          ESTABLISHED 3429/nginx          
tcp        0      0 192.168.1.99:80             192.168.1.62:56511          ESTABLISHED 3429/nginx          
tcp        0      0 192.168.1.99:22             192.168.1.62:53375          ESTABLISHED 3482/sshd           
tcp        0      0 127.0.0.1:9000              127.0.0.1:36454             TIME_WAIT   -                   
tcp        0      0 127.0.0.1:9000              127.0.0.1:36450             TIME_WAIT   -                   
tcp        0      0 127.0.0.1:9000              127.0.0.1:36470             TIME_WAIT   -                   
tcp        0      0 :::3306                     :::*                        LISTEN      2920/mysqld         
tcp        0      0 :::22                       :::*                        LISTEN      1202/sshd           
tcp        0      0 ::ffff:127.0.0.1:3306       ::ffff:127.0.0.1:50626      TIME_WAIT   -                   
tcp        0      0 ::ffff:127.0.0.1:3306       ::ffff:127.0.0.1:50598      TIME_WAIT   -                   
tcp        0      0 ::ffff:127.0.0.1:3306       ::ffff:127.0.0.1:50610      TIME_WAIT   -                   
tcp        0      0 ::ffff:127.0.0.1:3306       ::ffff:127.0.0.1:50616      TIME_WAIT   -                   
tcp        0      0 ::ffff:127.0.0.1:3306       ::ffff:127.0.0.1:50618      TIME_WAIT   -                   
tcp        0      0 ::ffff:127.0.0.1:3306       ::ffff:127.0.0.1:50614      TIME_WAIT   -                   
tcp        0      0 ::ffff:127.0.0.1:3306       ::ffff:127.0.0.1:50628      TIME_WAIT   -                   
tcp        0      0 ::ffff:127.0.0.1:3306       ::ffff:127.0.0.1:50612      TIME_WAIT   -

查看系统默认启动的服务

使用chkconfig查看个管理默认启动的服务

ps命令详解

原文地址:http://apps.hi.baidu.com/share/detail/32573968

有时候系统管理员可能只关心现在系统中运行着哪些程序,而不想知道有哪些进程在运行。由于一个应用程序可能需要启动多个进程。所以在同等情况下,进程的数 量要比程序多的多。为此从阅读方面考虑,管理员需要知道系统中运行的具体程序。要实现这个需求的话,就需要利用命令ps来帮忙。
要对进程进行监测和控制,首先必须要了解当前进程的情况,也就是需要查看当前进程,而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行和运行的状态、进程是否结束、进程有没有僵死、哪些进程占用了过多 的资源等等。总之大部分信息都是可以通过执行该命令得到的。


名称:ps
使用权限:所有使用者
使用方式:ps [options] [--help]
说明:显示瞬间行程 (process) 的动态
参数:ps的参数非常多, 在此仅列出几个常用的参数并大略介绍含义
-A 列出所有的进程
-w 显示加宽可以显示较多的资讯
-au 显示较详细的资讯
-aux 显示所有包含其他使用者的行程

常用参数:
参数 说明
-A 显示所有进程(等价于-e)(utility)
-a 显示一个终端的所有进程,除了会话引线
a 显示所有用户的所有进程
-N 忽略选择。
-d 显示所有进程,但省略所有的会话引线(utility)
-x 显示没有控制终端的进程,同时显示各个命令的具体路径。dx不可合用。(utility)
-p pid 进程使用cpu的时间
-u uid or username 选择有效的用户id或者是用户名
-g gid or groupname 显示组的所有进程。
U username 显示该用户下的所有进程,且显示各个命令的详细路径。如:ps U zhang;(utility)
-f 全部列出,通常和其他选项联用。如:ps -fa or ps -fx and so on.
f 用树形格式来显示进程;
-l 长格式(有F,wchan,C 等字段)
-j 作业格式
j 用任务格式来显示进程
-o 用户自定义格式。
v 以虚拟存储器格式显示
s 以信号格式显示
-m 显示所有的线程
-H 显示进程的层次(和其它的命令合用,如:ps -Ha)(utility)
e 命令之后显示环境(如:ps -d e; ps -a e)(utility)
h 不显示第一行
r 显示运行中的进程
ps命令常用用法(方便查看系统进程)
命令 说明
ps a 显示现行终端机下的所有程序,包括其他用户的程序。
ps -A 显示所有进程。
ps c 列出程序时,显示每个程序真正的指令名称,而不包含路径,参数或常驻服务的标示。
ps -e 此参数的效果和指定"A"参数相同。
ps e 列出程序时,显示每个程序所使用的环境变量。
ps f 用ASCII字符显示树状结构,表达程序间的相互关系。
ps -H 显示树状结构,表示程序间的相互关系。
ps -N 显示所有的程序,除了执行ps指令终端机下的程序之外。
ps s 采用程序信号的格式显示程序状况。
ps S 列出程序时,包括已中断的子程序资料。
ps -t<终端机编号>  指定终端机编号,并列出属于该终端机的程序的状况。
ps u  以用户为主的格式来显示程序状况。
ps x  显示所有程序,不以终端机来区分。
最常用的方法是ps -aux,然后再利用一个管道符号导向到grep去查找特定的进程,然后再对特定的进程进行操作。

范例

[root@jin ~]# ps aux | more
USER       PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
root         1  0.0  0.0  19232  1500 ?        Ss   Oct28   0:01 /sbin/init
root         2  0.0  0.0      0     0 ?        S    Oct28   0:00 [kthreadd]
root         3  0.0  0.0      0     0 ?        S    Oct28   0:00 [migration/0]
root         4  0.0  0.0      0     0 ?        S    Oct28   0:00 [ksoftirqd/0]
root         5  0.0  0.0      0     0 ?        S    Oct28   0:00 [stopper/0]
root         6  0.0  0.0      0     0 ?        S    Oct28   0:01 [watchdog/0]
root         7  0.0  0.0      0     0 ?        S    Oct28   0:00 [migration/1]
root         8  0.0  0.0      0     0 ?        S    Oct28   0:00 [stopper/1]
root         9  0.0  0.0      0     0 ?        S    Oct28   0:00 [ksoftirqd/1]
root        10  0.0  0.0      0     0 ?        S    Oct28   0:00 [watchdog/1]
root        11  0.0  0.0      0     0 ?        S    Oct28   0:00 [migration/2]
root        12  0.0  0.0      0     0 ?        S    Oct28   0:00 [stopper/2]
root        13  0.0  0.0      0     0 ?        S    Oct28   0:00 [ksoftirqd/2]
root        14  0.0  0.0      0     0 ?        S    Oct28   0:00 [watchdog/2]
root        15  0.0  0.0      0     0 ?        S    Oct28   0:00 [migration/3]
root        16  0.0  0.0      0     0 ?        S    Oct28   0:00 [stopper/3]
root        17  0.0  0.0      0     0 ?        S    Oct28   0:00 [ksoftirqd/3]
root        18  0.0  0.0      0     0 ?        S    Oct28   0:00 [watchdog/3]
......

列的含义解释

列名 说明
USER 用户名
UID 用户ID(User ID)
PID 进程ID(Process ID)
PPID 父进程的进程ID(Parent Process id)
SID 会话ID(Session id)
%CPU 进程的cpu占用率
%MEM 进程的内存占用率
VSZ 进程所使用的虚存的大小(Virtual Size)
RSS 进程使用的驻留集大小或者是实际内存的大小,Kbytes字节。
TTY 与进程关联的终端(tty)
STAT 进程的状态:进程状态使用字符表示的(STAT的状态码)
START 进程启动时间和日期
TIME 进程使用的总cpu时间
COMMAND 正在执行的命令行命令
NI 优先级(Nice)
PRI 进程优先级编号(Priority)
WCHAN 进程正在睡眠的内核函数名称;该函数的名称是从/root/system.map文件中获得的。
FLAGS 与进程相关的数字标识

STAT的状态码解释

状态码 说明
R 运行 Runnable (on run queue) 正在运行或在运行队列中等待。
S 睡眠 Sleeping 休眠中, 受阻, 在等待某个条件的形成或接受到信号。
I 空闲| Idle
Z 僵死 Zombie(a defunct process) 进程已终止, 但进程描述符存在, 直到父进程调用wait4()系统调用后释放。
D 不可中断 Uninterruptible sleep (ususally IO) 收到信号不唤醒和不可运行, 进程必须等待直到有中断发生。
T 终止 Terminate 进程收到SIGSTOP, SIGSTP, SIGTIN, SIGTOU信号后停止运行运行。
P 等待交换页
W 无驻留页 has no resident pages 没有足够的记忆体分页可分配。
X 死掉的进程
< 高优先级进程 高优先序的进程
N 低优先 级进程 低优先序的进程
L 内存锁页 Lock 有记忆体分页分配并缩在记忆体内
s 进程的领导者(在它之下有子进程);
l 多进程的(使用 CLONE_THREAD, 类似 NPTL pthreads)
+ 位于后台的进程组

例子:
查看当前系统进程的uid,pid,stat,pri, 以uid号排序.

ps -eo pid,stat,pri,uid –sort uid

查看当前系统进程的user,pid,stat,rss,args, 以rss排序.

ps -eo user,pid,stat,rss,args –sort rss

可以用 | 管道和 more 连接起来分页查看。

[root@localhost ~]# ps -aux |more

把结果输出到ps001.txt文本中并保存。

[root@localhost ~]# ps -aux > ps001.txt

这里是把所有进程显示出来,并输出到ps001.txt文件,然后再通过more 来分页查看。

[root@localhost ~]# more ps001.txt

kill 终止(杀死)进程,有十几种控制进程的方法,下面是一些常用的方法:

[root@localhost ~]#kill -STOP [pid]

发送SIGCONT (19,18,25)重新开始一个停止的进程。

[root@localhost ~]#kill -CONT [pid]

发送SIGKILL (9)强迫进程立即停止,并且不实施清理操作。

[root@localhost ~]#kill -KILL [pid]

终止你拥有的全部进程。
shell [root@localhost ~]#kill -9 -1shell
SIGKILL 和 SIGSTOP 信号不能被捕捉、封锁或者忽略,但是,其它的信号可以。所以这是你的终极武器。

利用ps命令向管理员报告执行中的程序:

有时候系统管理员可能只关心现在系统中运行着哪些程序,而不想知道有哪些进程在运行。由于一个应用程序可能需要启动多个进程。所在在同等情况下,进程的数 量要比程序多的多。为此从阅读方面考虑,管理员需要知道系统中运行的具体程序。要实现这个需求的话,就需要利用命令ps来帮忙。

一、ps命令显示结果的含义。

当需要查看系统中执行的程序时,虽然ps 命令不是唯一的命令,但绝对是使用的最频繁的命令。如下图所示,就是执行ps命令后显示的结果。

在命令行中输入命令ps,就可以显示系统中当前运行的所有应用程序。如上图所示,如果输入ps命令,其显示结果主要有四部分内容。首先是PID,这是程序 的ID号。才作系统就是利用这个ID号来唯一的标识应用程序,而不是利用命令来辨认。当需要强制关闭应用程序时,就需要用到这个PID号码。其次是 TTY,这个字段表示用户使用的终端代码。Pts表示用户是采用远程登录的。第三个参数TIME表示这个程序所消耗的CPU时间,注意这个时间不是程序开 始运行的时间。最后一个参数CMD就表示程序的名字。

二、让系统报告详细的信息。

在使用ps命令时,如果不采用任何的可选项,则其显示的信息是非常有限的,而且往往只显示当前用户所运行的程序。当系统管理员需要知道应用程序更加详细的 运行信息时,如想要知道这个应用程序内存、CPU的占用率情况时,那么就需要加入一些可选项。如系统管理员需要一并查看其它用户所执行的应用程序时,就需 要在这个命令后面采用可选项-al。如此的话,系统会列出系统中所有用户运行的所有程序。如想要知道某个程序CPU与内存的使用情况,而不是只简单的现实 其CPU的使用时间,那么就需要在这个命令后面加入参数-l ,即使用ps –l命令可以让系统显示出应用程序的详细运行信息。关于上面各个字段所代表的含义,大家若有兴趣的话可以查看相关的帮助。一般来说,系统管理员关心的只是 程序的PID号码、内存与CPU的使用率、命令的名字、用户采用的终端等等。其它的信息对于系统管理员来说价值不是很大。

三、查看后台运行的程序。

默认情况下,ps命令只显示前台运行的程序,而不会显示后台运行的程序。但是并非所有的程序都是在前台运行。正常情况下,隐藏在后台运行的程序数量要比前 台运行的程序多的多。如随着操作系统启动而启动的不少系统自带程序,其运行的方式都是后台运行。而且有时候,系统出现问题往往是由于后台程序所造成的。如 常见的木马等程序都是在后台所运行的。为此系统管理员相对来说,更加想要知道在后台运行着哪些程序。

如果要查看后台运行的程序,那就比较复杂一点。因为在不同版本的Linux操作系统中,要显示后台进程其所采用的可选项是不同的。如在红帽子 Linux操作系统中,其实采用参数的形式而不是可选项。即采用ps aux命令可以显示出所有的应用程序(包括前台与后台的)。参数与可选项的差异主要在前面又没有这个-符号。如果带有这个符号的就表示这是一个可选项。而 如果不带的,就表示这事一个参数。这个符号一般情况下可不能够省。在该写的地方没写,或者不需要些的地方偏偏加上了,则系统都会提示错误信息,说找不到这 个命令。而在其它的Linux系统版本中,可能不能够识别这个aux参数。如在一些Linux操作系统版本中,需要采用-a可选项来完成这个任务。由于系 统版本之间的差异,给系统管理员带来了不少的麻烦。不过值得庆幸的是,各个操作系统版本中都有在线的帮助。如果系统管理员在使用一个新版本的操作系统时, 不知道要显示全部进程该使用哪个可选项时,可以利用ps --heip等命令来查看系统帮助。不过美中不足的是,系统在线帮助都是英文的,对系统管理员的英文水平是一个不小的考验。不过如果要作Linux系统管 理员,这点英文底子还是要有的。因为最新的Linux技术基本上都是先出来英文文档的。其实要掌握最先进的操作系统书籍,大部分的计算机书籍都是英文的。

四、对程序列表进行排序。

当运行的应用程序比较多时,系统管理员需要对应用程序进行排序。Ps命令的排序功能是比较强的。主要是因为这个命令有一个--sort参数(注意在这个参 数前面采用的是两个小横杆符号,各位读者不要以为是笔者写错了)。在这个参数后面加上系统管理员想要的排序字段,就可以进行排序了。如这个命令ps –A --sort cmd,就表示显示系统所有的应用程序,并根据程序命令来进行排序。在Linux操作系统参数中,还有一个比较麻烦的事情,就是参数大小写不同往往代表着 不同的含义。如上面这个命令,将大写字母A换成是小写字符a,则结果就完全两样了。大写字符A表示所有的应用程序,而小写字符a则表示“all w/ tty except session leaders”。两者有本质的区别。通过这个差异可以用来过滤不同终端登陆帐户所运行的应用程序。

在ps命令中,不少参数都有这种情况。运行ps --help查看这个命令的所有参数,就可以看到类似的大小写不同代表不同含义的情况还有很多。如大写字符O与小写字符o、大写字符U与小写字符u等等。 这些差异无形之中增加了系统管理员维护操作系统的难度。系统管理员要掌握这么多的参数以及参数大小写之间的差异,往往是不可能的。系统管理员除了平时要多 使用使用常用的参数来增加值观的印象,这个系统命令的在线帮助确实也是少不了的。这个系统帮助可以给管理员使用系统命令提供在线的指导。

五、报告特定程序的运行情况。

当系统中运行的程序比较多时,通过对程序名字排序可以帮助管理员找到自己所关心的程序。但是这仍然不是最简便的方式。如现在系统管理员在其它操作系统中发 现有一个叫做threadx的木马程序在系统后台运行。为此管理员需要在其它电脑上查看是否也有这个木马程序在运行。此时该如何处理呢?利用排序功能,对 程序的名字进行排序(注意不是对程序的PID进行排序,因为即使程序相同,启动的时间不同或者操作系统中已经启动程序的数量不同,这个PID号码也就不 同。也就是说这个PID号码是自动生成的)。这在一定程度上可以帮助管理员加快程序查找的速度。不过笔者认为,如果系统管理员能够使用管道符与 grep等查询命令可能会更快的找到自己所需要的应用程序信息。

如现在系统管理员若使用这个命令ps aux |grep “threadx”,会出现什么情况呢?首先系统会列出当前系统中所有运行的应用程序(包括前台运行与后台运行的)。然后将输出的结果通过管道符号|传递 给命令grep。然后命令grep就会在ps命令输出的结果中查找是否有threadx这个程序运行的信息。如果有的话,则会在窗口中显示这个程序的信 息,而过滤掉其它应用程序的运行信息。可见采用管道符跟其它查询命令结合,可以帮助系统管理员在最短的时间内找到自己想了解的应用程序的信息。

跟一些特殊符号结合还可以实现一些更加负责的功能。如跟cat命令结合使用可以统计出符合条件的程序数量。如在命令后面加入>符号,可以将输出的结 果定位到一个文件中。如跟通配符结合使用,可以查询出满足特定条件的一类程序。如还可以查询出某个程序父程序或者其子程序的运行信息等等。

转载自http://www.cnblogs.com/wangkangluo1/archive/2011/09/23/2185938.html

linux的top命令详解

top命令是Linux下常用的性能分析工具,能够实时显示系统中各个进程的资源占用状况,类似于Windows的任务管理器。

top显示系统当前的进程和其他状况,是一个动态显示过程,即可以通过用户按键来不断刷新当前状态.如果在前台执行该命令,它将独占前台,直到用户终止该程序为止. 比较准确的说,top命令提供了实时的对系统处理器的状态监视.它将显示系统中CPU最“敏感”的任务列表.该命令可以按CPU使用.内存使用和执行时间对任务进行排序;而且该命令的很多特性都可以通过交互式命令或者在个人定制文件中进行设定.

下面详细介绍它的使用方法。

参数含义

top - 01:06:48 up  1:22,  1 user,  load average: 0.06, 0.60, 0.48
Tasks:  29 total,   1 running,  28 sleeping,   0 stopped,   0 zombie
Cpu(s):  0.3% us,  1.0% sy,  0.0% ni, 98.7% id,  0.0% wa,  0.0% hi,  0.0% si
Mem:    191272k total,   173656k used,    17616k free,    22052k buffers
Swap:   192772k total,        0k used,   192772k free,   123988k cached

PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
root      16   0  7976 2456 1980 S  0.7  1.3   0:11.03 sshd
root      16   0  2128  980  796 R  0.7  0.5   0:02.72 top
root      16   0  1992  632  544 S  0.0  0.3   0:00.90 init
root      34  19     0    0    0 S  0.0  0.0   0:00.00 ksoftirqd/0
root      RT   0     0    0    0 S  0.0  0.0   0:00.00 watchdog/0

统计信息区前五行是系统整体的统计信息。第一行是任务队列信息,同 uptime 命令的执行结果。其内容如下:

显示结果 含义
01:06:48 当前时间
up 1:22 系统运行时间,格式为时:分
1 user 当前登录用户数
load average: 0.06, 0.60, 0.48 系统负载,即任务队列的平均长度。三个数值分别为 1分钟、5分钟、15分钟前到现在的平均值。

第二、三行为进程和CPU的信息。当有多个CPU时,这些内容可能会超过两行。内容如下:

显示结果 含义
total 进程总数
running 正在运行的进程数
sleeping 睡眠的进程数
stopped 停止的进程数
zombie 僵尸进程数

Cpu(s):

显示结果 含义
0.3% us 用户空间占用CPU百分比
1.0% sy 内核空间占用CPU百分比
0.0% ni 用户进程空间内改变过优先级的进程占用CPU百分比
98.7% id 空闲CPU百分比
0.0% wa 等待输入输出的CPU时间百分比
0.0%hi: 硬件CPU中断占用百分比
0.0%si: 软中断占用百分比
0.0%st: 虚拟机占用百分比

最后两行为内存信息。内容如下:
Mem:

显示结果 含义
191272k total 物理内存总量
173656k used 使用的物理内存总量
17616k free 空闲内存总量
22052k buffers 用作内核缓存的内存量

Swap:

显示结果 含义
192772k total 交换区总量
0k used 使用的交换区总量
192772k free 空闲交换区总量
123988k cached 缓冲的交换区总量,内存中的内容被换出到交换区,而后又被换入到内存,但使用过的交换区尚未被覆盖,该数值即为这些内容已存在于内存中的交换区的大小,相应的内存再次被换出时可不必再对交换区写入。

进程信息区统计信息区域的下方显示了各个进程的详细信息。首先来认识一下各列的含义。

序号 列名 含义
a PID 进程id
b PPID 父进程id
c RUSER Real user name
d UID 进程所有者的用户id
e USER 进程所有者的用户名
f GROUP 进程所有者的组名
g TTY 启动进程的终端名。不是从终端启动的进程则显示为 ?
h PR 优先级
i NI nice值。负值表示高优先级,正值表示低优先级
j P 最后使用的CPU,仅在多CPU环境下有意义
k %CPU 上次更新到现在的CPU时间占用百分比
l TIME 进程使用的CPU时间总计,单位秒
m TIME+ 进程使用的CPU时间总计,单位1/100秒
n %MEM 进程使用的物理内存百分比
o VIRT 进程使用的虚拟内存总量,单位kb。VIRT=SWAP+RES
p SWAP 进程使用的虚拟内存中,被换出的大小,单位kb。
q RES 进程使用的、未被换出的物理内存大小,单位kb。RES=CODE+DATA
r CODE 可执行代码占用的物理内存大小,单位kb
s DATA 可执行代码以外的部分(数据段+栈)占用的物理内存大小,单位kb
t SHR 共享内存大小,单位kb
u nFLT 页面错误次数
v nDRT 最后一次写入到现在,被修改过的页面数。
w S 进程状态(D=不可中断的睡眠状态,R=运行,S=睡眠,T=跟踪/停止,Z=僵尸进程)
x COMMAND 命令名/命令行
y WCHAN 若该进程在睡眠,则显示睡眠中的系统函数名
z Flags 任务标志,参考 sched.h

默认情况下仅显示比较重要的 PID、USER、PR、NI、VIRT、RES、SHR、S、%CPU、%MEM、TIME+、COMMAND 列。可以通过下面的快捷键来更改显示内容。

更改显示内容通过 f 键可以选择显示的内容。按 f 键之后会显示列的列表,按 a-z 即可显示或隐藏对应的列,最后按回车键确定。
o 键可以改变列的显示顺序。按小写的 a-z 可以将相应的列向右移动,而大写的 A-Z 可以将相应的列向左移动。最后按回车键确定。
按大写的 FO 键,然后按 a-z 可以将进程按照相应的列进行排序。而大写的 R 键可以将当前的排序倒转。

命令使用

top使用格式

top [-] [d] [p] [q] [c] [C] [S] [s] [n]
参数说明

选项 说明
d 指定每两次屏幕信息刷新之间的时间间隔。当然用户可以使用s交互命令来改变之。
p 通过指定监控进程ID来仅仅监控某个进程的状态。
q 该选项将使top没有任何延迟的进行刷新。如果调用程序有超级用户权限,那么top将以尽可能高的优先级运行。
S 指定累计模式
s 使top命令在安全模式中运行。这将去除交互命令所带来的潜在危险。
i 使top不显示任何闲置或者僵死进程。
c 显示整个命令行而不只是显示命令名
其他实用命令

下面介绍在top命令执行过程中可以使用的一些交互命令。从使用角度来看,熟练的掌握这些命令比掌握选项还重要一些。这些命令都是单字母的,如果在命令行选项中使用了s选项,则可能其中一些命令会被屏蔽掉。

命令 说明
Ctrl+L 擦除并且重写屏幕。
h或者? 显示帮助画面,给出一些简短的命令总结说明。
k 终止一个进程。系统将提示用户输入需要终止的进程PID,以及需要发送给该进程什么样的信号。一般的终止进程可以使用15信号;如果不能正常结束那就使用信号9强制结束该进程。默认值是信号15。在安全模式中此命令被屏蔽。
i 忽略闲置和僵死进程。这是一个开关式命令。
q 退出程序。
r 重新安排一个进程的优先级别。系统提示用户输入需要改变的进程PID以及需要设置的进程优先级值。输入一个正值将使优先级降低,反之则可以使该进程拥有更高的优先权。默认值是10。
S 切换到累计模式。
s 改变两次刷新之间的延迟时间。系统将提示用户输入新的时间,单位为s。如果有小数,就换算成m s。输入0值则系统将不断刷新,默认值是5 s。需要注意的是如果设置太小的时间,很可能会引起不断刷新,从而根本来不及看清显示的情况,而且系统负载也会大大增加。
f或者F 从当前显示中添加或者删除项目。
o或者O 改变显示项目的顺序。
l 切换显示平均负载和启动时间信息。
m 切换显示内存信息。
t 切换显示进程和CPU状态信息。
c 切换显示命令名称和完整命令行。
M 根据驻留内存大小进行排序。
P 根据CPU使用百分比大小进行排序。
T 根据时间/累计时间进行排序。
W 将当前设置写入~/.toprc文件中。这是写top配置文件的推荐方法。

附常用操作:

top   //每隔5秒显式所有进程的资源占用情况
top -d 2  //每隔2秒显式所有进程的资源占用情况
top -c  //每隔5秒显式进程的资源占用情况,并显示进程的命令行参数(默认只有进程名)
top -p 12345 -p 6789//每隔5秒显示pid是12345和pid是6789的两个进程的资源占用情况
top -d 2 -c -p 123456 //每隔2秒显示pid是12345的进程的资源使用情况,并显式该进程启动的命令行参数

转载自 http://www.cnblogs.com/ggjucheng/archive/2012/01/08/2316399.html