磁盘管理
df -h
磁盘空间大小
du -sh
当前目录所占空间大小
查看当前目录下所有子文件夹排序后的大小:
for i in `ls`; do du -sh $i; done | sort 或者: du -sh `ls` | sort
5. 进程管理工具
任何进程都与文件关联;我们会用到lsof工具(list opened files),作用是列举系统中已经被打开的文件。在linux环境中,任何事物都是文件,设备是文件,目录是文件,甚至sockets也是文件。用好lsof命令,对日常的linux管理非常有帮助。
查询正在运行的进程信息
$ps -ef
eg:查询归属于用户colin115的进程
$ps -ef | grep colin115 $ps -lu colin115
查询进程ID(适合只记得部分进程字段)
$pgrep 查找进程 eg:查询进程名中含有re的进程 [/home/weber#]pgrep -l re 2 kthreadd 28 ecryptfs-kthrea 29515 redis-server
以完整的格式显示所有的进程
$ps -ajx
显示进程信息,并实时更新
$top
查看端口占用的进程状态:
lsof -i:3306
查看用户username的进程所打开的文件
$lsof -u username
查询init进程当前打开的文件
$lsof -c init
查询指定的进程ID(23295)打开的文件:
$lsof -p 23295
查询指定目录下被进程开启的文件(使用+D 递归目录):
$lsof +d mydir1/
5.2. 终止进程
杀死指定PID的进程 (PID为Process ID)
$kill PID
杀死相关进程
kill -9 3434
杀死job工作 (job为job number)
$kill %job
5.3. 进程监控
查看系统中使用CPU、使用内存最多的进程;
$top (->)P
输入top命令后,进入到交互界面;接着输入字符命令后显示相应的进程状态:
对于进程,平时我们最常想知道的就是哪些进程占用CPU最多,占用内存最多。以下两个命令就可以满足要求:
P:根据CPU使用百分比大小进行排序。 M:根据驻留内存大小进行排序。 i:使top不显示任何闲置或者僵死进程。
这里介绍最使用的几个选项,对于更详细的使用
5.4. 分析线程栈
使用命令pmap,来输出进程内存的状况,可以用来分析线程堆栈;
$pmap PID eg: [/home/weber#]ps -fe| grep redis weber 13508 13070 0 08:14 pts/0 00:00:00 grep --color=auto redis weber 29515 1 0 2013 ? 02:55:59 ./redis-server redis.conf [/home/weber#]pmap 29515 29515: ./redis-server redis.conf 08048000 768K r-x-- /home/weber/soft/redis-2.6.16/src/redis-server 08108000 4K r---- /home/weber/soft/redis-2.6.16/src/redis-server 08109000 12K rw--- /home/weber/soft/redis-2.6.16/src/redis-server
6.1. 监控CPU
查看CPU使用率
$sar -u eg: $sar -u 1 2 [/home/weber#]sar -u 1 2 Linux 2.6.35-22-generic-pae (MyVPS) 06/28/2014 _i686_ (1 CPU) 09:03:59 AM CPU %user %nice %system %iowait %steal %idle 09:04:00 AM all 0.00 0.00 0.50 0.00 0.00 99.50 09:04:01 AM all 0.00 0.00 0.00 0.00 0.00 100.00
后面的两个参数表示监控的频率,比如例子中的1和2,表示每秒采样一次,总共采样2次;
查看CPU平均负载
$sar -q 1 2
sar指定-q后,就能查看运行队列中的进程数、系统上的进程大小、平均负载等;
6.2. 查询内存
查看内存使用状况 sar指定-r之后,可查看内存使用状况;
$sar -r 1 2 09:08:48 AM kbmemfree kbmemused %memused kbbuffers kbcached kbcommit %commit kbactive kbinact 09:08:49 AM 17888 359784 95.26 37796 73272 507004 65.42 137400 150764 09:08:50 AM 17888 359784 95.26 37796 73272 507004 65.42 137400 150764 Average: 17888 359784 95.26 37796 73272 507004 65.42 137400 150764
查看内存使用量
$free -m
6.3. 查询页面交换
查看页面交换发生状况 页面发生交换时,服务器的吞吐量会大幅下降;服务器状况不良时,如果怀疑因为内存不足而导致了页面交换的发生,可以使用sar -W这个命令来确认是否发生了大量的交换;
$sar -W 1 3
6.4. 查询硬盘使用
查看磁盘空间利用情况
$df -h
查询当前目录下空间使用情况
du -sh -h是人性化显示 s是递归整个目录的大小
查看该目录下所有文件夹的排序后的大小
for i in `ls`; do du -sh $i; done | sort 或者 du -sh `ls`
6.5. 综合应用
当系统中sar不可用时,可以使用以下工具替代:linux下有 vmstat、Unix系统有prstat
eg: 查看cpu、内存、使用情况: vmstat n m (n 为监控频率、m为监控次数)
[/home/weber#]vmstat 1 3 procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu---- r b swpd free buff cache si so bi bo in cs us sy id wa 0 0 86560 42300 9752 63556 0 1 1 1 0 0 0 0 99 0 1 0 86560 39936 9764 63544 0 0 0 52 66 95 5 0 95 0 0 0 86560 42168 9772 63556 0 0 0 20 127 231 13 2 84 0
使用watch 工具监控变化 当需要持续的监控应用的某个数据变化时,watch工具能满足要求; 执行watch命令后,会进入到一个界面,输出当前被监控的数据,一旦数据变化,便会高亮显示变化情况;
eg:操作redis时,监控内存变化:
$watch -d -n 1 './redis-cli info | grep memory' (以下为watch工具中的界面内容,一旦内存变化,即实时高亮显示变化) Every 1.0s: ./redis-cli info | grep memory Mon Apr 28 16:10:36 2014 used_memory:45157376 used_memory_human:43.07M used_memory_rss:47628288 used_memory_peak:49686080 used_memory_peak_human:47.38M
7.1. 查询网络服务和端口
netstat 命令用于显示各种网络相关信息,如网络连接,路由表,接口状态 (Interface Statistics),masquerade 连接,多播成员 (Multicast Memberships) 等等。
列出所有端口 (包括监听和未监听的):
netstat -a
列出所有 tcp 端口:
netstat -at
列出所有有监听的服务状态:
netstat -l
使用netstat工具查询端口:
$netstat -antp | grep 6379 tcp 0 0 127.0.0.1:6379 0.0.0.0:* LISTEN 25501/redis-server $ps 25501 PID TTY STAT TIME COMMAND 25501 ? Ssl 28:21 ./redis-server ./redis.conf
lsof(list open files)是一个列出当前系统打开文件的工具。在linux环境下,任何事物都以文件的形式存在,通过文件不仅仅可以访问常规数据,还可以访问网络连接和硬件。所以如传输控制协议 (TCP) 和用户数据报协议 (UDP) 套接字等; 在查询网络端口时,经常会用到这个工具。
查询7902端口现在运行什么程序:
#分为两步 #第一步,查询使用该端口的进程的PID; $lsof -i:7902 COMMAND PID USER FD TYPE DEVICE SIZE NODE NAME WSL 30294 tuapp 4u IPv4 447684086 TCP 10.6.50.37:tnos-dp (LISTEN) #查到30294 #使用ps工具查询进程详情: $ps -fe | grep 30294 tdev5 30294 26160 0 Sep10 ? 01:10:50 tdesl -k 43476 root 22781 22698 0 00:54 pts/20 00:00:00 grep 11554
7.2. 网络路由
查看路由状态:
$route -n
发送ping包到地址IP:
$ping IP
探测前往地址IP的路由路径:
$traceroute IP
DNS查询,寻找域名domain对应的IP:
$host domain
反向DNS查询:
$host IP
8.4. 环境变量
bashrc与profile都用于保存用户的环境信息,bashrc用于交互式non-loginshell,而profile用于交互式login shell。
/etc/profile,/etc/bashrc 是系统全局环境变量设定
~/.profile,~/.bashrc用户目录下的私有环境变量设定
当登入系统获得一个shell进程时,其读取环境设置脚本分为三步:
- 首先读入的是全局环境变量设置文件/etc/profile,然后根据其内容读取额外的文档,如/etc/profile.d和/etc/inputrc
- 读取当前登录用户Home目录下的文件~/.bash_profile,其次读取~/.bash_login,最后读取~/.profile,这三个文档设定基本上是一样的,读取有优先关系
- 读取~/.bashrc
~/.profile与~/.bashrc的区别:
- 这两者都具有个性化定制功能
- ~/.profile可以设定本用户专有的路径,环境变量,等,它只能登入的时候执行一次
- ~/.bashrc也是某用户专有设定文档,可以设定路径,命令别名,每次shell script的执行都会使用它一次
例如,我们可以在这些环境变量中设置自己经常进入的文件路径,以及命令的快捷方式:
查看CPU使用情况:
$sar -u 5 10
查询CPU信息:
$cat /proc/cpuinfo
查看CPU的核的个数:
$cat /proc/cpuinfo | grep processor | wc -l
查看内存信息:
$cat /proc/meminfo
显示内存page大小(以KByte为单位):
$pagesize
显示架构:
$arch
9.2. IPC资源管理
IPC资源查询
查看系统使用的IPC资源:
$ipcs ------ Shared Memory Segments -------- key shmid owner perms bytes nattch status ------ Semaphore Arrays -------- key semid owner perms nsems 0x00000000 229376 weber 600 1 ------ Message Queues -------- key msqid owner perms used-bytes messages
查看系统使用的IPC共享内存资源:
$ipcs -m
查看系统使用的IPC队列资源:
$ipcs -q
查看系统使用的IPC信号量资源:
$ipcs -s
应用示例:查看IPC资源被谁占用
有个IPCKEY:51036 ,需要查询其是否被占用;
- 首先通过计算器将其转为十六进制:
51036 -> c75c- 如果知道是被共享内存占用:
$ipcs -m | grep c75c 0x0000c75c 40403197 tdea3 666 536870912 2 - 如果不确定,则直接查找:
$ipcs | grep c75c 0x0000c75c 40403197 tdea3 666 536870912 2 0x0000c75c 5079070 tdea3 666 4
- 如果知道是被共享内存占用:
检测和设置系统资源限制
显示当前所有的系统资源limit 信息:
ulimit – a
对生成的 core 文件的大小不进行限制:
ulimit – c unlimited