调试 - 查看运行状态
运行 php start.php status
可以查看到WorkerMan的运行状态,类似如下:
---------------------------------------GLOBAL STATUS--------------------------------------------
Workerman version:3.0.3 PHP version:5.3.29-1~dotdeb.0
start time:2015-02-21 18:05:47 run 86 days 22 hours
load average: 0, 0, 0
3 workers 10 processes
worker_name exit_status exit_count
TodpoleGateway 0 0
TodpoleBusinessWorker 0 4
TodpoleBusinessWorker 9 1
WebServer 0 2
---------------------------------------PROCESS STATUS-------------------------------------------
pid memory listening worker_name connections total_request send_fail throw_exception
936 2.15M Websocket://0.0.0.0:8585 TodpoleGateway 13 355 0 0
937 2.03M Websocket://0.0.0.0:8585 TodpoleGateway 5 181 0 0
938 2M Websocket://0.0.0.0:8585 TodpoleGateway 4 171 0 0
939 2.03M Websocket://0.0.0.0:8585 TodpoleGateway 5 177 0 0
948 2.15M none TodpoleBusinessWorker 4 32 0 0
949 2.16M none TodpoleBusinessWorker 4 54 0 0
953 2.16M none TodpoleBusinessWorker 4 50 0 0
957 2.15M none TodpoleBusinessWorker 4 53 0 0
954 1.84M http://0.0.0.0:8686 WebServer 0 61 0 0
955 1.84M http://0.0.0.0:8686 WebServer 1 59 0 0
说明
GLOBAL STATUS
从这以栏中我们可以看到
WorkerMan的版本version:3.0.3
启动时间2015-02-21 18:05:47
,运行了run 86 days 22 hours
服务器负载 load average: 0, 0, 0
3 workers
(3种进程,包括ChatGateway、ChatBusinessWorker、WebServer进程)
10 processes
(共10个进程)
worker_name
(worker进程名)
exit_status
(worker进程退出状态码)
exit_count
(该状态码的退出次数)
一般来说exit_status为0表示为正常退出,如果为其它值,代表进程是异常退出的,并产生一条类似WORKER EXIT UNEXPECTED
错误信息,错误信息会记录到Worker::logFile指定的文件中。
常见的exit_status及其含义如下:
- 0:表示正常退出,运行reload平滑重启后会出现值为0的退出码,是正常现象。注意在程序中调用exit或die也会导致退出码为0,并产生一条
WORKER EXIT UNEXPECTED
错误信息,workerman中不允许业务代码调用exit或者die语句。 - 9:表示进程被SIGKILL信号杀死了。这个退出码主要发生在stop以及reload平滑重启时,导致这个退出码的原因是由于子进程没有在规定时间内响应主进程reload信号(例如mysql、curl等长时间阻塞等待或者业务死循环等),被主进程强制使用SIGKILL信号杀死。注意,当在linux命令行中使用kill命令发送SIGKILL信号给子进程也会导致这个退出码。
- 65280:导致这个退出码的原因是业务代码有致命错误,例如调用了不存在的函数、语法错误等,具体错误信息会记录到Worker::logFile指定的文件中,也可以在php.ini中error_log指定的文件中(如果有指定的话)找到。
- 64000:导致这个退出码的原因是业务代码抛出了异常,但业务没有捕获这个异常,导致进程退出。如果workerman以debug方式运行时异常调用栈会打印到终端,daemon方式运行时异常调用栈会记录到Worker::stdoutFile指定的文件中。
PROCESS STATUS
pid:进程pid
memory:该进程当前占用内存(不包括php自身可执行文件的占用的内存)
listening:传输层协议及监听ip端口。如果不监听任何端口则显示none。参见Worker类构造函数
worker_name:该进程运行的服务服务名,见Worker类name属性
connections:该进程当前有多少个TCP连接对象实例。注意:每个客户端连接是一个TcpConnection连接对象实例,同时每个AsyncTcpConnection连接也是一个连接对象实例,所以connections的计数不一定与客户端连接数相等,例如GatewayWorker中Gateway进程的connections计数包含了客户端连接数和Gateway与Worker内部通讯连接数。
total_request:表示该进程从启动到现在一共接收了多少个请求。这里的请求数不仅包含客户端发来的请求,也包含Workerman内部通讯请求,例如GatewayWorker架构里Gateway与BusinessWorker之间的通讯请求。
send_fail:该进程向客户端发送数据失败次数,失败原因一般为客户端连接断开,此项不为0一般属于正常状态,参见手册常见问题send_fail原因
throw_exception:该进程内业务未捕获的异常数量
原理
status脚本运行后,主进程会向所有worker进程发送一个SIGUSR2
信号,随后status脚本进入100毫秒的睡眠阶段,以便等待各个worker进程状态统计结果。这时空闲的worker进程收到SIGUSR2
信号后会立刻向特定的磁盘文件写入自己的运行状态(连接数、请求数等等),而正在处理业务逻辑的worker进程,则会等待业务逻辑处理完毕才会去写入自己的状态信息。sleep100毫秒后,status脚本开始读取磁盘中的状态文件,并展示结果到控制台。
注意
status 时可能会发现显示的进程数量少于实际数量,原因是由于进程忙于处理业务(例如业务逻辑长时间阻塞在curl或者数据库请求上),导致worker进程无法及时(100毫秒内)响应status命令,来不及将自己的状态信息写入磁盘,status脚本自然统计不到对应worker的进程,也就无法及时展示在status结果中。
出现这种问题需要排查业务代码,看哪里导业务致长时间阻塞,并且评估阻塞耗时是否在预期内。