当前位置: 首页 > 编程笔记 >

一次nginx 504 Gateway Time-out错误排查、解决记录

汪胡非
2023-03-14
本文向大家介绍一次nginx 504 Gateway Time-out错误排查、解决记录,包括了一次nginx 504 Gateway Time-out错误排查、解决记录的使用技巧和注意事项,需要的朋友参考一下

记一次莫名其妙的网站失去响应排查。之前网站一直是使用nginx做代理后端的apache运行php来提供服务。apache经常会不定期不定时间的出现不能服务失去响应,然后nginx出现"504 Gateway Time-out"
查看错误日志也看不到任何东西,以为是apache的bug(其实不是,下面会说原因)。

也许年龄大了人就不爱折腾,愿意保持原状不动,使用监控工具,每次收到报警后都重新启动apache勉强维持着。终于有一天我烦了,不就是处理php吗,我不用apache总行了吧,一怒之下使用源安装php-fpm转移到php-fpm来运行php。安装php并不麻烦,使用源安装还是很顺利的,唯一需要做的就是设置php worker工作进程的日志输出php错误日志。


一切准备就绪后把原来的proxy_pass换成fastcgipass就可以了。

upstream apachephp  {
    server www.jb51.net:8080; #Apache1
}

.... proxy_pass  http://apachephp;


替换成成
upstream php {
        server 127.0.0.1:9000;
}

... fastcgi_pass php;


就可以把apache上跑的php迁移到php-fpm上来跑。
原以为这样就可以高枕无忧了,迁移完成是也确实没什么问题,但是如果你不去分析问题的根本原因在哪。问题还是会找上门来,第二天nginx又报了504的gateway timeout。这回没apache什么事了吧,apache总算撇清了关系。

那应该还是在nginx和php-fpm身上,查看nginx的错误日志,可以看到

[error] 6695#0: *168438 upstream timed out (110: Connection timed out) while reading response header from upstream,
...
request: "GET /kd/open.php?company=chinapost&number=PA24977020344 HTTP/1.1", upstream: "fastcgi://127.0.0.1:9000", host: "www.jb51.net"

看到这里基本上就排除了nginx嫌疑,nginx是在等待php处理"GET /kd/open.php?company=chinapost&number=PA24977020344 HTTP/1.1"超时退出了。

马上重启php-fpm,问题没有了,网站可以访问了。

再次访问该页面,依然没有响应,但同时访问别的页面正常,该页面刷新几次后,整个网站都是bad gateway timeout了。

问题就缩小到这个php脚本上了。

netstat -napo |grep "php5-fpm" | wc -l

查看php工作进程已经达到了配置文件里的上限10,有种感觉就是大家都被open.php这个脚本卡住了。

这个脚本是干什么的呢?这个脚本就是采集快递信息的,里面用到了php_curl。

PHP脚本如果执行时间超过php.ini中的配置项max_execution_time不出结果就会强制退出。

查看了php.ini中max_execution_time确实配了,值为30。

万能google派上用场了,经过不断google后得到下面这句话

set_time_limit()函数和配置指令max_execution_time只影响脚本本身执行的时间。任何发生在诸如使用system()的系统调用,流操作,数据库操作等的脚本执行的最大时间不包括其中,当该脚本已运行。

就是说如果脚本中执行了其它操作的时间是不计在脚本运行时间当中的,如果你没设置超时,那么php就会一直等待调用的结果。

查看open.php源文件一看,果然没有设置curl的超时时间。

增加如下两行,重新刷新,后问题解决了。

curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10); //timeout on connect
curl_setopt($ch, CURLOPT_TIMEOUT, 10); //timeout on response

当然,除了这种方法外,php-fpm里也提供参数供我们强制杀死长时间无结果的进程,只是该参数默认没打开。

php-fpm的配置文件里可以设置一个参数request_terminate_timeout,请求终止的超时时间,当请求执行超过这个时间就会被kill。

同时它还有个参数request_slowlog_timeout,用来记录慢请求日志的。

命令行运行php的话,可以使用这段代码

$real_execution_time_limit = 60; //时间限制

if (pcntl_fork()) { // some long time code which should be // terminated after $real_execution_time_limit seconds passed if it's not // finished by that time } else { sleep($real_execution_time_limit); posix_kill(posix_getppid(), SIGKILL); }

 类似资料:
  • 本文向大家介绍nginx 504 Gateway Time-out错误解决方法,包括了nginx 504 Gateway Time-out错误解决方法的使用技巧和注意事项,需要的朋友参考一下 一般看来, 这种情况可能是由于nginx默认的fastcgi进程响应的缓冲区太小造成的, 这将导致fastcgi进程被挂起, 如果你的fastcgi服务对这个挂起处理的不好, 那么最后就极有可能导致504 G

  • 记一次站点被挂马问题排查 起因,在下班准备回家之际,收到几条朋友发来的信息,说他的网站在百度搜索做信息流广告推广,但是从百度搜索点击打开就会跳转的博彩网站,让我帮忙排查下问题,是不是被挂马了,于是乎就开始了后面的故事 为了保护网站隐私,假定网站地址是:http://www.xxx.com 收到消息后我尝试操作并收集到下面现象内容: 现象1:通过域名直接打开网站,可以正常打开,不会跳转到博彩站 现象

  • 问题内容: 我收到此错误: 超时时间已到。在操作完成之前超时时间已过,或者服务器没有响应。 我知道那里已经有帮助解决此问题的指南,但它们对我不起作用。我缺少什么,或者应该在哪里将代码添加到C#程序中的这些SQL语句中: 我在此行收到超时错误: 问题答案:

  • 问题内容: 在我撰写本文时,eclipse抱怨无法解决。 我已经导入了其他servlet包。 问题答案: 只是在黑暗中拍摄,我认为这是您正在寻找的:

  • 问题内容: 我不熟悉使用Java发送邮件的功能。发送电子邮件重设密码时出现错误。希望你能给我一个解决方案。 下面是我的代码: 引发以下错误: 调试:setDebug:JavaMail版本1.4.1ea-SNAPSHOT javax.mail.Provider[TRANSPORT,smtp,com.sun.mail.smtp.SMTPTransport,Sun Microsystems, Inc]

  • 我不熟悉这个功能在Java发送邮件。我收到一个错误时发送电子邮件重置密码。希望你能给我一个解决办法。 下面是我的代码: 引发以下错误: debug:setdebug:JavaMail版本1.4.1ea-snapshot 调试SMTP:useEhlo为true,useAuth为true 调试SMTP:正在尝试连接到主机“smtp.gmail.com”,端口465,isSSL false 220 mx