当前位置: 首页 > 软件库 > 程序开发 > 网络工具包 >

php_http_parser

PHP的HTTP解析扩展
授权协议 MIT
开发语言 PHP
所属分类 程序开发、 网络工具包
软件类型 开源软件
地区 国产
投 递 者 严锐
操作系统 跨平台
开源组织
适用人群 未知
 软件概览

php_http_parser 是基于node.js http-parser的PHP扩展,可用于实现纯异步PHP程序

libcurl提供了异步调用方式,有两种风格:

  • ONE MULTI HANDLE MANY EASY HANDLES:加入多个easy handle后执行curl_multi_perform方法。该方法在php curl扩展中有对应实现。但最后一步curl_multi_perform是阻塞的。

  • MULTI_SOCKET,这个是真正的非阻塞方法,但需要自行实现event loop,且封装较为困难,目前在php中没有对应实现。经过调研,curl_multi_socket_action跟php内核结合困难度很高。

除此之外,基本上没有真正的实现异步http请求的php扩展。目前仅有部分纯php实现的版本,比如tsf中的http client实现。 使用纯php实现的问题主要受限于http解析的性能。因此考虑将这一模块用扩展的方式来实现。node.js http-parser就是一个很好的c语言的http解析库。 php_http_parser就是对其做的一个封装,在php中暴露出相应的接口。

为了实现真正的非阻塞请求,仍然需要自己实现event loop。目前推荐结合swoole使用,以获得更好的性能。

使用方式

$buffs = array("HTTP/1.1 301 Moved Permanently\r\n"
,"Location: http://www.google.com/\r\n"
,"Content-Type: text/html; charset=UTF-8\r\n"
,"Date: Sun, 26 Apr 2009 11:11:49 GMT\r\n"
,"Expires: Tue, 26 May 2009 11:11:49 GMT\r\n"
,"Cache-Control: public, max-age=2592000\r\n"
,"Server: gws\r\n"
,"Content-Length: 193\r\n"
,"\r\n"
,"<HTML><HEAD><meta http-equiv=\"content-type\" content=\"text/html;charset=utf-8\">\n"
,"<TITLE>301 Moved</TITLE></HEAD><BODY>\n"
,"<H1>301 Moved</H1>\n"
,"The document has moved\n"
,"<A HREF=\"http://www.google.com/\">here</A>.\r\n"
    ,"<A HREF=\"http://www.google.com/\">here</A>.\r\n"
    ,"<A HREF=\"http://www.google.com/\">here</A>.\r\n"
    ,"<A HREF=\"http://www.google.com/\">here</A>.\r\n"
    ,"<A HREF=\"http://www.google.com/\">here</A>.\r\n"
,"</BODY></HTML>\r\n");
$hp = new HttpParser();
foreach($buffs as $buff){
    $ret = $hp->execute($buff);
    if($ret !== false){
        echo $ret;
        break;
    }
}

虽然http请求可能分包发送,HttpParser会将所有包合并在一起后,出发body事件,然后调用相应的回调方法。 诸如header回调,目前暂未实现。另外,此处需要自行实现timeout逻辑。

示例代码是结合swoole_client与swPromise框架实现的一个异步http client。 籍此可以实现真正的非阻塞的PHP程序。

class HttpClientFuture implements FutureIntf {
    protected $url = null;
    protected $post = null;
    protected $proxy = false;
    public function __construct($url, $post = array(), $proxy = array()) {
        $this->url = $url;
        $this->post = $post;
        if($proxy){
            $this->proxy = $proxy;
        }
    }
    public function run(Promise &$promise) {
        $cli = new \swoole_client ( SWOOLE_TCP, SWOOLE_SOCK_ASYNC );
        $urlInfo = parse_url ( $this->url );
        if(!isset($urlInfo ['port']))$urlInfo ['port'] = 80;
        $httpParser = new \HttpParser();
        $cli->on ( "connect", function ($cli)use($urlInfo){
            $host = $urlInfo['host'];
            if($urlInfo['port'])$host .= ':'.$urlInfo['port'];
            $req = array();
            $req[] = "GET {$this->url} HTTP/1.1\r\n";
            $req[] = "User-Agent: PHP swAsync\r\n";
            $req[] = "Host:{$host}\r\n";
            $req[] = "Connection:close\r\n";
            $req[] = "\r\n";
            $req = implode('', $req);
            $cli->send ( $req );
        } );
        $cli->on ( "receive", function ($cli, $data = "") use(&$httpParser, &$promise) {
            $ret = $httpParser->execute($data);
            if($ret !== false){
                $cli->close();
                $promise->accept(['http_data'=>$ret]);
            }
        } );
        $cli->on ( "error", function ($cli) use(&$promise) {
            $promise->reject ();
        } );
        $cli->on ( "close", function ($cli) {
        } );
        if($this->proxy){
            $cli->connect ( $this->proxy['host'], $this->proxy ['port'], 1 );
        }else{
            $cli->connect ( $urlInfo ['host'], $urlInfo ['port'], 1 );
        }
    }
}

性能

[web@gz-web01 php_http_parser]$ time /data/server/php/bin/php http_parser.php  2000000

real    0m11.489s
user    0m11.435s
sys 0m0.017s

1个worker进程

./http_load -fetches 20000 -parallel 100 9502.listasync 
20000 fetches, 100 max parallel, 2.02e+06 bytes, in 5.94536 seconds
101 mean bytes/connection
3363.97 fetches/sec, 339761 bytes/sec
msecs/connect: 0.0473873 mean, 1.155 max, 0.019 min
msecs/first-response: 29.6366 mean, 51.736 max, 15.22 min
HTTP response codes:
code 200 -- 20000
-bash: history: write error: Success

2个worker进程

./http_load -fetches 20000 -parallel 100 9502.listasync 
20000 fetches, 100 max parallel, 2.02e+06 bytes, in 3.17119 seconds
101 mean bytes/connection
6306.77 fetches/sec, 636984 bytes/sec
msecs/connect: 0.0643583 mean, 1.211 max, 0.023 min
msecs/first-response: 15.7489 mean, 32.425 max, 3.242 min
HTTP response codes:
code 200 -- 20000
-bash: history: write error: Success

4个woker进程

./http_load -fetches 20000 -parallel 100 9502.listasync 
20000 fetches, 100 max parallel, 2.02e+06 bytes, in 1.57194 seconds
101 mean bytes/connection
12723.2 fetches/sec, 1.28504e+06 bytes/sec
msecs/connect: 0.0815263 mean, 1.349 max, 0.02 min
msecs/first-response: 7.65904 mean, 22.568 max, 1.221 min
HTTP response codes:
code 200 -- 20000
-bash: history: write error: Success

8个woker进程

./http_load -fetches 20000 -parallel 100 9502.listasync 
20000 fetches, 100 max parallel, 2.02e+06 bytes, in 1.02967 seconds
101 mean bytes/connection
19423.8 fetches/sec, 1.9618e+06 bytes/sec
msecs/connect: 0.147502 mean, 1.575 max, 0.014 min
msecs/first-response: 3.17218 mean, 22.566 max, 0.339 min
HTTP response codes:
code 200 -- 20000
-bash: history: write error: Success
  • 定义和用法 xml_parser_set_option() 函数为 XML 解析器进行选项设置。 如果成功,则返回 true。如果失败,则返回 false。 语法 xml_parser_set_option(parser,option,value) 参数 描述 parser 必需。规定要使用的 XML 解析器。 option 必需。规定要设置的设置选项名称。可能的值: XML_OPTION_CAS

  • ================================== 安装apach2 root@build-All-Series:~# apt install apache2 Reading package lists... Done Building dependency tree        Reading state information... Done The following a

  • simplehtmldom_1_5 // Create DOM from URL or file $html = file_get_html('http://www.google.com/'); // Find all images foreach($html->find('img') as $element) echo $element->src . ' '; // Find all links

  • H:/0727/01_XMLParser_JSONSerialization_MediaPlayer_localXML.xml <?xml version="1.0" encoding="utf-8"?> <videos><video id="1"><name>01.C语言-语法预览</name><length>320</length><videoURL>/itcast/videos/01.C语言

  • I have a tiny bbcode parser which works very well, except pre and code tags. I need to make pre and code tags ignored by the whole parser function. How would I achive this ? If any one have an idea pl

  • 2018-4-16 17:59:03 星期一 1. 发送带有xml参数的请求时如果是用php curl, 需要将数组形式的post data 用 http_build_query() 转换 2. 接收时需要将xml用html_entity_decode()函数处理一下 转载于:https://www.cnblogs.com/iLoveMyD/p/8857415.html

  • 在php中error_reporting是设置 PHP 的报错级别并返回当前级别,我们可以根据不同级别来设置是不给出错误提示域外出错时是否向往执行程序,下面我来介绍error_reporting()用法与参数。 基本信息 E_NOTICE 表示一般情形不记录,只有程序有错误情形时才用到,例如企图存取一个不存在的变量,或是呼叫 stat() 函数检视不存在的文件。 E_WARNING 通常都会显示出

  • 张三 经理 李四 助理 $parser = xml_parser_create(); //创建一个parser编辑器 xml_set_element_handler($parser, "startElement", "endElement");//设立标签触发时的相应函数 这里分别为startElement和endElenment xml_set_character_data_handler($p

  • $file = "xmltest.xml"; function trustedFile($file) { // only trust local files owned by ourselves if (!eregi("^([a-z]+)://", $file) && fileowner($file) == getmyuid()) { return true; http://www.gaodaim

  • /** * xml2array() will convert the given XML text to an array in the XML structure. * Link: http://www.bin-co.com/php/scripts/xml2array/ * Arguments : $contents - The XML text * $get_attributes - 1 or

  • 很多站长会遇到一个问题,网站加入CNZZ的JS统计代码后,Chrome浏览器出现警告:阻止跨站解析器阻断脚本通过document.write调用(A parser-blocking, cross site script,XXXX.js is invoked via document.write.)。该警告有时候可能会使HTTPS页面出现不安全因素,甚至让使用EV SSL证书的网站出现不显示绿色地址

  • 这篇文章主要为大家详细介绍了完美解决ajax跨域请求下parsererror的错误,具有一定的参考价值,可以用来参考一下。 感兴趣的小伙伴,下面一起跟随512笔记的小编两巴掌来看看吧! ajax请求报parsererror错误是很宽泛的概念,很多情况下都报这个错, 在很多时候,即使ajax提交、返回都正常 XMLHttpRequest.status=200  (正常响应) XMLHttpReque

 相关资料
  • 我在Springboot应用程序日志中发现了这样的错误消息: 我知道,这可能是因为有人/某个应用程序使用HTTPS而不是HTTP调用我的endpoint。我可以通过在属性中包含以下内容来记录这些请求: 现在,我收到了未分析的文本,如下所示: 是否可以对其进行解码/解密,并找出实际的API调用是什么?

  • 本文根据 SOFAChannel#14 直播分享整理,主题:云原生网络代理 MOSN 扩展机制解析。 本文根据 SOFAChannel#14 直播分享整理,主题:云原生网络代理 MOSN 扩展机制解析。 大家好,我是今天的讲师永鹏,来自蚂蚁集团,目前主要负责 MOSN 的开发,也是 MOSN 的Committer。今天我为大家分享的是云原生网络代理 MOSN 的扩展机制,希望通过这次分享以后,能让

  • 本文介绍的是 MOSN 的扩展机制。 本文将才从以下几个方面介绍 MOSN 的扩展机制: MOSN 扩展能力和扩展机制的详细介绍; 结合示例对 MOSN 的 Filter 扩展机制与插件扩展机制进行详细介绍; MOSN 后续扩展能力规划与展望; 本问中的示例在 MOSN 的 Github 的 examples/codes/mosn-extensions 目录下,大家也可以下载下来运行一下。 MOS

  • 问题内容: 总而言之,我们正在使用AngularJS开发一个Web应用程序,并且我们有一个用例/需求(根本不会经常发生),在此我们需要从静态服务器中检索完整的HTML文档。但是,似乎$ http对象返回了原始HTML字符串作为其“数据”。我们试图避免使用外部库(例如jQuery),但是我们需要将该原始HTML字符串解析为可查询的DOM对象。我们可以使用iframe并完成它,但是出于众所周知的原因,

  • 本文向大家介绍Python Http请求json解析库用法解析,包括了Python Http请求json解析库用法解析的使用技巧和注意事项,需要的朋友参考一下 httpparser介绍 :1.解析字节类型的http与https请求数据 :2.支持已k-v形式修改请求数据 :3.支持重新编码请求数据 源码 如何使用 1.解析请求数据 request_first,request_headers,req

  • 问题内容: 我正在处理HTTP流量数据集,该数据集由完整的POST和GET请求组成,如下所示。我已经用Java编写了代码,该代码已经分离了每个请求,并将其另存为数组列表中的字符串元素。 现在我很困惑如何在Java中解析这些原始HTTP请求,有什么方法比手动解析更好吗? 问题答案: 我[正在]处理[HTTP]流量数据集,该数据集由完整的POST和GET请求组成 因此,您想解析包含多个HTTP请求的文

  • 问题内容: 我有一个原始HTTP字符串,我想代表一个对象中的字段。有什么方法可以解析HTTP字符串中的各个标头? 问题答案: 更新: 现在是2019年,所以在程序员尝试使用该代码的混乱评论之后,我为Python 3重写了此答案。原始的Python 2代码现在位于答案的底部。 标准库中有出色的工具,可以解析RFC 821标头,也可以解析整个HTTP请求。这是一个示例请求字符串(请注意,即使为了方便阅

  • 问题内容: 我在正常的HTTP服务器上使用Node的基本功能没有问题。我需要对SHOUTcast服务器使用(或类似方法)。SHOUTcast“协议”与HTTP完全兼容,除了一个细节外……第一个响应行。 普通HTTP服务器的响应为: SHOUTcast服务器响应: 同样,其余协议相同。唯一的区别是对。 我想扩展,子类化或以某种方式修改Node的功能,以便可以使其与SHOUTcast服务器一起使用。使