当前位置: 首页 > 软件库 > 开发工具 > PHP开发工具 >

CurlFuture

PHP Curl 并行轮转请求库
授权协议 MIT
开发语言 PHP
所属分类 开发工具、 PHP开发工具
软件类型 开源软件
地区 国产
投 递 者 柯锋
操作系统 跨平台
开源组织
适用人群 未知
 软件概览

CurlFuture : PHP Curl并行轮转请求库

multicurl系列方法是提高php请求后端http接口的一种途径。但是直接使用的话,存在几方面问题:

  • 部分版本的curl扩展有bug,需要用特定的方式来调用(Rolling cURL: PHP并发最佳实践)

  • 网上流传的CurlRolling库都只支持前面加入,最后一并执行这种使用模式。而最理想的是随时加入,需要的时候从里面取出所需的结果,且不需等待其他请求返回

  • 为了提升效率,大部分库选择使用回调函数的方式来执行,对已有程序改造成本较高

为了解决这些问题,开发了CurlFuture库,实现了并行请求,先到先取,链式执行的特性。

应用场景

对于一些大型公司,PHP作为接口聚合层来使用,而接口通过HTTP协议给出。对于一些复杂的页面,可能需要请求几十个相互独立的接口, 如果使用并行模式,则可以极大的提升性能。

安装方法

引入入口php文件即可:include __DIR__.'/curl_future.php';

使用方法

/**
 * 获得一个延迟执行curl的类
 * @param $url 请求url地址
 * @param $options = array(), 
 *      header:头信息(Array), 
 *      proxy_url:代理服务器地址, 
 *      timeout:超时时间,可以小于1
 *      post_data: string|array post数据
 * @return CurlFuture\HttpFuture
 */
function curl_future($url, $options = array());

echo curl_future("http://s.newhua.com/2015/1113/304528.shtml?4", array())
        ->fetch();

并行请求的实例(async.php)

include __DIR__.'/curl_future.php';

$f4 = curl_future("http://s.newhua.com/2015/1113/304528.shtml?4");
$f5 = curl_future("http://s.newhua.com/2015/1113/304528.shtml?5");

echo strlen($f1->fetch());  //这个地方会并行执行
echo "\n";
echo strlen($f2->fetch());
echo "\n";

链式执行的示例(then.php)

include __DIR__.'/curl_future.php';

echo curl_future("http://s.newhua.com/2015/1113/304528.shtml")
    ->then(function($data){
        return strlen($data);
    })
    ->then(function($len){
        return "Length: $len";
    })
    ->fetch();

和Model/Service结合的示例(model.php)

include __DIR__.'/curl_future.php';

class BookModel{
    //接口串行调用的示例,通过then函数将处理过程串联起来
    static public function getTitleFuture($id){
        return curl_future("http://111.202.7.252/{$id}")
            ->then(function($data){
                return strlen($data);
            })
            ->then(function($data){
                $url = "http://111.202.7.252/{$data}";
                $html = curl_future($url)->fetch();
                preg_match('/title(.+?)\/title/is', $html, $matches);
                return $matches[1];
            });
    }

    //普通接口调用+后续处理的示例
    static public function getContentFuture($id){
        return curl_future("http://111.202.7.252/{$id}")
                ->then(function($data){
                    return substr($data, 0, 100);
                });
    }
}

//多个请求并行发出示例,这个地方用Model封装起来,便于和不同框架相结合
$t1 = BookModel::getTitleFuture('111');
$t2 = BookModel::getTitleFuture('222');
$t3 = BookModel::getTitleFuture('333');

$c1 = BookModel::getContentFuture('111');
$c2 = BookModel::getContentFuture('222');
$c3 = BookModel::getContentFuture('333');

//fetch函数会阻塞住,这个地方会把所有队列里面的请求发出,直到需要获取的t1的请求执行完再返回
var_dump($t1->fetch());
//由于上个fetch已经阻塞过了,下面的这个fetch很可能无需阻塞直接返回,也有可能上面的fetch没有执行完,此处阻塞住继续执行请求,直到拿到t2的数据
var_dump($t2->fetch());
var_dump($c3->fetch());

原理

在每次fetch的时候,开始事件循环。当所需http返回后,结束循环。继续执行php逻辑。

    //task_manager.php
    public function fetch($ch){
        $chKey = (int)$ch;

        //如果两个队列里面都没有,那么退出
        if(!array_key_exists($chKey, $this->runningTasks) && !array_key_exists($chKey, $this->finishedTasks) )return false;

        $active = 1;
        do{
            //如果任务完成了,那么退出
            if(array_key_exists($chKey, $this->finishedTasks))break;

            //执行multiLoop,直到该任务完成
            $active = $this->multiLoop();
            //如果执行出错,那么停止循环
            if($active === false)break;
        }while(1);

        return $this->finishTask($ch);
    }

性能测试

请求本机接口200次,nginx默认页面,同步、异步与file_get_contents对比

/example/bench.php

curl_future sync:384 ms
file_get_contents:390 ms
curl_futhre async:68 ms

curl_future sync:624 ms
file_get_contents:460 ms
curl_futhre async:69 ms

curl_future sync:463 ms
file_get_contents:355 ms
curl_futhre async:70 ms

curl_future sync:447 ms
file_get_contents:409 ms
curl_futhre async:66 ms

同步方式没有file_get_contents稳定,但是异步批量方式性能提升很明显。

参考项目

 相关资料
  • 我想在Spring Boot中遇到下面的用例。 我有一个第三方REST API,如果有任何东西要返回,它会尽快返回响应,或者花10秒钟发送空白响应。 我需要连续调用这个API,这意味着如果API返回响应,将该响应发送到进程,然后再次调用该API,这意味着我需要长时间轮询该API,但没有时间间隔,一旦我得到响应,就再次轮询。 我要独立线程处理响应。 这不是web应用程序。我只想用纯java(spri

  • 我正在使用Java VertX框架,并尝试使用VertX WebClient和一个简单的HTTP请求加载多个JSON对象。我想并行地做这件事,这样可以加快进程。 我有一个endpoint对象: 在另一个类中,我有以下应该并行处理的函数(源代码): 我不知道如何继续下去。VertX WebClient强制我使用异步处理程序,这意味着我不能直接返回JsonObject。

  • 设置您的本地环境 步骤1: 复制 步骤2: 构建 步骤3: 分支 进行更改 步骤4: 编写代码 步骤5: 提交更改 提交代码说明的指导 步骤6:变基 步骤7: 测试 步骤8: 推送代码 步骤9: 新建一个合并代码请求 步骤10: 讨论和更新 批准和请求更改工作流程 步骤11: 执行合并 持续集成测试 设置您的本地环境 步骤1: 复制 在 GitHub 上复制项目到你的账号并把项目克隆到本地。 $

  • 问题内容: API通常具有用户必须遵循的速率限制。举个例子,让我们50个请求/秒。连续的请求采取0.5-1秒,因此是来接近极限速度太慢。但是,使用aiohttp的并行请求超出了速率限制。 轮询API尽可能快地允许,需要限速并行调用。 例如,我发现到目前为止装饰,大约像这样: 这非常适用于连续通话。试图并行调用来实现这个按预期不起作用。 下面是一些代码示例: 这里的问题是,它会率限制 排队 的任务。

  • 我正在用spring WebClient对API进行并行rest调用。响应如下所示 POJOS: 获取产品 这也是有效的,但是有没有一种方法可以直接返回,或者返回更好? (下一步是将产品保存在数据库中)

  • 我试图使用新的SpringBoot2 Reactive WebClient类(它没有批处理endpoint)对同一个rest服务进行并行(批处理)调用。例如,我需要100个“comment”对象(ids为1...100),我正在执行以下并行调用: 我是Spring WebFlux的新手,我不确定这是否是用WebClient进行并行调用的正确方法 > 有没有更好(更合适)的方法来做这件事(即做一个单

  • 问题内容: 我正在使用Node.js运行服务器,并且需要从正在运行的另一台服务器()请求数据。我需要向数据服务器发出许多请求(〜200)并收集数据(响应大小从〜20Kb到〜20Mb不等)。每个请求都是独立的,我想将响应保存为以下形式的一个巨大数组: 请注意,项目的顺序并不重要,理想情况下,它们应该以数据可用的顺序填充数组。 现在,当运行该程序时,它将显示: 现在,由于文件的大小如此可变,我期望它可

  • GitLab可以引用提交消息中的特定问题来解决特定的问题。 在本章中,我们将讨论如何在GitLab中引用问题: 步骤(1): 要引用问题,您需要创建问题的问题编号。 要创建问题,请参阅创建问题章节。 步骤(2): 要查看创建的问题,请单击Issues选项卡下的List选项: 步骤(3): 在对本地存储库进行更改之前,请使用以下命令检查它是否为最新版本: 命令从远程服务器下载最新的更改并直接集成到当