当前位置: 首页 > 面试题库 >

htaccess中带有_escaped_fragment_的可抓取AJAX

王建华
2023-03-14
问题内容

各位开发人员大家好!

我们几乎已经完成了ajax Web应用程序第一阶段的开发。在我们的应用程序中,我们使用哈希散列,例如:

http://ourdomain.com/#!list=last_ads&order=date

我了解google会获取此URL并以这种形式向服务器发出请求:

http://ourdomain.com/?_escaped_fragment_=list=last_ads?order=date&direction=desc

一切都很完美,除了…

我想将这种请求路由到另一个脚本

像这样:

RewriteCond %{QUERY_STRING} ^_escaped_fragment_=(.*)$
RewriteRule ^$ /webroot/crawler.php$1 [L]

问题是,当我尝试在crawler.php中使用print_r($ _ REQUEST)时,只会得到:

Array
(
    [_escaped_fragment_] => list=last_ads?order=date
    [direction] => desc
)

我想要得到的是

Array
(
    [list] => last_ads
    [order] => date
    [directions] => des
)

我知道我可以使用php进一步打破第一个论点,但我不想;)

请指教

================================================== ==编辑…在文本和逻辑上的一些更正


问题答案:

您忘记的QSA指令(每个人都错过了= D)

RewriteCond %{QUERY_STRING} ^_escaped_fragment_=(.*)$
RewriteRule ^$ /webroot/crawler.php%1 [QSA,L]

顺便说一句,你$1错了…没用,因为它什么也没说。所以这应该是:

RewriteCond %{QUERY_STRING} ^_escaped_fragment_=(.*)$
RewriteRule ^$ /webroot/crawler.php [QSA,L]

告诉我这是否有效。



 类似资料:
  • 问题内容: 我有一个URL 。当我添加此文件时 现在将允许我使用链接。但是我该怎么做呢? 另外,我怎样才能使这个网址?谢谢。对不起,我还比较陌生。 问题答案: 感谢您的想法@denoise和@mogosselin。也可以使用@stslavik指出我的代码示例的某些缺点。 这是我的方法: 通过使用我得到的链接 而 这是我的目标。我只会用PHP做其他事情。

  • 问题内容: 我一直在使用正则表达式在PHP中进行HTML抓取。这是可行的,但结果是挑剔和脆弱的。有没有人使用过提供更强大解决方案的软件包?配置驱动的解决方案将是理想的选择,但我并不挑剔。 问题答案: 从页面抓取HTML后,我将推荐PHP简单HTMLDOM解析器。它支持无效的HTML,并提供了一种非常简单的方法来处理HTML元素。

  • 问题内容: 我正在寻找一种方法,可以根据用户在PHP中提供的URL对另一个页面进行小的预览。 我只想检索页面标题,图像(如网站徽标)以及一些文字或说明(如果有)。有没有任何外部库/类的简单方法?谢谢 到目前为止,我已经尝试过使用DOCDocument类,加载HTML并将其显示在屏幕上,但是我认为这不是正确的方法 问题答案: 我建议您考虑为此使用simple_html_dom。这将使其非常容易。 这

  • 我将用废料从 squawka.com 中抓取一些数据。代码显示为模糊。首先,我转到结果页面。在这里,我搜索来自德国德甲联赛的详细比赛统计数据链接,并且它还抓取所有分页链接并发送请求。一切都很好,但只有在“Ligas循环中的Liga”中,我提出了一个无法正常工作的请求,因为后面有动态的东西。如果链接被加载,我可以抓取团队名称,比分,日期,竞技场名称,但我不能抓取例如主队的镜头(项目['ShotsA'

  • 问题内容: 所以,我的问题相对简单。我有一只蜘蛛在多个站点上爬行,我需要它按照我在代码中写入的顺序返回数据。它发布在下面。 结果以随机顺序返回,例如,返回29,然后28,然后30。我已经尝试将调度程序的顺序从DFO更改为BFO,以防万一这是问题所在,但这并没有改变。 问题答案: 定义在方法中使用的URL 。下载页面时,将为你的方法调用每个起始URL的响应。但是你无法控制加载时间-第一个起始URL可

  • 问题内容: 我已经通过Scrapy文档今天一直在进行,并试图获得一个工作版本- https://docs.scrapy.org/en/latest/intro/tutorial.html#our-first- spider -在现实世界的例子。我的示例稍有不同,它有2个下一页,即 start_url>城市页面>单位页面 这是我要从中获取数据的单位页面。 我的代码: 但是当我运行它时,我得到: 因此