最近有在用PhpQuery,发现抓取一些网页的内容是移动端的页面,有些时候甚至是空内容。于是一直在找PhpQuery怎么设置UserAgent,无奈PhpQuery文档太少,暂时没有找到,便去寻找PHP原生设置UserAgent的方法,找到了两种。
用curl设置user_agent:
- $curl = curl_init();
- curl_setopt($curl, CURLOPT_URL, 'http://www.baidu.com/');
- curl_setopt($curl, CURLOPT_USERAGENT, 'Chrome 42.0.2311.135');//这里设置UserAgent为[Chrome 42.0.2311.135]
- $data = curl_exec($curl);//这里得到的是抓取的内容
- curl_close($curl);
2. 用file_get_contents设置user_agent:
- ini_set('user_agent', 'Chrome 42.0.2311.135');
如果是用PhpQuery去抓取网页的话用第二种方法去设置UserAgent,方法一是无效的。但是如果你直接用curl去抓取网页的话当然是用方法一的“curl_setopt($curl, CURLOPT_USERAGENT,'Input user agent')”直接设置就好了。