当前位置: 首页 > 编程笔记 >

ASP.NET抓取网页内容的实现方法

从智志
2023-03-14
本文向大家介绍ASP.NET抓取网页内容的实现方法,包括了ASP.NET抓取网页内容的实现方法的使用技巧和注意事项,需要的朋友参考一下

本文实例讲述了ASP.NET抓取网页内容的实现方法。分享给大家供大家参考。具体实现方法如下:

一、ASP.NET 使用HttpWebRequest抓取网页内容

/// <summary>方法一:比较推荐  

/// 用HttpWebRequest取得网页源码  

/// 对于带BOM的网页很有效,不管是什么编码都能正确识别  

/// </summary>  

/// <param name="url">网页地址" </param>  

/// <returns>返回网页源文件</returns>  

public static string GetHtmlSource2(string url)  

{  

    //处理内容  

    string html = "";  

    HttpWebRequest request = (HttpWebRequest)WebRequest.Create(url);  

    request.Accept = "*/*"; //接受任意文件  

    request.UserAgent = "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; .NET CLR 1.1.4322)"; //   

    request.AllowAutoRedirect = true;//是否允许302  

    //request.CookieContainer = new CookieContainer();//cookie容器,  

    request.Referer = url; //当前页面的引用  

    HttpWebResponse response = (HttpWebResponse)request.GetResponse();  

    Stream stream = response.GetResponseStream();  

    StreamReader reader = new StreamReader(stream, Encoding.Default);  

    html = reader.ReadToEnd();  

    stream.Close();  

    return html;  

}

二、ASP.NET 使用 WebResponse 抓取网页内容

public static string GetHttpData2(string Url)  

{  

    string sException = null;  

    string sRslt = null;  

    WebResponse oWebRps = null;  

    WebRequest oWebRqst = WebRequest.Create(Url);  

    oWebRqst.Timeout = 50000;  

    try  

    {  

        oWebRps = oWebRqst.GetResponse();  

    }  

    catch (WebException e)  

    {  

        sException = e.Message.ToString();  

    }  

    catch (Exception e)  

    {  

        sException = e.ToString();  

    }  

    finally  

    {  

        if (oWebRps != null)  

        {  

            StreamReader oStreamRd = new StreamReader(oWebRps.GetResponseStream(), Encoding.GetEncoding("utf-8"));  

            sRslt = oStreamRd.ReadToEnd();  

            oStreamRd.Close();  

            oWebRps.Close();  

        }  

    }  

    return sRslt;  

}

希望本文所述对大家的C#程序设计有所帮助。

 类似资料:
  • 本文向大家介绍Python实现周期性抓取网页内容的方法,包括了Python实现周期性抓取网页内容的方法的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了Python实现周期性抓取网页内容的方法。分享给大家供大家参考,具体如下: 1.使用sched模块可以周期性地执行指定函数 2.在周期性执行指定函数中抓取指定网页,并解析出想要的网页内容,代码中是六维论坛的在线人数 论坛在线人数统计代码: 希

  • 本文向大家介绍python基于BeautifulSoup实现抓取网页指定内容的方法,包括了python基于BeautifulSoup实现抓取网页指定内容的方法的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了python基于BeautifulSoup实现抓取网页指定内容的方法。分享给大家供大家参考。具体实现方法如下: 希望本文所述对大家的Python程序设计有所帮助。

  • 本文向大家介绍java简单网页抓取的实现方法,包括了java简单网页抓取的实现方法的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了java简单网页抓取的实现方法。分享给大家供大家参考。具体分析如下: 背景介绍 一 tcp简介   1 tcp 实现网络中点对点的传输   2 传输是通过ports和sockets   ports提供了不同类型的传输(例如 http的port是80)     1

  • 本文向大家介绍PHP实现抓取HTTPS内容,包括了PHP实现抓取HTTPS内容的使用技巧和注意事项,需要的朋友参考一下 最近在研究Hacker News API时遇到一个HTTPS问题。因为所有的Hacker News API都是通过加密的HTTPS协议访问的,跟普通的HTTP协议不同,当使用PHP里的函数 file_get_contents() 来获取API里提供的数据时,出现错误,使用的代码是

  • 本文向大家介绍python3实现抓取网页资源的 N 种方法,包括了python3实现抓取网页资源的 N 种方法的使用技巧和注意事项,需要的朋友参考一下 这两天学习了python3实现抓取网页资源的方法,发现了很多种方法,所以,今天添加一点小笔记。 1、最简单 2、使用 Request 3、发送数据 4、发送数据和header 5、http 错误 6、异常处理1 7、异常处理2 8、HTTP 认证

  • 本文向大家介绍python+selenium+PhantomJS抓取网页动态加载内容,包括了python+selenium+PhantomJS抓取网页动态加载内容的使用技巧和注意事项,需要的朋友参考一下 环境搭建 准备工具:pyton3.5,selenium,phantomjs 我的电脑里面已经装好了python3.5 安装Selenium pip3 install selenium 安装Phan