HtmlAgilityPack 属性获取

唐晗昱

2023-12-01

 
          //若需要抓取的节点有ID，类似“<div id='post_list'>value</div>”这种，那很简单只需调用GetElementbyId方法根据节点ID即可获 取所需节点。从而通过HtmlNode中的InnerText或Attribute属性来获取你想要的值。 
         
          //实例化HtmlAgilityPack.HtmlDocument对象 
         
          HtmlDocument doc =  
          new  
          HtmlDocument(); 
         
          //载入HTML 
         
          doc.LoadHtml(str); 
         
          //根据HTML节点NODE的ID获取节点 
         
          HtmlNode navNode = doc.GetElementbyId( 
          "post_list" 
          );

其他可能有用的技术点：
1、获取网页title：doc.DocumentNode.SelectSingleNode("//title").InnerText;
解释：XPath中“//title”表示所有title节点。SelectSingleNode用于获取满足条件的唯一的节点。

2、获取所有的超链接：doc.DocumentNode.Descendants("a")

3、获取name为kw的input，也就是相当于getElementsByName()：
var kwBox = doc.DocumentNode.SelectSingleNode("//input[@name='kw']");

//若需要抓取的节点有ID，类似“<div id='post_list'>value</div>”这种，那很简单只需调用GetElementbyId方法根据节点ID即可获 取所需节点。从而通过HtmlNode中的InnerText或Attribute属性来获取你想要的值。

HtmlAgilityPack 属性获取

相关阅读

相关文章

相关问答

相关文档