当前位置: 首页 > 知识库问答 >
问题:

用Regex按类获取< element >内部内容

闽高峯
2023-03-14

我正在尝试获取每个<代码>的文本

示例:

我尝试使用正则表达式在多个超文本标记语言之间获取文本,但我必须通过myclass过滤。

我是一个新手,我能够使用(=(

所以我的问题是,我怎么能只得到每个之间的文本


共有1个答案

鄂琛
2023-03-14

或。。。您可以使用此 http://html-agility-pack.net/

这个是支持xpath语法的,所以你可以这样使用:

HtmlAgilityPack.HtmlDocumnet doc = new HtmlAgilityPath.HtmlDocumnet();
doc.LoadHtml(your html string);

HtmlAgilityPack.HtmlNodeCollection col = doc.DocumentNode.SelectNodes("//img");
foreach(var node in col) {
    Console.WriteLine(node.OuterHtml);
}

我希望这能对你有所帮助。

 类似资料:
  • 我有一个字符串来保存整个html文档。我想获取具有特定ID的div中的所有内容。例如: 我需要id =“myId”标签和它的结束标签之间的内容。有什么方法可以实现这一点吗?输出应该是第二行。

  • 问题内容: 我有以下代码。我想掌握用来创建内部类对象的外部类对象。我该怎么做? 编辑:好,你们中的一些人建议通过添加方法来修改内部类: 但是,如果我没有控制权来修改内部类,那(只是确认一下),我们还有其他方法可以从内部类对象中获取相应的外部类对象吗? 问题答案: 在内部类本身中,你可以使用。该表达式允许引用任何词法包围的实例,在JLS中被描述为。 我认为没有办法从内部类的代码之外获取实例。当然,你

  • 我接到了一个制作covid追踪器的项目。我决定在该站点(https://www.worldometers.info/coronavirus/)中添加一些元素。我对python很陌生,所以决定用BeautifulSoup。我能够刮出基本元素,比如总案例,活动案例等等。然而,每当我试图获取国家名称或数字时,它返回一个空列表。即使存在一个类'sorting_1',它仍然返回一个空列表。有人能指引我哪里错

  • 问题内容: 考虑以下Python(在2.x或3.x中运行): 我想把手放在里面。但: 我不想成为的显式参数。 我想和成为一个类的对象,不是很奇怪像关闭。 您能建议我如何实现这一目标吗? 现在,我最好的主意是使用线程本地存储。在我的用例中,每当我构造一个时,我已经在某个地方的方法中,并且添加没什么大不了的 对我的代码。 这使您对我愿意考虑的堕落程度有所了解。 问题答案: 在Python 2.6中,也

  • 我列出了一个有很多行的表,我想根据{transaction.to_address}值在每一行中使用一个新函数 我想在一个抓取函数中使用useeffect()函数,但是我得到了这个错误消息:渲染了比之前更多的钩子。我已经尝试了我在这里找到的许多解决方案,我已经花了几乎一整天,但我还不够聪明来修复它。 这类似于我的问题,但不适用于我 未捕获的固定冲突:渲染的钩子比上一次渲染期间更多

  • 我有一个内部类,它在我的主类中扩展了异步任务 我在内部类中获得了分配给我的字符串变量“变量”的正确值,但我无法访问我的主类中的值。