当前位置: 首页 > 知识库问答 >
问题:

提取html标记之间的字符串

吴兴国
2023-03-14

我正在尝试从 html 标签中提取字符串

<title>what i want</title>

我知道还有其他类似或甚至相同的问题得到了回答,但这些问题的答案似乎对我不起作用

String html = wc.DownloadString("URL");
Match m = Regex.Match(html, "<title>(.*)</title>", RegexOptions.Singleline); 
MessageBox(m.Value);

此输出

<title>what i want</title>

what i want

注意,我使用了来自不同答案的其他正则表达式,得到了相同的结果,我也不熟悉正则表达式,所以这可能是一个无意义的问题。

共有2个答案

邹坚壁
2023-03-14
var value = m.Groups[1].Value;
颜举
2023-03-14

尝试m.的组[1].值(组留档),或m.的结果("1美元")(结果留档);两者都应该工作。

Regex. Match返回的对象m是一个包含有关匹配内容的各种信息的对象。这包括匹配的整个字符串,在本例中包括标题标签本身,以及由每组括号匹配的字符串部分。m. Value给出整个字符串;m.的组[1]。值给出第一组匹配的部分,m.的组[2]。值给出第二组匹配的部分,等等。这必须在正则表达式之外完成,因为程序可能需要多个组;例如,如果您正在匹配一天中的某个时间,例如(\d):(\d),那么您可能希望将小时(m.组[1].值)分配给一个变量,并将分钟(m.组[2].值)分配给另一个变量。

 类似资料:
  • 我有一个长字符串列表,如下所示,我需要提取一个字符串子集并另存为新,列出每个长字符串中两个标记之间的字符。例如,我的两个字符串看起来像这样,使用“.power”作为标记,前面使用“.power”。 我需要提取每个长列表的子集,像这样在“。还有“.力量”- 我提取所有长字符串列表的代码(路径和文件名)如下所示:

  • 问题内容: 假设我有一个字符串,而我只想提取一部分。 我只知道我感兴趣的部分之前和之后的几个字符1234。 使用字符串可以执行以下操作: 结果,这会给我。 如何在Python中做同样的事情? 问题答案: 使用正则表达式- 文档以供进一步参考 要么:

  • 嗨,我有一个html文件解析的场景。我正在使用jsoup解析html文件,解析后我想提取头标记(h1、h3、h4)。我用过医生。select()但它将只返回标题标记值,但我的要求是我应该提取h1到h3或h4之间的标记,反之亦然。 所以这里首先搜索html字符串是否包含任何H1,H3,H4。这里我们有h4,所以包括h4,它应该搜索下一个h1或h3,直到h3我们提取字符串并把它放在一个单独的html文

  • 问题内容: 我有一个字符串: (它的输出超过两行,因此其中必须有一个\ n。 我希望提取标签之间的字符串。在这种情况下,它是7月28日,但是可能是另一个日期或其他某个数字。 1)从字体标签之间提取值的最佳方法是什么?我本以为可以提取和之间的所有内容。 编辑:第二个问题删除。 问题答案: 尽管可以使用正则表达式解析任意HTML,但这通常是一个死亡陷阱。有很多很棒的用于解析HTML的工具,包括Beau

  • 我正在寻找一个正则表达式,它必须在不同类型的HTML标记之间提取文本。 对于前任: <代码> <代码> <代码> 我找到了这个特殊的片段

  • 我试图获取提供的html(跨度)之间的数据(在本例中为31) 以下是原始代码(来自chrome中的inspect elements) 我有一个包含页面源代码的富文本框,下面是相同的代码,但是在富文本框的第51行: 我将如何做到这一点?我已经尝试了几种方法,但似乎都不适合我。 我试图从这一页检索点值:http://www.subxcess.com/sub4sub.php根据谁潜艇你的数量变化。