提取html标记之间的字符串

吴兴国

2023-03-14

我正在尝试从 html 标签中提取字符串

<title>what i want</title>

我知道还有其他类似或甚至相同的问题得到了回答，但这些问题的答案似乎对我不起作用

String html = wc.DownloadString("URL");
Match m = Regex.Match(html, "<title>(.*)</title>", RegexOptions.Singleline); 
MessageBox(m.Value);

此输出

<title>what i want</title>

不

what i want

注意，我使用了来自不同答案的其他正则表达式，得到了相同的结果，我也不熟悉正则表达式，所以这可能是一个无意义的问题。

共有2个答案

邹坚壁

2023-03-14

var value = m.Groups[1].Value;

颜举

2023-03-14

尝试m.的组[1].值（组留档），或m.的结果（"1美元"）（结果留档）；两者都应该工作。

Regex. Match返回的对象m是一个包含有关匹配内容的各种信息的对象。这包括匹配的整个字符串，在本例中包括标题标签本身，以及由每组括号匹配的字符串部分。m. Value给出整个字符串；m.的组[1]。值给出第一组匹配的部分，m.的组[2]。值给出第二组匹配的部分，等等。这必须在正则表达式之外完成，因为程序可能需要多个组；例如，如果您正在匹配一天中的某个时间，例如（\d）：（\d），那么您可能希望将小时（m.组[1].值）分配给一个变量，并将分钟（m.组[2].值）分配给另一个变量。

类似资料：

从标记之间的长字符串中提取子集字符串

我有一个长字符串列表，如下所示，我需要提取一个字符串子集并另存为新，列出每个长字符串中两个标记之间的字符。例如，我的两个字符串看起来像这样，使用“.power”作为标记，前面使用“.power”。我需要提取每个长列表的子集，像这样在“。还有“.力量”- 我提取所有长字符串列表的代码（路径和文件名）如下所示：
Python -如何提取两个标记之间的子字符串？

问题内容：假设我有一个字符串，而我只想提取一部分。我只知道我感兴趣的部分之前和之后的几个字符1234。使用字符串可以执行以下操作：结果，这会给我。如何在Python中做同样的事情？问题答案：使用正则表达式- 文档以供进一步参考要么：
使用jsoup或regex在标题标记之间提取html标记

嗨，我有一个html文件解析的场景。我正在使用jsoup解析html文件，解析后我想提取头标记（h1、h3、h4）。我用过医生。select（）但它将只返回标题标记值，但我的要求是我应该提取h1到h3或h4之间的标记，反之亦然。所以这里首先搜索html字符串是否包含任何H1，H3，H4。这里我们有h4，所以包括h4，它应该搜索下一个h1或h3，直到h3我们提取字符串并把它放在一个单独的html文
Python字符串操作，在html标签之间提取文本

问题内容：我有一个字符串：（它的输出超过两行，因此其中必须有一个\ n。我希望提取标签之间的字符串。在这种情况下，它是7月28日，但是可能是另一个日期或其他某个数字。 1）从字体标签之间提取值的最佳方法是什么？我本以为可以提取和之间的所有内容。编辑：第二个问题删除。问题答案：尽管可以使用正则表达式解析任意HTML，但这通常是一个死亡陷阱。有很多很棒的用于解析HTML的工具，包括Beau
正则表达式提取HTML标记之间的文本

我正在寻找一个正则表达式，它必须在不同类型的HTML标记之间提取文本。对于前任： <代码> <代码> <代码> 我找到了这个特殊的片段
获取两个html标记之间的文本

我试图获取提供的html（跨度）之间的数据（在本例中为31）以下是原始代码(来自chrome中的inspect elements) 我有一个包含页面源代码的富文本框，下面是相同的代码，但是在富文本框的第51行: 我将如何做到这一点？我已经尝试了几种方法，但似乎都不适合我。我试图从这一页检索点值：http://www.subxcess.com/sub4sub.php根据谁潜艇你的数量变化。

提取html标记之间的字符串

共有2个答案

相关问答

相关文章

相关阅读

相关工具

相关文档