当前位置: 首页 > 知识库问答 >
问题:

使用regex[关闭]从c#中的html内容中删除html标签

邢焱
2023-03-14

想改进这个问题吗?通过编辑这篇文章添加细节并澄清问题。

我有一个大的html内容。因此,我必须从HTML内容中删除以下文本。

<span id="sso-container"><span class="username">{Inner text could be anything}</span></span>

在上面提到的代码段中,“{内部文本可以是任何内容}”表示可以是任何文本。

在整个HTML中,无论

<span id="sso-container"><span class="username">{Inner text could be anything}</span></span>

存在,它将被一些固定的文本替换。

谁能建议这个需求的正则表达式是什么?


共有2个答案

陆晓博
2023-03-14
var pattern = @"<span id=""sso-container""><span class=""username"">.*?</span></span>";
        var regex = new Regex(pattern);
        bool test = regex.IsMatch(@"<span id=""sso-container""><span class=""username"">dynamic</span></span>");

它的工作…

殷功
2023-03-14

我真的建议您在RegEx上使用HTML敏捷包。

在您决定采用基于正则表达式的解决方案之前,请阅读此警告。您可以在此 SO 问题中找到基于正则表达式的答案。

HtmlDocument doc = new HtmlDocument;
doc.Load(htmlstring);
HtmlNode node = doc.DocumentNode.SelectSingleNode("//span"); 
//Here, you can also do something like (".//span[@id='sso-container' class='username')    
string value = node.InnerText; 
//this string will contain the value of span, i.e. <span>***value***</span>
 类似资料:
  • 问题内容: 我正在尝试从Javascript的字符串中删除所有html标记。这是我所拥有的…我不知道为什么它不起作用....有人知道我在做什么错吗? 非常感谢! 问题答案: 尝试此操作,注意HTML语法太复杂,以至于正则表达式在100%的时间内都是正确的: 如果您愿意使用jQuery之类的库,则可以执行以下操作:

  • 问题内容: 我正在使用HTML Purifier(http://htmlpurifier.org/) 我只想删除标签。我不想删除内联格式或任何其他内容。 我该如何实现? 还有一件事,它还有其他方法可以从HTML删除脚本标签 问题答案: 因为这个问题是用正则表达式标记的,所以在这种情况下,我将用穷人的解决方案来回答: 但是,正则表达式不是用于解析HTML / XML的,即使您编写了一个 完美的 表达

  • 问题内容: 如何在C#中使用正则表达式删除所有HTML标记,包括&nbsp。我的弦看起来像 问题答案: 如果您不能使用面向HTML解析器的解决方案来过滤标签,则这里有一个简单的正则表达式。 理想情况下,您应该再次通过正则表达式过滤器,该过滤器将多个空格

  • 问题内容: 我需要使用sed命令使用bash脚本从html中删除所有标签。我尝试了这个 和这 但我仍然想念什么,有什么建议吗? 问题答案: 您可以使用许多HTML到文本转换器之一,可以使用Perl regex,或者必须使用 如果没有错误的余地,请改用HTML解析器。例如,当元素分布在两行上时 此正则表达式将不起作用。 这正则表达式由三个部分组成,, 寻找开放 后面跟着零个或多个字符(不是结尾) 是

  • 问题内容: 是否有从Java字符串中删除HTML的好方法?一个简单的正则表达式 会起作用,但是不会正确转换,并且两个尖括号之间的非HTML也会被删除(即,正则表达式中的将会消失)。 问题答案: 使用HTML解析器代替正则表达式。对于Jsoup来说,这简直太简单了。 Jsoup还支持对可定制的白名单,如果你希望只允许例如这是非常有用的去除HTML标签,和。

  • 问题内容: 是否有从Java字符串中删除HTML的好方法?一个简单的正则表达式 会起作用,但是;不会正确转换,并且两个尖括号之间的非HTML也会被删除(即.,正则表达式中的将会消失)。 问题答案: 如果你是为Android编写的,则可以这样做…