当前位置: 首页 > 面试题库 >

如何在Java中取消对HTML字符实体的转义?

鲍国兴
2023-03-14
问题内容

基本上,我想解码给定的HTML文档,并替换所有特殊字符,例如" "-> " ",">"-> ">"

在.NET中,我们可以使用HttpUtility.HtmlDecode

Java中的等效功能是什么?


问题答案:

我已为此使用Apache Commons StringEscapeUtils.unescapeHtml4()

将包含实体转义符的字符串取消转义为包含与转义符相对应的实际Unicode字符的字符串。支持HTML 4.0实体。



 类似资料:
  • 问题内容: 我到处都是,只找到了适用于python 2.6和更早版本的解决方案,没什么关于如何在python 3.X中做到这一点的。(我只能访问Win7框。) 我必须能够在3.1中做到这一点,并且最好不要使用外部库。目前,我已经安装了httplib2并可以访问命令提示符curl(这就是我获取页面源代码的方式)。不幸的是,据我所知,curl无法解码html实体,我在文档中找不到用于对其进行解码的命令

  • 我有一个统一码转义字符串: 我想将此字符串转换为unicode未转义的版本 我该怎么做?

  • 问题内容: 有没有一种方法可以将字符串转换为可以在Web文档中正确显示的字符串?例如,更改字符串 至 问题答案: 具有专门为此设计的功能: http://commons.apache.org/proper/commons- lang/javadocs/api-3.1/org/apache/commons/lang3/StringEscapeUtils.html

  • 问题内容: 我有一些XML文本希望在HTML页面中呈现。这段文字包含一个&符号,我想以其实体表示形式呈现。 如何在源XML中转义此“&”号?我试过了,但这被解码为实际的&字符(),在HTML中是无效的。 因此,我想以一种在使用XML输出的网页中进行呈现的方式对其进行转义。 问题答案: 当您的XML包含时,这将导致文本。 当您在HTML中使用该代码时,该代码将显示为。

  • 主要内容:HTML 实体,不间断空格(Non-breaking Space),结合音标符,HTML字符实体HTML 中的预留字符必须被替换为字符实体。 一些在键盘上找不到的字符也可以使用字符实体来替换。 HTML 实体 在 HTML 中,某些字符是预留的。 在 HTML 中不能使用小于号(<)和大于号(>),这是因为浏览器会误认为它们是标签。 如果希望正确地显示预留字符,我们必须在 HTML 源代码中使用字符实体(character entities)。 字符实体类似这样: & entity_n

  • HTML 中的预留字符必须被替换为字符实体。 一些在键盘上找不到的字符也可以使用字符实体来替换。 HTML 实体 在 HTML 中,某些字符是预留的。 在 HTML 中不能使用小于号(<)和大于号(>),这是因为浏览器会误认为它们是标签。 如果希望正确地显示预留字符,我们必须在 HTML 源代码中使用字符实体(character entities)。 字符实体类似这样:&entity_name;