当前位置: 首页 > 面试题库 >

您如何将HTML转换为纯文本?

高展
2023-03-14
问题内容

我在表格中存储了HTML片段。 不是整个页面,没有标签等,只是基本格式。

我希望能够在给定页面上将Html仅显示为文本,而 无需设置格式 (实际上只是前30-50个字符,但这很容易)。

如何将Html中的“文本”作为纯文本放入字符串中?

所以这段代码。

<b>Hello World.</b><br/><p><i>Is there anyone out there?</i><p>

成为:

你好,世界。有没有人在那里?


问题答案:

如果您在谈论标签剥离,那么无需担心<script>标签之类的事情就相对简单了。如果您需要做的就是显示不带标签的文本,则可以使用正则表达式完成此操作:

<[^>]*>

如果您确实需要担心<script>标记之类的问题,那么您将需要比正则表达式更强大的功能,因为您需要跟踪状态,更像是上下文无关语法(CFG)。虽然您可能可以通过“从左到右”或非贪婪匹配来实现。

如果您需要CFG的更复杂的行为,我建议您使用第三方工具,但不幸的是,我不知道要推荐哪种工具。



 类似资料:
  • 问题内容: 我正在开发一个简单的RSS Reader应用程序,作为Xcode中的初学者项目。目前,我已设置它解析提要,并放置标题,发布日期,描述和内容,并将其显示在WebView中。 我最近决定在用于选择帖子的TableView中显示说明(或内容的删节版本)。但是,这样做时: 它显示了帖子的原始HTML。 我想知道如何仅将TableView的详细UILabel转换为纯文本的HTML。 谢谢! 问题

  • 问题内容: 我有Java程序,它将从服务器接收纯文本。纯文本可能包含URL。Java库中是否有任何Class可以将纯文本转换为HTML文本?还是其他图书馆?如果没有,那该怎么办呢? 问题答案: 我找到了使用模式匹配的解决方案。这是我的代码- 这是输入和输出- 输入文字是可变的: 输出:

  • 问题内容: 我有以下代码: 结果是: 但我想打破界限: 我已经看过jsoup的TextNode#getWholeText(),但是我不知道如何使用它。 如果我解析的标记中有一个,如何在结果输出中换行? 问题答案: 保留换行符的真正解决方案应该是这样的: 满足以下要求: 如果原始html包含换行符(\ n),则保留它 如果原始html包含br或p标签,它们将被翻译为换行符(\ n)。

  • 问题内容: 我有以下内容: 我正在寻找一个Javascript函数来转换文本,以便每个特殊字母都由其HTML实体序列表示,如下所示: 该函数不仅应转义该示例的字母,而且还应转义所有这些字母。 您将如何实现?是否有任何现有功能?(很简单,因为首选没有框架的解决方案)顺便说一句:是的,我已经看到了这个问题,但是并不能满足我的需求。 问题答案: 借助bucabay的帮助和创建我自己的功能的建议,我创建了

  • 问题内容: 我有一个简单的评论系统,人们可以在纯文本字段内提交超链接。当我将这些记录从数据库显示回到网页中时,可以使用PHP中的哪些RegExp将这些链接转换为HTML型锚链接? 我不希望算法通过任何其他类型的链接(仅http和https)来执行此操作。 问题答案: 这是另一种解决方案,它将捕获所有http / https / www并转换为可单击的链接。 或者,仅捕获http / https,然

  • 问题内容: 我维护着一个公告板,用于将富文本消息保存为HTML。现在,我需要将所有这些消息迁移到需要HTML的BBCode表示的Joomla Kunena公告板上。 是否有任何库可以将HTML干净地转换为BBCode。有大量的脚本,可以将BBCode转换为HTML,但是没有相反的方法。 谢谢… 问题答案: 它应该可以在 文本输出模式下 与XSLT一起 使用 : 要到达那里,解析HTML并使用内置的